Anda di halaman 1dari 6

ASSOCIATION RULE LEARNING

adalah metode pembelajaran mesin berbasis aturan untuk menemukan hubungan menarik

antara variabel dalam database besar. Hal ini dimaksudkan untuk mengidentifikasi aturan

kuat yang ditemukan dalam database menggunakan beberapa ukuran ketertarikan.Dalam

setiap transaksi tertentu dengan berbagai item, aturan asosiasi dimaksudkan untuk

menemukan aturan yang menentukan bagaimana atau mengapa item tertentu terhubung.

aturan asosiasi analisis keranjang pasar yang digunakan saat ini di banyak area aplikasi

termasuk penambangan penggunaan Web, deteksi intrusi, produksi berkelanjutan, dan

bioinformatika.Pembelajaran aturan asosiasi adalah sistem yang bagus untuk memprediksi

perilaku dalam interkoneksi data. Ini menjadikannya teknik yang patut diperhatikan untuk

klasifikasi, atau menemukan pola dalam data, saat menerapkan metode pembelajaran

mesin.

Manfaat association rule:


Association rule berguna untuk menemukan hubungan penting antar item dalam setiap
transaksi, hubungan tersebut dapat menandakan kuat tidaknya suatu aturan dalam asosiasi,
Tujuan association rule adalah untuk menemukan keteraturan dalam data. Association rule
dapat digunakan untuk mengidentifikasi item-item produk yang mungkin dibeli secara
bersamaan dengan produk lain, atau dilihat secara bersamaan saat mencari informasi
mengenai produk tertentu. Dalam pencarian association rule, diperlukan suatu variabel
ukuran kepercayaan 9 (interestingness measure) yang dapat ditentukan oleh user, untuk
mengatur batasan sejauh mana dan sebanyak apa hasil output yang diinginkan oleh user.

Ukuran Kepercayaan Rule (Interestingness Measure) Menurut [4] terdapat dua ukuran
kepercayaan yang menunjukkan kepastian dan tingkat kegunaan suatu rule yang ditemukan
yaitu:

1. Support Support (dukungan) merupakan suatu ukuran yang menunjukkan seberapa besar
dominasi suatu item atau itemset dari keseluruhan transaksi.

2. Confidence Confidence (tingkat kepercayaan) adalah suatu ukuran yang menunjukkan


hubungan antar item secara conditional (misalnya seberapa sering item B dibeli jika orang
membeli item A). Untuk menemukan aturan asosiasi seperti yang diharapkan maka harus
menemukan nilai dari support yang telah ditentukan. Support tersebut merupakan jumlah
item pada setiap transaksi yang ada didalam database. Untuk dapat menemukan nilai
support kita dapat mencari semua aturan yang jumlah support ≥ minimum support. Dalam
hal ini dapat digunakan sebagai cara untuk menemukan sebuah nilai confidence. Nilai
confidence ditentukan dari nilai support suatu aturan dalam sebuah transaksi. Jika itemset
pada setiap transaksi tidak sering muncul (infrequent), maka kandidat yang tidak sesuai
dengan nilai support ≥ minimum support tersebut harus segera dipangkas tanpa harus
menghitung confidencenya. Strategi umum digunakan oleh banyak algoritma penggalian
aturan asosiasi adalah memecahkan masalah ke dalam dua pekerjaan utama, yaitu: 1.
Frequent Itemset Generation Tujuannya adalah mencari semua itemset yang memenuhi
ambang batas minimum support. Itemset itu disebut itemset frequent (Itemset yang sering
muncul) 10 2. Rules Generation Tujuannya adalah mengekstrak aturan dengan confidence
tinggi dari itemset frequent yang ditemukan dalam langkah sebelumnya. Aturan ini
kemudian disebut aturan yang kuat (Strong rules)
CONFUSION MATRIX

Confusion matrix adalah sebuah tabel yang sering digunakan untuk mengukur kinerja dari
model klasifikasi di machine learning. Tabel ini menggambarkan lebih detail tentang jumlah
data yang diklasifikasikan dengan benar maupun salah.

Confusion matrix adalah salah satu tools analitik prediktif yang menampilkan dan
membandingkan nilai aktual atau nilai sebenarnya dengan nilai hasil prediksi model yang
dapat digunakan untuk menghasilkan metrik evaluasi
seperti Accuracy (akurasi), Precision, Recall, dan F1-Score atau F-Measure.

Ada empat nilai yang dihasilkan di dalam tabel confusion matrix, di antaranya True Positive
(TP), False Positive (FP), False Negative (FN), dan True Negative (TN). Ilustrasi
tabel confusion matrix dapat dilihat pada gambar berikut.

True Positive (TP) : Jumlah data yang bernilai Positif dan diprediksi benar sebagai
Positif.

False Positive (FP) : Jumlah data yang bernilai Negatif tetapi diprediksi sebagai Positif.

False Negative (FN) : Jumlah data yang bernilai Positif tetapi diprediksi sebagai Negatif

True Negative (TN) : Jumlah data yang bernilai Negatif dan diprediksi benar sebagai Negatif
Interpretasi Confusion Matrix
Misalnya pada saat menonton sepak bola tim favorit Anda, Anda telah memprediksi tim
sepak bola favorit Anda menang, dan memang ternyata menang. Itu adalah True Positive
(TP).

Jika Anda telah memprediksi tim sepak bola favorit Anda menang, namun kenyataannya
kalah, itu adalah False Positive (FP).

Jika Anda telah memprediksi tim sepak bola favorit Anda kalah, namun ternyata menang, itu
adalah False Negative (FN).

Jika Anda telah memprediksi tim sepak bola favorit Anda kalah, dan memang ternyata kalah,
itu adalah True Negative (TN).

Masih bingung bagaimana penerapannya di dalam dataset? Mari kita ambil contoh lain.

Misalnya, kita memiliki dataset penyakit kanker dari pasien di sebuah rumah sakit lalu kita
akan membuat model machine learning dari data tersebut menggunakan
sebuah classifier dimana target labelnya adalah Ya untuk yang terkena kanker,
dan Tidak untuk yang tidak terkena kanker.

Jika ada data yang berlabel Ya pada dataset dan juga berlabel Ya di hasil prediksi
model machine learning, itu adalah True Positive (TP).

Jika ada data yang berlabel Tidak pada dataset, tetapi berlabel Ya di hasil prediksi, itu
adalah False Positive (FP).

Jika ada data yang berlabel Ya pada dataset, tetapi berlabel Tidak di hasil prediksi, itu
adalah False Negative (FN).
Jika ada data yang berlabel Tidak pada dataset dan juga berlabel Tidak di hasil prediksi, itu
adalah True Negative (TN).

Cara menggunakan Confusion Matrix


Seperti telah disinggung di atas, confusion matrix digunakan untuk menghitung nilai
akurasi, presicion, recall, dan F1-score. Keempat metode evaluasi tersebut sangat
bermanfaat untuk mengukur performa dari classifier atau algoritma machine learning yang
kita gunakan untuk melakukan prediksi.

Sekarang mari kita bahas satu per satu cara menghitung metode evaluasi tersebut dengan
menggunakan confusion matrix.

Accuracy
Nilai akurasi didapatkan dari jumlah data bernilai positif yang diprediksi positif dan data
bernilai negatif yang diprediksi negatif dibagi dengan jumlah seluruh data di dalam dataset.

Precision
Precision adalah peluang kasus yang diprediksi positif yang pada kenyataannya termasuk
kasus kategori positif.

Recall
Recall adalah peluang kasus dengan kategori positif yang dengan tepat diprediksi positif.
F1-Score atau F-Measure
Nilai F1-Score atau dikenal juga dengan nama F-Measure didapatkan dari
hasil Precision dan Recall antara kategori hasil prediksi dengan kategori sebenarnya.

Anda mungkin juga menyukai