Anda di halaman 1dari 6

Tugas Mata Kuliah Advanced Database

Dosen: Prof. Dr. Sarjon Defit

Ringkasan Paper
A. Implementasi Algoritma Apriori
o Data Mining for Student's Trends Analysis Using Apriori Algorithm, Atta-ur-
Rahman1 and Sujata Dash2, 2017, ISSN: 0974-5572
o Association Rules Extraction for Customer Segmentation in the SMEs Sector Using
the Apriori Algorithm, Jesus Silvaa1, Noel Varelab2, Luz Adriana Borrero Lópezc 3,
Rafael Humberto Rojas Millánd4, 2019, DOI: 10.1016/j.procs.2019.04.173
o Implementasi Kesesuaian Obat Pada Penyakit Menggunakan Algoritma Apriori,
Yennimar1 , Evan Chandra Sibarani2, Irwansyah3, Muhammad Iqbal Tri Rahmadi4,
Reza Syahputra5, 2019, e-ISSN 2580-9741

B. Implementasi Algoritma Rough Set


o Implementasi Algoritma Rough Set Dalam Memprediksi Kecerdasan Anak, Aswanda
Putra1, Zekson A Matondang2, Noferianto Sitompul3, 2018, ISSN 2301-9425
o Penentuan Tingkat Kerusakan Peralatan Labor Komputer Menggunakan Data
Mining Rough Set, Riyan Ikhbal Salam1, Sarjon Defit2, 2019, e-ISSN: 2686-3154
o Identifikasi Siswa Bermasalah Dengan Menggunakan Metode Rough Set (Studi di
SMAN 4 Pariaman), Masrizal1, Musthafa Haris Munandar2, 2019, e-ISSN 2615-1855

C. Implementasi Data Mining


o Educational Data Mining Applications and Tasks (A Survey Of The Last 10 Years),
Behdad Bakhshinategh1, Osmar R. Zaiane2, Samira ElAtia3, Donald Ipperciel4, 2017,
DOI 10.1007/s10639-017-9616-z
o A Study On E-Learning System To Analyze Student Performance Using Data Mining ,
Mrs. S. Menaka1, Dr. G. Kesavaraj2, 2019, ISSN-2349-5162
o Applications, Models And Uses Of Data Mining In E-Governance For Sustainable
Development, Deepak Kalra, ISBN 13 978-0-9797659-4-0

Dibuat oleh: Ardia Ovidius (191321045)


M.Kom, 34C, 2019
Universitas Putra Indonesia YPTK
Data Mining for Student's Trends Analysis Using Apriori Algorithm
Atta-ur-Rahman1 and Sujata Dash2
2017, ISSN: 0974-5572

Ringkasan

Identifikasi Masalah
Untuk menghasilkan profesional TI yang kompeten, universitas harus menyediakan
pendidikan yang lebih baik dan cocok untuk siswa mereka. Salah satu alternatif untuk
menyediakan program pendidikan yang sesuai bagi siswa adalah dengan menemukan pola
untuk memprediksi pendaftaran siswa dalam program tertentu, kinerja siswa dan
informasi terkait lainnya. Knowledge Discovery in Database dan Data Mining dapat
digunakan untuk mengekstraksi pengetahuan yang bermanfaat, khususnya Association
Rules Mining. Dalam penelitian ini, algoritma apriori digunakan untuk menemukan
pengetahuan yang menarik di mana hasilnya diterapkan pada Course Management System
(CMS) untuk membantu siswa baru untuk mendaftar pada program yang lebih sesuai
berdasarkan profil mereka.

Penelitian Terkait
Educational Data Mining adalah salah satu bidang penelitian yang akhir-akhir ini
muncul kepermukaan. Penelitian yang berfokus untuk mendapatkan pengetahuan dari
database dalam lingkungan pendidikan penting untuk membangun pemahaman tentang
bagaimana atau mengapa beberapa atribut kondisi mempengaruhi kualitas kinerja
pendidikan siswa.
Algoritma Apriori sebagai salah satu metode dalam menghasilkan aturan asosiasi telah
digunakan oleh para peneliti untuk memperoleh pengetahuan dari basis data. Asif, M dan J.
Ahmad dalam penelitian mereka menemukan bahwa algoritma Fp-Tree bekerja lebih baik
dalam menemukan asosiasi pada dataset besar jika dibandingkan dengan algoritma apriori,
tetapi algoritma apriori itu sendiri tidak dapat dikesampingkan karena bekerja secara
efisien untuk dataset kecil.
Alaa el-Halees menggunakan data mining untuk meningkatkan kinerja siswa,
dikombinasikan dengan metode Rule Induction dan Naïve Bayes untuk memprediksi nilai
siswa. Clustering dilakukan dengan menggunakan algoritma K-means dan hasil
penelitiannya cukup bermanfaat bagi universitas.
Bhardwaj dan Pal dalam penelitian mereka menemukan bahwa kinerja siswa
dipengaruhi oleh tingkat pendidikan ibu mereka, area tempat tinggal dan faktor keluarga
lainnya. Kesimpulan ini ditemukan setelah menerapkan klasifikasi Bayesian pada berbagai
atribut bersyarat dari siswa.
Pandey dan Pal menemukan fakta yang lebih menarik bahwa bahasa dan latar
belakang pendidikan sangat mempengaruhi kinerja siswa di masa depan sementara
kualifikasi komputer mereka bias atau mungkin tidak menjadi faktor yang mempengaruhi.
Kesimpulan ini dibuat dengan menerapkan teknik klasifikasi.

Data dan Metode


Proses Data Mining
Alur kerja sistem terdiri dari tiga fase: Fase Integrasi Data, Fase Penambangan dan
Fase Prediksi dan Analisis. Dataset akan dirumuskan untuk tujuan ini. Diagram proses
penambangan data sebagai berikut:

Raw Pre-processed Transformed


Data
Pattern
Data Data

Pre-process Transformation Data Mining Knowledge

Persiapan data/Ekstraksi
Riset ini menggunakan database siswa pada Barani Institute of Information
Technology di Pakistan terhadap 3500 siswa. Database itu sendiri terdiri dari berbagai
atribut dan hanya atribut terkait penelitian yang akan diproses. Atribut yang sesuai yang
telah diekstrak dari basis data akan diproses lebih lanjut.
Data Preprocess
Database harus melewati tahapan preprocess sebagai tahapan yang penting sebelum
dilanjutkan pada proses data mining. Langkah ini berguna untuk mengidentifikasi data-
data dengan atribut yang kehilangan nilai, tidak relevan, berulang dan nilai-nilai yang
kacau yang terdapat pada dataset. Database yang tidak bersih akan berakibat pada hasil
penilaian pattern yang bias dan tidak akurat.
Pada tahapan ini akan dihasilkan daftar atribut yang cocok untuk digunakan dalam
riset ini.

Attribute Values

Past Education Arts, Science, Commerce, Computer

Past Education Grade A/B/C

Discipline BCS/BIT/MCS/MIT

Degree Grade A/B/C/I/F

Location Urban/Rural

Metode yang digunakan


Penelitian ini menggunakan algoritma apriori, yang diperkenalkan oleh Agarwal pada
tahun 1994 untuk ‘menambang’ itemset yang frequent. Dari temuan frequent itemset ini
akan dibentuk association rule.
Association Rule Mining
Dalam menghasilkan Association Rule, dalam penelitian ini dilakukan beberapa
langkah:

 Pertama, minimum support diterapkan pada dataset untuk menemukan


frequent itemset.
 Kedua, frequent itemset dan minimum confident digunakan untuk membentuk
rule.
 Ketiga, temukan kelompok itemset yang cenderung untuk muncul bersamaan
secara berulang.
 Association rule biasa ditulis dengan XY, yang berarti bilamana X muncul
maka Y cenderung juga ikut muncul. X dan Y bisa merupakan sebuah item
individu atau sekelompok item.

Support mengindikasikan frekuensi dari pattern. Sebuah itemset harus memenuhi


minimum support untuk bisa dianggap sebagai sebuah item yang frequent.

Support(X)=(frek. X)/(total transaksi)

Confidence menunjukkan kekuatan asosiasi antara X dan Y

Confidence(XY)=Support(X∩Y)/Support(Y)

Hasil dan Kesimpulan


Dataset yang diperoleh dari BIIT Department of Arid Agriculture University,
Rawalpindi, diolah dengan menggunakan software WEKA yang kaya akan tools untuk
digunakan dalam menemukan association rule dan pola tersembunyi dalam sebuat dataset.
Analisis nilai akhir berdasarkan pendidikan sebelumnya dan jurusan yang diambil:
Attribut yang dipakai  Past Education, Discipline, Degree Grade
Minimum Support : 5%, Minimum Confidence : 30%
Rules yang dihasilkan:
PAST_EDU=SCIENCE DEGREE_GRADE=B ==> DISCIPLINE=MCS conf:(0.84)
PAST_EDU=COMPUTER DEGREE_GRADE=B ==> DISCIPLINE=MCS conf:(0.72)
PAST_EDU=COMPUTER DEGREE_GRADE=C ==> DISCIPLINE=MCS conf:(0.71)
PAST_EDU=COMMERCE DEGREE_GRADE=B ==> DISCIPLINE=MIT conf:(0.51)
PAST_EDU=COMMERCE DEGREE_GRADE=B ==> DISCIPLINE=MIT conf:(0.45)
PAST_EDU=ARTS DEGREE_GRADE=C ==> DISCIPLINE=BCS conf:(0.37)
PAST_EDU=SCIENCE DEGREE_GRADE=B ==> DISCIPLINE=BCS conf:(0.9)
PAST_EDU=SCIENCE DEGREE_GRADE=A ==> DISCIPLINE=BCS conf:(0.9)
Rules diambil berdasarkan pendidikan sebelumnya dihubungkan dengan nilai mata
kuliah ilmu komputer. Rules menyatakan bahwa siswa yang sebelumnya sudah
pernah mempelajari ilmu komputer dasar dapat memperoleh nilai yang sangat baik.
Sementara siswa dengan latar belakang ilmu ekonomi kebanyakan mengambil
jurusan MIT dengan nilai B atau C.

Anda mungkin juga menyukai