Anda di halaman 1dari 8

EDUCATIONAL DATA MINING (KONSEP DAN PENERAPAN)

Fitri Marisa
Program Studi Teknik Informatika
Universitas Widyagama Malang
Jl. Borobudur No. 35 Malang (0341)492282
e-mail: fitrimarisa@widyagama.ac.id

ABSTRACT

Electronic Learning (E-Elarning), especially Web-based learning or intelligent tutorial system has
yielded information about the interaction between students and the system. This information is
stored in a database in the form of a web log. Within a certain period it will be a large amount of
information. From the collection of large amounts of data that can be explored using data mining
methods to generate new patterns that can be useful for improving the effectiveness of computer-
based learning process. This paper will discuss how data mining can be utilized to improve the
effectiveness of computer-based learning process. In its application the data will be processed in
three stages: the collection, transformation, and analysis. Then the techniques used in the analysis
algorithm is Association rules, classification, and clustering.

Keywords: data mining, Educational data mining, E-Learning

PENDAHULUAN. secara manual dari suatu kumpulan data


Di era teknologi informasi seperti saat (Pramudiono, 2007). Data mining, sering juga
ini tentunya ketersediaan data di segala disebut sebagai knowledge discovery in
bidang sangatlah melimpah. Dengan database (KDD). KDD adalah kegiatan
fenomena tersebut akan sangat berguna jika yang meliputi pengumpulan, pemakaian
dipikirkan bagaimana membangun pola yang data, historis untuk menemukan
menjadikan data yang berlimpah tersebut keteraturan, pola atau hubungan dalam set
menghasilkan data-data yang memiliki data berukuran besar (Santoso, 2007).
banyak manfaat bagi pemilik data itu sendiri Sependapat dengan Witten (2005) yang
maupun pihak eksternal yang PHQJDWDNDQ EDKZD ³Data mining
membutuhkannya. Maka dikembangkanlah didefinisikan sebagai proses menemukan
ilmu Data Mining. Dalam definisinya Data pola-pola dalam data. Proses ini otomatis atau
Mining adalah penambangan atau penemuan seringnya semiotomatis. Pola yang
informasi baru dengan mencari pola atau ditemukan harus penuh arti dan pola
aturan tertentu dari sejumlah data yang tersebut memberikan keuntungan, biasanya
sangat besar (Davies, 2004). Data Mining keuntungan secara ekonomi. Data yang
juga disebut sebagai serangkaian proses dibutuhkan dalam jumlah besaU´
untuk menggali nilai tambah berupa Salah satu bidang yang akan diangkat
pengetahuan yang selama ini tidak diketahui dalam pembahasan makalah ini adalah

Jurnal Teknologi Informasi Vol. 4 No. 2


90
penerapan data mining dalam dunia sebagai suatu proses terdiri atas pembersihan
pendidikan khususnya dunia pendidikan. Di data (data cleaning), integrasi data (data
dunia pendidikan tentunya terdapat banyak integration), pemilihan data (data
sumber yang menghasilkan data melimpah selection), transformasi data (data
antara lain data kinerja pengajar, kinerja transformation), data mining, evaluasi pola
admistrasi dan pelayanan, data rekam jejak (pattern evaluation) dan penyajian
alumni, data akademik, maupun data proses pengetahuan (knowledge presentation).
pembelajaran. (Ayub, 2007: 22).
Mungkin selain yang disebutkan diatas Pendapat lain mengatakan bahwa data
masih banyak sumber data yang bisa digali. mining terdiri dari 6 tahap yang terpola dalam
Namun pembahasan ini akan menfokuskan gambar 1 sebagai berikut :
pada satu sumber yaitu proses pembelajaran
dengan studi kasus pembelajaran berbantuan
komputer (computer aided learning system).
Sistem pembelajaran berbantuan komputer
dapat diimplementasikan sebagai sistem
tutorial berbasis web (web-based tutoring
tool) [Merceron, 2005]. Dalam
mekanismenya bahwa dalam tutorial
berbasis, terdapat interaksi antara pebelajar
dengan sistem yang disimpan dalam database
baik berupa basis data SQL maupun web log.
Dengan rentang waktu yang panjang maka Gambar 1: Tahapan data mining Han: 2006)
data yang dihasilkan akan semakin Tahap-tahap data mining ada 6 yaitu :
berlimpah, maka dari berlimpahnya data
tersebut berpotensi untuk digali sehingga 1. Pembersihan data (data cleaning)
menghasilkan pola-pola baru dari data yang
bermanfaat untuk efektifitas proses Pembersihan data merupakan proses
pembelajaran. Pola penggalian data tersebut menghilangkan noise dan data yang tidak
menggunakan ilmu Data Mining. konsisten atau data tidak relevan. Pada
umumnya data yang diperoleh, baik dari
LANDASAN TEORI database suatu perusahaan maupun hasil
1. Penerapan Educational Data Mining. eksperimen, memiliki isian-isian yang tidak
Sebenarnya data mining merupakan sempurna seperti data yang hilang, data yang
suatu langkah dalam knowlegde discovery in tidak valid atau juga hanya sekedar salah
databases (KDD). Knowledge discovery ketik. Selain itu, ada juga atribut-atribut data

Jurnal Teknologi Informasi Vol. 4 No. 2


91
yang tidak relevan dengan hipotesa data nama pelanggan, cukup dengan id pelanggan
mining yang dimiliki. Data-data yang tidak saja.
relevan itu juga lebih baik dibuang.
Pembersihan data juga akan mempengaruhi 4. Transformasi data (Data Transformation)
performasi dari teknik data mining karena Data diubah atau digabung ke dalam
data yang ditangani akan berkurang jumlah format yang sesuai untuk diproses dalam data
dan kompleksitasnya. mining. Beberapa metode data mining
membutuhkan format data yang khusus
2. Integrasi data (data integration) sebelum bisa diaplikasikan. Sebagai contoh
Integrasi data merupakan penggabungan beberapa metode standar seperti analisis
data dari berbagai database ke dalam satu asosiasi dan clustering hanya bisa menerima
database baru. Tidak jarang data yang input data kategorikal. Karenanya data berupa
diperlukan untuk data mining tidak hanya angka numerik yang berlanjut perlu dibagi-
berasal dari satu database tetapi juga berasal bagi menjadi beberapa interval. Proses ini
dari beberapa database atau file teks. Integrasi sering disebut transformasi data.
data dilakukan pada atribut-aribut yang
mengidentifikasikan entitas-entitas yang unik 5. Proses mining,
seperti atribut nama, jenis produk, nomor Merupakan suatu proses utama saat
pelanggan dan lainnya. Integrasi data perlu metode diterapkan untuk menemukan
dilakukan secara cermat karena kesalahan pengetahuan berharga dan tersembunyi dari
pada integrasi data bisa menghasilkan hasil data.
yang menyimpang dan bahkan menyesatkan
pengambilan aksi nantinya. Sebagai contoh 6. Evaluasi pola (pattern evaluation),
bila integrasi data berdasarkan jenis produk Untuk mengidentifikasi pola-pola
ternyata menggabungkan produk dari kategori menarik kedalam knowledge based yang
yang berbeda maka akan didapatkan korelasi ditemukan. Dalam tahap ini hasil dari teknik
antar produk yang sebenarnya tidak ada. data mining berupa pola-pola yang khas
maupun model prediksi dievaluasi untuk
3. Seleksi Data (Data Selection) menilai apakah hipotesa yang ada memang
Data yang ada pada database sering kali tercapai. Bila ternyata hasil yang diperoleh
tidak semuanya dipakai, oleh karena itu hanya tidak sesuai hipotesa ada beberapa alternatif
data yang sesuai untuk dianalisis yang yang dapat diambil seperti menjadikannya
akan diambil dari database. Sebagai umpan balik untuk memperbaiki proses data
contoh, sebuah kasus yang meneliti faktor mining, mencoba metode data mining lain
kecenderungan orang membeli dalam kasus yang lebih sesuai, atau menerima hasil ini
market basket analysis, tidak perlu mengambil sebagai suatu hasil yang di luar dugaan

Jurnal Teknologi Informasi Vol. 4 No. 2


92
yang mungkin bermanfaat. Educational Data Mining is an
emerging discipline, concerned with
7. Presentasi pengetahuan (knowledge developing methods for exploring the unique
presentation), types of data that come from educational
Merupakan visualisasi dan penyajian settings, and using those methods to better
pengetahuan mengenai metode yang understand students, and the settings which
digunakan untuk memperoleh pengetahuan they learn in.
yang diperoleh pengguna. Tahap terakhir dari (www.educationaldatamining.org)
proses data mining adalah bagaimana diakses 7 Pebruari 2014 jam 13.40.
memformulasikan keputusan atau aksi dari Dari definisi tersebut dikatakan bahwa
hasil analisis yang didapat. Ada kalanya hal Educational data mining adalah disiplin ilmu
ini harus melibatkan orang-orang yang tidak yang mendalami tentang pembangunan pola-
memahami data mining. Karenanya presentasi pola yang unik yang dihasilkan dari proses
hasil data mining dalam bentuk pengetahuan pembelajaran yang berguna untuk memahami
yang bisa dipahami semua orang adalah satu pebelajar secara lebih baik sehingga dapat
tahapan yang diperlukan dalam proses data diupayakan bagaimana merancang pola yang
mining. Dalam presentasi ini, visualisasi juga cocok.
bisa membantu mengkomunikasikan hasil Dari kerangka proses data mining
data mining (Han, 2006) yang digabungkan dengan pola educational
Sedangkan menurut Nilakant (2004) data mining maka dapat dijabarkan tahapan
³.HUDQgka proses data mining yang akan proses data mining sebagai berikut:
dibahas tersusun atas tiga tahapan, yaitu
pengumpulan data (data collection), A. Pengumpulan data.
transformasi data (data transformation), dan Dalam kerangka ini proses dimulai dari
analisis data (data analysis). Dari proses pengumpulan data yang menghasilkan data
tersebut dapat digambarkan sebagai mentah, kemudian ditransformasikan
berikut: sehingga menghasilkan file yang dapat dibaca
oleh tools data mining. Hasil dari transformasi
tersebut akan dilakukan analisis, yang
biasanya menggunakan anaisis statistik
ataupun visualisasi informasi. Hasil evaluasi
pengetahuan yang dihasilkan data mining
inil ah dapat digunakan sebagai acuan
Gambar 2: Kerangka proses Data mining
kebutuhan pengetahuan yang lebih lengkap,
(adaptasi dari Ayub, 2007)
perbaikan kumpulan data (dataset) atau
perubahan pada sistem.

Jurnal Teknologi Informasi Vol. 4 No. 2


93
Berikut ini adalah menggambarkan
interaksi pembelajaran dalam berbagai layer.

Gambar 4: contoh Taksonomi variabel dari

Gambar 3: Model interaksi pembelajaran. usaha menjawab soal (adaptasi dari Ayub,
2007)

Dari Gambar 3 digambarkan layer yang


dengan lapisan mulai dari lapisan dalam yaitu Data mentah yang dihasilkan dari

Constrain (Aturan) ± Attempt (Usaha)- pengumpulan data, biasanya tersimpan dalam

Problems (soal)- Session (sesi)- Course bentuk beberapa tabel basis data. Karena

(Materi). Suatu contoh pebelajar dalam analisis data umumnya dilakukan terhadap

melakukan tes yang pada saat pengerjaan suatu tabel tunggal, maka perlu dilakukan

sebelum pebelajar memutuskan menjawab penggabungan (join) beberapa tabel yang

soal yang dianggap benar tentunya ada relevan. Hasilnya adalah suatu struktur yang

kegiatan yang dilakukan seperti misal disebut dengan dataset, [Ayub, 2007].

menjawab jawaban yang salah, kemudian Kemudian dataset ini digolongkan menjadi 2

direvisi kembali, berapa lama waktu yang yaitu kumpulan atribut ( vertikal) dan

dibutuhkan untuk menghasilkan jawaban yang kumpulan instan (horisontal).

benar, apakah siswa melakukan pelanggaran, Setiap atribut mempunyai tipe data,

bagaimana pola pelanggaran yang dilakukan, yang dapat berupa string, angka atau yang

apakah siswa menjawab dengan salah, seperti lainnya. Untuk nilai atribut berhingga, disebut

apa pola kesalahan pebelajar. Hal-hal tersebut atribut nominal. nstans adalah data yang

sedetail mungkin harus bisa direkam oleh dihasilkan dari suatu kejadian riil, yang

sistem yang akhirnya dapat digunakan untuk dicatat dalam beberapa atribut.

menyusun representasi kognitif siswa atau


disebut model siswa.
Hasil pengelompokan data tersebut
dapat digambarkan taksonomi variable
tentang usaha pebelajar dalam memecahkan
pertanyaan, seperti yang dicontohkan pada Gambar 5: Format dataset (Adaptasi dari
gambar 4. Nikalant: 2004)

Jurnal Teknologi Informasi Vol. 4 No. 2


94
B. Transformasi. 2004]
Dalam proses transformasi ini dapat Menurut Huda (2010: 14) Association
dilakukan dengan beberapa cara yaitu filtrasi rules (aturan asosiasi) atau affinity analysis
dan konversi atribut. Filtrasi yaitu mensoting (analisis afinitas) berkenaan dengan studi
atribut-atribut yang tidak relevan sehingga tentang ³apa bersama apD´. Sebagai contoh
menghasilkan data yang lebih rekomanded. dapat berupa berupa studi transaksi di
Sedangkan konversi atribut adalah mengubah supermarket, misalnya seseorang yang
atribut yang bernilai kontinyu menjadi membeli susu bayi juga membeli sabun
nominal, karena ada beberapa perangkat data mandi. Pada kasus ini berarti susu bayi
mining yang tidak bisa menghitung nilai bersama dengan sabun mandi. Karena
kontinyu. awalnya berasal dari studi tentang database
Dalam konversi atribut ini terdapat dua transaksi pelanggan untuk menentukan
cara yaitu teknik scanning yaitu melakukan kebiasaan suatu produk dibeli bersama produk
penelusuran terhadap semua nilai kontinyu apa, maka aturan asosiasi juga sering
menjadi domain atribut nominal. Cara dinamakan market basket analysis
berikutnya dalah teknik binning yaitu Aturan asosiasi ingin memberikan
mendefinisikan kumpulan kelas nominal informasi tersebut dalam bentuk hubungan ³if-
untuk setiap atribut, kemudian menetapkan WKHQ´ atau ³jika-maka´. Aturan ini dihitung
setiap nilai atribut ke dalam salah satu kelas. dari data yang sifatnya probabilistik (Santoso,
Misalnya, jika domain atribut numerik 2007). Bentuk umum aturan dalam association
mempunyai nilai dari 0 sampai dengan 100, rule adalah :
domain tersebut dapat dibagi menjadi empat
(X = xi) :(Y = yi) [sup,conf]
bin (0..24, 25..49, 50..74, 75..100). Setiap
nilai atribut akan dikonversi menjadi atribut dengan :
nominal yang berkorespondensi dengan salah X = { x1, x2, . . ., xn},
satu bin. Y = { y1, y2, . . ., ym},
sup = probabilitas bahwa suatu instans dalam
C. Analisis Data. dataset mengandung X ë Y, conf =
Proses analisis data dengan probabilitas kondisional bahwa instans yang
menerapkan teknik data mining dapat mengandung X juga mengandung Y.
dilakukan melalui analisis statistik atau Association rule merupakan salah satu
dengan pendekatan machine learning. metode data mining yang menjadi dasar dari
Analisis data pembelajaran dengan berbagai metode data mining lainnya. tahap
pendekatan machine learning akan dari analisis asosiasi yang disebut analisis
menggunakan tiga teknik, yaitu association pola frekuensi tinggi (frequent pattern
rules, clustering, dan classification [Nilakant, mining) menarik perhatian banyak peneliti

Jurnal Teknologi Informasi Vol. 4 No. 2


95
untuk menghasilkan algoritma yang efisien. mewakili bagian ³jika´ dan consequent untuk
Penting tidaknya suatu aturan assosiatif dapat mewakili bagian ³maka´. Dalam analisis ini,
diketahui dengan dua parameter, support antecedent dan consequent adalah
(nilai penunjang) yaitu prosentase kombinasi sekelompok item yang tidak punya hubungan
item tersebut. dalam database dan confidence secara bersama (Santoso, 2007).
(nilai kepastian) yaitu kuatnya hubungan antar Assosiation Rules dapat dimanfaatkan
item dalam aturan assosiatif. Analisis asosiasi untuk menemukan kesalahan yang sering
didefinisikan suatu proses untuk menemukan terjadi pada saat pebelajar mengerjakan
semua aturan assosiatif yang memenuhi syarat latihan soal. Suatu contoh jika pebelajar
minimum untuk support (minimum support) melakukan kesalahan X dan Z, maka mereka
dan syarat minimum untuk confidence juga melakukan kesalahan Y, misalnya
(minimum confidence) (Pramudiono, 2007). dengan support 40% dan confidence 55%
Ada beberapa algoritma yang sudah akan ditulis sebagai
dikembangkan mengenai aturan asosiasi,
namun ada satu algoritma klasik yang sering X and Z : Y [40%,55%]

dipakai yaitu algoritma apriori. Ide dasar dari Aturan tersebut dapat dibaca sebagai
algoritma ini adalah dengan mengembangkan berikut : dari 40% siswa yang melakukan
frequent itemset. Dengan menggunakan satu kesalahan X dan kesalahan Z maka 55%
item dan secara rekursif mengembangkan diantaranya melakukan kesalahan Y.
frequent itemset dengan dua item, tiga item Algoritma Assosiation Rules juga
dan seterusnya hingga frequent itemset dapat menyatakan hubungan antara beberapa
dengan semua ukuran. atribut yang berbeda, misalnya kesalahan X
Untuk mengembangkan frequent set pada konsep A menimbulkan kesalahan Z
dengan dua item, dapat menggunakan pada konsep C, yang ditulis sebagai
frequent set item. Alasannya adalah bila set
satu item tidak melebihi support minimum, X and A : Z and C

maka sembarang ukuran itemset yang lebih


Teknik classification bekerja dengan
besar tidak akan melebihi support minimum
mengelompokkan data berdasarkan data
tersebut. Secara umum, mengembangkan set
training dan nilai atribut klasifikasi. Aturan
dengan fc-item menggunakan frequent set
pengelompokan tersebut akan digunakan
dengan k ± 1 item yang dikembangkan dalam
untuk klasifikasi data baru ke dalam
langkah sebelumnya. Setiap langkah
kelompok yang ada.
memerlukan sekali pemeriksaan ke seluruh
Classification dapat direpresentasikan
isi database.
dalam bentuk pohon keputusan (decision
Dalam asosiasi terdapat istilah
tree). Setiap node dalam pohon keputusan
antecedent dan consequent, antecedent untuk
menyatakan suatu tes terhadap atribut dataset,

Jurnal Teknologi Informasi Vol. 4 No. 2


96
sedangkan setiap cabang menyatakan hasil DAFTAR PUSTAKA
dari tes tersebut. Pohon keputusan yang
$\XE 0HZDWL ³Proses data mining
terbentuk dapat diterjemahkan menjadi dalam pembelajaran berbanuan
komputer´ 9RO 1R Jurnal Sistem
sekumpulan aturan dalam bentuk IF condition
Informasi. Universitas Kristen
THEN outcome. Maranatha.

Davies, and Paul Beynon, 2004, ³Database


KESIMPULAN Systems Third Edition´, Palgrave
Macmillan, New York.
Education data mining adalah suatu
teknik penerapan data mining dalam sistem Han, J. and Kamber, M, 2006, ³Data Mining
Concepts and Techniques Second
pembelajaran berbantuan komputer. Pada
Edition´. Morgan Kauffman, San Francisco.
prosesnya adalah diawali dengan
Merceron, A., Yacef, K. (2005). Educational
pengumpulan data, yang dilanjutkan dengan
Data Mining : a Case Study,
transformasi data, dan diakhiri dengan http://www.it.usyd.edu.au/~kalina/publis
/merceron_yacef_aied0
analisis data. Dalam pengumpulan data, yang
mesti didefinisikan adalah suatu model Nilakant, K. (2004). Application of Data
Mining in Constraint Based Intelligent
interaksi antara pebelajar sistem yang
Tutoring System,
bertujuan untuk menghasilkan ketetapan data www.cosc.canterbury.ac.nz/research/rep
orts/HonsReps/2004/hons_04
yang harus terekam dari suatu proses
pembelajaran yang diamati. Kemudian model Pramudiono, I., 2007, Algoritma
Apriori,
interaksi pebelajar-sistem tersebut dapat
http://datamining.japati.net/cgi-
tersusun atas beberapa lapisan untuk bin/indodm.cgi?bacaarsip&1172210143
Di
memungkinkan penangkapan data yang lebih
kaya. Transformasi data mengubah data Pramudiono, I. 2007. Pengantar Data Mining
: Menambang Permata Pengetahuan di
mentah menjadi dataset yang siap dilakukan
Gunung Data.
penghitungan selanjutnya (dianalisis). http://www.ilmukomputer.org/wp-
content/uploads/2006/08/iko-
Transformasi dapat dilakukan pada instans
datamining.zip.
dataset maupun pada atribut dari dataset
Santosa, Budi, 2007, ³Data Mining Teknik
melalui filtrasi ataupun konversi. Sementara
Pemanfaatan Data untuk Keperluan
itu analisis data hasil pembelajaran dapat Bisnis´, Graha Ilmu, Yogyakarta.
dilakukan dengan menerapkan teknik
Witten, I. H and Frank, E. 2005. Data
algoritma association rules, classification, Mining : Practical Machine Learning
Tools and Techniques Second Edition.
dan clustering untuk menghasilkan
Morgan Kauffman : San Francisco
pengetahuan yang dapat membantu untuk
proses pembelajaran selanjutnya.

Jurnal Teknologi Informasi Vol. 4 No. 2


97

Anda mungkin juga menyukai