Anda di halaman 1dari 9

Penggalian Data Pendidikan: Sebuah Survei Dan Analisis Berbasis

Pertambangan Data Dari Karya Terbaru

ABSTRAK
Tinjauan ini mengejar dua tujuan, yang pertama adalah untuk melestarikan dan meningkatkan
catatan perkembangan data mining pendidikan (EDM) baru-baru ini; yang kedua adalah
mengorganisasikan, menganalisis, dan mendiskusikan isi ulasan berdasarkan hasil yang
dihasilkan oleh pendekatan data mining (DM). Dengan demikian, sebagai hasil dari seleksi
dan analisis 240 EDM bekerja, profil kerja EDM dikompilasi untuk menggambarkan 222
pendekatan EDM dan 18 alat. Profil pekerjaan EDM diatur sebagai basis data mentah, yang
diubah menjadi basis data ad-hoc yang cocok untuk ditambang. Sebagai hasil dari
pelaksanaan proses statistik dan pengelompokan, satu set fungsi pendidikan ditemukan, pola
realistis pendekatan EDM ditemukan, dan dua pola nilai-contoh untuk menggambarkan
pendekatan EDM berdasarkan model deskriptif dan prediksi diidentifikasi. Salah satu temuan
kunci adalah: sebagian besar pendekatan EDM didasarkan pada seperangkat dasar yang
disusun oleh tiga jenis sistem pendidikan, disiplin, tugas, metode, dan algoritma masing-
masing. Tinjauan ini diakhiri dengan snapshot dari pekerjaan EDM yang disurvei, dan
memberikan analisis kekuatan, kelemahan, peluang, dan ancaman EDM, yang faktor-
faktornya mewakili, dalam arti, pekerjaan masa depan yang harus dipenuhi.

1. INTRODUCTION
Data mining (DM) adalah sistem informasi berbasis komputer (CBIS) (Vlahos, Ferratt, & Knoepfle,
2004) yang dikhususkan untuk memindai repositori data besar, menghasilkan informasi, dan
menemukan pengetahuan. Arti istilah penambangan tradisional bias dasar-dasar DM. Tapi, bukannya
mencari mineral alami, targetnya adalah pengetahuan. DM mengejar untuk menemukan pola data,
mengatur informasi dari hubungan tersembunyi, aturan asosiasi struktur, memperkirakan nilai-nilai
item yang tidak diketahui untuk mengklasifikasikan objek, menyusun kelompok objek yang homogen,
dan mengungkap berbagai jenis temuan yang tidak mudah dihasilkan oleh sebuah CBIS klasik.
Dengan demikian, hasil DM mewakili dukungan yang berharga untuk pengambilan keputusan.

Mengenai pendidikan, ini adalah target aplikasi DM baru untuk penemuan pengetahuan, pengambilan
keputusan, dan rekomendasi
(Vialardi-Sacin, Bravo-Agapito, Shafti, & Ortigosa, 2009). Saat ini, penggunaan DM di arena
pendidikan baru jadi dan melahirkan bidang penelitian data mining (EDM) (Anjewierden, Kollöffel,
& Hulshof, 2007). Seperti yang akan kita lihat di Bagian 2, dalam arti dekade pertama abad ini
mewakili dimulainya EDM.

EDM muncul sebagai paradigma yang berorientasi pada model desain, tugas, metode, dan algoritma
untuk mengeksplorasi data dari pengaturan pendidikan. EDM mengejar untuk menemukan pola dan
membuat prediksi yang mencirikan perilaku dan pencapaian peserta, konten pengetahuan domain,
penilaian, fungsi pendidikan, dan aplikasi (Luan, 2002). Informasi sumber disimpan dalam repositori
yang dikelola oleh modalitas pendidikan konvensional, terbuka, dan jarak jauh.

Beberapa tren EDM diantisipasi di sini. Salah satunya sesuai dengan integrasi standar modul EDM ke
arsitektur khas keragaman luas sistem pendidikan berbasis komputer (CBES). Kecenderungan lain
menuntut EDM menyediakan beberapa fungsi selama tiga tahap siklus belajar-mengajar. Tahap
pertama berkaitan dengan penyediaan dukungan proaktif EDM untuk menyesuaikan pengaturan
pendidikan sesuai dengan profil siswa sebelum menyampaikan ceramah. Selama tahap interaksi
siswa-sistem, diinginkan bahwa EDM mengakuisisi log-data dan menafsirkan maknanya untuk
menyarankan rekomendasi, yang dapat digunakan oleh CBES untuk mempersonalisasi layanan
kepada pengguna secara real-time. Pada tahap berikutnya, EDM harus melaksanakan evaluasi
pendidikan yang diberikan mengenai: layanan yang disampaikan, hasil yang dicapai, tingkat kepuasan
pengguna, dan kegunaan sumber daya yang digunakan. Terlebih lagi, beberapa tantangan (yaitu,
target, lingkungan, modalitas, fungsi, jenis data, ...) menunggu untuk ditangani atau baru-baru ini
dianggap oleh EDM, seperti: data besar, komputasi awan, jejaring sosial, web penambangan,
penambangan teks, lingkungan virtual 3-D, penambangan spasial, penambangan semantik,
pembelajaran kolaboratif, rekan belajar,. . .

Pekerjaan ini memperpanjang periode yang dijelaskan oleh survei sebelumnya, diringkas dalam
Bagian 2.2, yang mencakup dari tahun 1995 hingga 2009. Tujuannya adalah untuk melestarikan dan
memperbarui riwayat perkembangan EDM baru-baru ini. Ruang lingkup pekerjaan terbatas dan
memberikan sebagian gambar aktivitas EDM yang diterbitkan di semua acara yang dirayakan dan
media yang tersedia. Terlepas dari ini, pekerjaan ini memberikan gambaran tentang kerja EDM yang
telah dicapai beberapa anggota.
Secara inklusif, ia menerapkan subjek yang penting, DM, untuk mengatur, menganalisis, dan
mendiskusikan isi ikhtisar. Kebijakan semacam itu adalah hal baru: untuk berkhotbah melalui contoh.

Sebagai hasil dari penerapan kebijakan tersebut, empat kontribusi berikutnya ditawarkan untuk
digunakan oleh komunitas EDM: profil DM, profil pendekatan EDM, pola untuk pendekatan EDM
berdasarkan model deskriptif, dan pola untuk pendekatan EDM berdasarkan pada model prediksi.
Yang pertama memfasilitasi deskripsi dari garis dasar DM yang mendukung pendekatan EDM. Yang
kedua berguna untuk menentukan sifat dan dasar dari pendekatan EDM. Yang ketiga dan keempat
adalah pola untuk mendesain pendekatan EDM, yang berguna sebagai referensi untuk
mengembangkan versi model deskriptif dan prediktif yang serupa.

Dalam makalah ini survei pekerjaan EDM dipenuhi dari 2010 hingga 2013 1st Qtr. Dipersembahkan.
Selain itu, metode yang diikuti untuk menghasilkan ikhtisar diuraikan dalam Bagian 2, serta materi
yang dikumpulkan dinyatakan. Sampel 240 karya EDM diringkas dalam Bagian 3. Koleksi semacam
ini disusun sesuai dengan fungsionalitas khas yang dipenuhi oleh CBES yang ditemukan dari materi.
Dalam Bagian 4, analisis karya sampel disediakan untuk membentuk status terbaru dan evolusi bidang
EDM, dan beberapa pola pendekatan EDM disorot. Akhirnya, Kesimpulan Bagian menyesuaikan
snapshot dari sampel dan analisis kritis dari arena EDM yang berguna untuk menginspirasi pekerjaan
di masa depan.

2. METHOD AND MATERIALS


Di bagian ini, metode dan bahan ikhtisar dijelaskan. Metode ini adalah kerangka kerja yang dikhususkan untuk
mengumpulkan dan menambang karya EDM. Materi yang disesuaikan dengan domain survei melalui lima
subjek: referensi untuk tinjauan EDM sebelumnya, ruang lingkup pekerjaan EDM yang dikumpulkan, profil
DM, ringkasan CBES, dan representasi data pendekatan EDM yang digunakan untuk penambangan.

Sebagai hasil dari aplikasi metode, sampel 240 karya EDM yang diterbitkan antara 2010 dan kuartal pertama
2013 dikumpulkan. Ini terdiri dari dua sub-sampel, satu dari 222 pendekatan EDM dan satu lagi dari 18 alat
EDM (yaitu, yang pertama mewakili aplikasi EDM dan perangkat lunak kedua). Sampel melambangkan sumber
berharga yang digunakan untuk memberikan sorotan dari arena EDM di Bagian 3 dan analisis singkat di Bagian
4. Selain itu, sampel diperiksa untuk menghasilkan statistik dan menemukan beberapa temuan, yang
diilustrasikan dalam subbagian berikut serta di Bagian 3 hingga 5.

2.1 Kerangka diterapkan untuk penemuan pengetahuan karya penambangan data


pendidikan
Metode yang digunakan untuk melaksanakan survei ini adalah kerangka kerja yang dirancang untuk
mengumpulkan, menganalisis, dan menambang karya EDM. Ini mengikuti alur kerja untuk
memimpin kegiatan yang berorientasi pada penemuan pengetahuan dalam basis data (KDD). Alur
kerja dibagi menjadi tiga tahap. Pengembangan setiap tahap dicapai oleh tiga tugas. Dengan
demikian, sembilan tugas menyusun seluruh alur kerja KDD yang digambarkan dalam Gambar. 1,
yang tujuan dan hasilnya dijelaskan sebagai berikut:

Tahap ‘‘ EDM work collection ’’ melakukan tiga tugas. Tugas pertama mencari referensi sumber
yang mempublikasikan karya EDM. Akibatnya, koleksi karya EDM dikumpulkan. Yang kedua
mengevaluasi EDM bekerja dan menghasilkan profil pendekatan EDM per setiap pekerjaan EDM
yang dipilih. Yang ketiga menganalisa profil pendekatan EDM dan mengatur database EDM mentah.

'Tahap pemrosesan data ’’ mencakup tugas yang diberi label sebagai keempat, kelima, dan keenam
dalam Gambar 1. Tugas keempat mengubah database EDM mentah menjadi database EDM ad-hoc
untuk memfasilitasi proses statistik dan penambangan. Kelima melakukan proses statistik untuk
menghasilkan tujuh jenis fungsi EDM untuk mengumpulkan pekerjaan dan statistik terkait yang
homogen. Penambangan keenam database EDM ad-hoc untuk mengetahui pola-pola yang menjadi
ciri EDM yang berhasil.

Tahapan yang berorientasi untuk ‘‘ edit dan interpretasikan hasil ’mengandung tugas yang berlabel
tujuh hingga sembilan pada Gambar 1. Tugas ketujuh mengklasifikasikan EDM bekerja sesuai dengan
fungsi pendidikan yang paling mereka fokuskan. Akibatnya, tujuh topik diatur dalam proporsi yang
seimbang dari karya-karya EDM yang homogen untuk menguraikan tujuh Bagian yang disajikan
sebagai 3,1 hingga 3,7. Yang kedelapan menafsirkan pola-pola yang dihasilkan oleh pendekatan DM
untuk menemukan hubungan antara nilai-nilai sifat-sifat yang menjadi ciri pendekatan EDM. Tugas
terakhir menganalisis pengetahuan yang ditemukan dari pekerjaan EDM untuk menyesuaikan
snapshot dari arena EDM yang dijelaskan dalam Bagian 2 hingga 5.

2.2 Ulasan sebelumnya dari penambangan data dan penambangan data pendidikan
Sebagai titik awal dari pekerjaan ini, tinjauan sebelumnya DM dan EDM diperiksa untuk
menyesuaikan kerangka konseptual tentang studi domain. Oleh karena itu, lima tinjauan
dimasukkan dalam subbagian ini, di mana seseorang berorientasi pada DM, dan empat
lainnya mencakup periode dari tahun 1995 hingga 2009.

Karena EDM didasarkan pada DM, tinjauan teknik dan aplikasi DM yang dicapai selama
tahun 2000 hingga 2011 diringkas sebagai berikut. Shu-Hsien, Pei-Hui, dan Pei-Yuan (2012)
menyajikan suatu keadaan seni tentang DM yang menyangkut serangkaian karya yang
digenapi sepanjang dekade terakhir. Makalah ini mensurvei dan mengelompokkan 216 karya
menggunakan sembilan kategori yang disajikan dengan perhitungan masing-masing karya:
(a) jaringan syaraf: 9; (b) arsitektur algoritma: 22, (c) prediksi dinamis: 17; (D) analisis
arsitektur sistem: 23; (e) sistem agen cerdas: 14; (f) pemodelan: 15; (g) pengetahuan-
sistem berbasis: 19; (h) optimasi sistem: 14; (I) sistem informasi: 28. Para penulis mengenali
dasar luas yang mendukung model DM, tugas, metode, teknik, dan algoritma. Akhirnya, tiga
saran dibuat: (1) termasuk metodologi ilmu sosial; (2) mengintegrasikan beberapa metodologi
ke dalam satu holistik; (3) mengubah kebijakan untuk memandu perkembangan DM di masa
depan.

Mengenai EDM, Romero dan Ventura (2007) menyajikan tinjauan 81 karya yang diterbitkan
dari tahun 1995 hingga 2005, di mana hanya tujuh yang sesuai dengan tahun 1990-an.
Mereka mengidentifikasi statistik-visualisasi dan penambangan web sebagai beberapa teknik
DM untuk mengklasifikasikan penerapan DM ke CBES. Untuk statistik, beberapa alat
diidentifikasi dan tujuh karya EDM dikutip. Mengenai visualisasi, empat karya direferensikan
dan satu alat diakui. Mengenai penambangan web, itu dibagi menjadi tiga jenis tugas: (1)
pengelompokan, klasifikasi, dan deteksi pencilan; (2) aturan asosiasi dan pola berurutan; (3)
penambangan teks. Contoh karya EDM diberikan untuk setiap jenis tugas. Namun, sampel
dipartisi menjadi tiga varian sistem e-Learning: kursus berbasis web tertentu (WBC), sistem
manajemen pembelajaran terkenal (LMS), dan sistem pendidikan berbasis web yang adaptif
dan cerdas (AIWBES). Jadi, sembilan koleksi karya EDM disediakan dalam tinjauan dengan
statistik berikutnya: (a) 15 pekerjaan pengelompokan, klasifikasi, dan tugas deteksi pencilan
dibagi menjadi: 3 WBC, 3 LMS, 9 AIWBES; (B) 14 makalah tentang aturan asosiasi dan
tugas pola berurutan dibagi menjadi: 6 WBC, 4 LMS, 4 AIWBES; (c) 7 karya yang terkait
dengan penambangan teks dipartisi menjadi: 4 WBC, 2 LMS, 1 AIWBES. Sebagai tren masa
depan, mereka menuntut: alat EDM ramah untuk pengguna non-teknis, standarisasi metode
dan data DM; integrasi fungsi DM dalam CBES, dan desain teknik yang dikhususkan untuk
EDM.

Beberapa ulasan muncul pada tahun 2009 untuk membentuk keadaan EDM. Yang pertama
adalah karya yang dibuat oleh Baker dan Yacef (2009). Mereka merayakan komunitas riset
EDM yang baru lahir, mendefinisikan DM dan EDM, dan menyediakan 45 referensi EDM, di
mana satu sesuai dengan 1973, yang lain hingga 1995, dan satu lagi hingga 1999. Tinjauan
mengidentifikasi beberapa target EDM, seperti: model siswa, model pengetahuan domain,
dukungan pedagogis, dan dampak pada pembelajaran; di mana 8, 4, 3, dan 4 karya terkait
masing-masing dikutip. Ulasan kedua yang diterbitkan pada tahun 2009 dipresentasikan oleh
Peña-Ayala, Domínguez, dan Medel (2009). Menawarkan 91 referensi tentang tiga topik:
CBES, DM, dan EDM. Mengenai yang pertama, pendekatan seperti instruksi yang dibantu
komputer, sistem bimbingan cerdas (ITS), LMS, dan sistem pendidikan berbasis web
(WBES) dipertimbangkan. Mengenai DM, beberapa model, tugas, dan teknik diidentifikasi;
di mana matematika, aturan, dan teknik komputasi lunak adalah target analisis. Adapun EDM
bekerja, mereka
terorganisir dalam empat fungsi: pemodelan siswa, bimbingan belajar, konten, dan penilaian.

Tinjauan EDM keempat sesuai dengan Romero dan Ventura (2010), yang meningkatkan
survei EDM sebelumnya dengan menambah 225 karya, mempertahankan tujuh referensi awal
tahun 1990-an, dan termasuk tiga makalah yang diterbitkan pada tahun 2010. Satu hal baru
menyangkut daftar 235 karya yang diklasifikasikan dan dihitung dengan cara berikut: 36
dalam pendidikan tradisional, 54 WBES, 29 LMS, 31 ITS, 26 sistem pendidikan adaptif, 23
tes-kuesioner, 14 konten teks, dan 22 lainnya. Mengenai aplikasi EDM, mereka dikumpulkan
ke dalam sebelas kategori pendidikan dengan penghitungan berikutnya: (a) analisis dan
visualisasi data: 35; (b) memberikan umpan balik untuk instruksi pendukung: 40; (c)
rekomendasi untuk siswa: 37; (d) memprediksi kinerja siswa: 76; (e) pemodelan siswa: 28;
(f) mendeteksi perilaku siswa yang tidak diinginkan: 23; (g) pengelompokan siswa: 26; (h)
analisis jejaring sosial: 15; (i) mengembangkan peta konsep: 10; (j) membangun courseware:
9; (k) perencanaan dan penjadwalan: 11. Pada akhir peninjauan, penulis menegaskan: 'EDM
sekarang mendekati masa remajanya. . . ’’
2.3 Lingkup survei saat ini karya penambangan data pendidikan
Interpretasi dari empat ulasan EDM yang diterbitkan hingga tahun 2010 menunjukkan
bahwa: abad saat ini merupakan awal dari EDM, karena hampir 98% dari karya yang dikutip
telah muncul sejak tahun 2000. Karena itu, EDM menjalani masa remajanya. Selama
pertumbuhannya, EDM telah bergeser dari makalah yang diterbitkan dalam konferensi dan
jurnal, ke lokakarya khusus, konferensi internasional tentang penambangan data pendidikan,
jurnal khusus EDM, buku pegangan (Romero, Ventura, Pechenizkiy, & Ryan, 2011), dan
sebuah masyarakat ahli dan partisan, serta satu buku yang diedit (Romero & Ventura, 2006)
dan satu lagi dalam pers (Peña-Ayala, 2013). Sinergi ini mengungkapkan meningkatnya
minat pada EDM dan merupakan alasan utama untuk memperbarui tinjauan dengan
menggunakan survei ini.

Oleh karena itu, ruang lingkup ikhtisar saat ini dibatasi pada contoh karya EDM representatif
yang diterbitkan dalam jurnal, buku bab yang berkaitan dengan EDM, serta makalah yang
disajikan dalam konferensi dan lokakarya EDM. Referensi yang dipilih telah diterbitkan
selama periode dari 2010 hingga kuartal pertama 2013. Dengan cara ini, kronik EDM
diperpanjang dan disegarkan.
2.4 Penambangan data singkatnya
Menurut Witten dan Frank (2000), DM adalah proses yang berorientasi untuk mengekstrak
pengetahuan yang berguna dan dapat dipahami, yang sebelumnya tidak diketahui, dari
repositori data yang besar dan heterogen. Dengan demikian, desain pekerjaan DM menuntut
instantiasi beberapa karakteristik untuk membentuk pendekatan, seperti: disiplin untuk
menyesuaikan baseline teoritis, jenis model yang akan dibangun, tugas untuk melakukan,
metode dan teknik untuk mekanisasi proposal, seperti baik sebagai algoritma, persamaan, dan
bingkai (misalnya, struktur data, kerangka kerja) untuk menerapkan pendekatan pada
komputer dan pengaturan internet. Karena itu, subbagian ini berorientasi untuk menentukan
atribut-atribut tersebut, memberikan beberapa contohnya, dan mengungkapkan statistik
kemunculannya di antara sub-sampel 222 pendekatan EDM.

2.4.1 Disiplin yang terlibat dalam penambangan data


Garis dasar DM didasarkan pada disiplin seperti: probabilitas (Karegar, Isazadeh, Fartash,
Saderi, & Navin, 2008), pembelajaran mesin (Witten, Frank, & Hall, 2011), statistik (Hill &
Lewicki, 2006), komputasi lunak (Mitra & Acharya, 2003), kecerdasan buatan
(Bhattacharyya & Hazarika, 2006), dan bahasa alami (McCarthy & Boonthum-Denecke,
2011). Mengenai sub-sampel, Tabel 1 menegaskan: probabilitas, pembelajaran mesin, dan
statistik menawarkan dasar pendekatan EDM 88%!

2.4.2 Model penambangan data


Pada dasarnya, dua jenis model DM dirancang: deskriptif dan prediktif (Kantardzic, 2011).
Model deskriptif biasanya menerapkan fungsi pembelajaran tanpa pengawasan untuk
menghasilkan pola yang menjelaskan atau menggeneralisasi struktur intrinsik, relasi, dan
keterkaitan data yang ditambang (Peng, Kou, Shi, & Chen, 2008). Model prediktif sering
menerapkan fungsi pembelajaran yang diawasi untuk memperkirakan nilai variabel dependen
yang tidak diketahui atau nilai mendatang berdasarkan fitur dari variabel independen terkait
(Hand, Mannila, & Smyth, 2001). Adapun sub-sampel, Gambar. 2 menunjukkan
kecenderungan tiga tahun, dari 2010 hingga 2012, di mana 60% dari pendekatan
menggambarkan model prediktif dan 40% bentuk model deskriptif.
2.4.3 Tugas penambangan data
Biasanya, implementasi model dibuat oleh tugas. Misalnya, pengelompokan (Berkhin, 2006),
aturan asosiasi (Hong, Lin, & Wang, 2003), analisis korelasi (Hardoon, Shawe-Taylor, &
Szedmak, 2004), menghasilkan model deskriptif; sementara, klasifikasi (Chau, Cheng, Kao,
& Ng, 2006), regresi (Wu & Li, 2007), dan kategorisasi menghasilkan model prediktif
(Genkin, Lewis, & Madigan, 2007). Adapun sub-sampel, Tabel 2 menginformasikan bahwa:
tugas yang paling umum adalah klasifikasi dan pengelompokan karena bersama-sama mereka
mencapai 69% dari tugas DM yang digunakan oleh pendekatan EDM!

2.4.4 Metode dan teknik penambangan data


Setelah model dan tugas DM ditetapkan, metode dan teknik untuk membangun pendekatan
dipilih sesuai dengan disiplin. Misalnya, Bayes theorem (Pardos & Heffernan, 2010b), pohon
keputusan (McCuaig & Baldwin, 2012), pembelajaran berbasis instance (IBL) (Brighton &
Mellish, 2002), dan model Markov tersembunyi (HMM) (Lee & Brunskill, 2012) adalah
metode yang paling populer digunakan oleh pendekatan sub-sampel, seperti yang ditunjukkan
Tabel 3. Sedangkan, logistik (D'Mello & Graesser, 2010), regresi linier (González-Brenes &
Mostow, 2010), frekuensi (Merceron, 2011), dan teknik hierarchical clustering (Huei-Tse,
2011) memberikan dukungan untuk 45% dari sub-sampel, seperti yang ditunjukkan Tabel 4.\

2.4.5 Algoritma, persamaan, dan bingkai yang digunakan untuk penambangan data
Setelah beberapa metode dan / atau teknik dipilih untuk menyelesaikan tugas DM tertentu,
suatu algoritma, persamaan, dan / atau bingkai diimplementasikan untuk menambang sumber
data (Wu et al., 2008). Menurut pendekatan EDM yang menyusun sub-sampel, algoritma,
persamaan, dan frame yang paling populer ditunjukkan pada Tabel 5-7. Di mana, mereka
masing-masing mengungkapkan: K-means (Bian, 2010), ekspektasi harapan (EM) (Pardos &
Heffernan, 2010a), J48 (Baker et al., 2012), dan Naive – Bayes (Anaya & Boticario, 2011a)
adalah algoritma top-empat yang paling banyak digunakan; persamaan statistik, termasuk
deskriptif, (Baker & Gowda, 2010) adalah persamaan yang paling umum digunakan;
beberapa versi jaringan Bayesian (Xu & Mostow, 2011a) adalah bingkai yang paling populer.
2.5 Pandangan sekilas pada sistem pendidikan
CBES telah berevolusi selama lebih dari enam puluh tahun, sebagai objek penelitian,
eksperimen, pengembangan, dan aplikasi, serta tujuan komersial. Mereka mewakili alternatif
untuk sistem pendidikan konvensional yang menyebarkan program akademik di tempat.
CBES merupakan upaya untuk mengotomatisasi instruksi dan mengikuti tren transformasi
ilmu komputer dan komunikasi. Untuk membentuk profil CBES, seperangkat berbagai CBES
dan fungsi dasar mereka diberikan di bagian ini. Kedua subjek diilustrasikan oleh statistik
yang diperkirakan untuk sub-sampel 222 pendekatan EDM yang diperkenalkan di Bagian 3.
2.5.1 Berbagai sistem pendidikan berbasis komputer
Selama evolusi CBES, banyak domain studi, tujuan aplikasi yang berbeda, dan gaya interaksi
sistem pengguna telah muncul. Keragaman CBES fokus pada target spesifik (misalnya,
instruksi, pembelajaran, pemecahan masalah, pengembangan keterampilan, manajemen
courseware, game), menerapkan teori pembelajaran tertentu (misalnya, objektivisme,
konstruktivisme, sosialis), menyebarkan fungsi tertentu (misalnya, individual ,
dipersonalisasi, workgroup, kolaborasi, adaptif, cerdas), menggunakan platform teknologi
yang berbeda (misalnya, mainframe, komputer pribadi, internet, mobile, di mana-mana), dan
mengikuti praktik pedagogis (misalnya, berpusat pada siswa, terletak, berumur panjang,
mendalam, campuran).
Karena itu, istilah-istilah khusus telah diciptakan untuk melabelkan paradigma pendidikan,
pedagogis, dan teknologi CBES, seperti: ITS yang berperilaku seperti pemantau pemecahan
masalah, pelatih, instrumen laboratorium, dan konsultan (Psotka, Massey, & Mutter, 1989) ;
LMS yang secara virtual mendukung rutinitas guru di kelas yang didedikasikan untuk
mempublikasikan materi kuliah, merancang contoh untuk dianalisis dan dipecahkan, dan
menentukan kuis tingkat otomatis; AIWBES yang mengejar untuk secara cerdas
menyesuaikan kurikulum, konten, urutan, penilaian, dan dukungan yang diberikan kepada
peserta didik sesuai latar belakang mereka,
keterampilan, dan kemajuan untuk memenuhi tujuan pendidikan mereka (Rebak, Blackmon,
& Humphreys, 2000).

Mengenai sub-sampel pendekatan EDM, Tabel 8 mengidentifikasi 37 jenis CBES, di mana


ITS dan LMS adalah yang paling menonjol dengan 49% sampel. Sedangkan, Tabel 9
menunjukkan contoh spesifik untuk jenis CBES sebelumnya seperti: Aljabar, BANTUAN,
Aljabar-Jembatan, dan Moodle; di mana tiga yang pertama adalah contoh ITS, dan yang
terakhir adalah kasus LMS. Keempat contoh ini adalah yang paling populer di arena EDM
dan mendukung 48% dari sub-sampel.
2.5.2 aga
2.6 Representasi data dari pekerjaan penambangan data pendidikan
Sebagai hasil dari penerapan metode untuk penemuan pengetahuan dari karya EDM, tiga
repositori diatur. Yang pertama adalah seperangkat karya EDM yang menyoroti sifat
pendidikan dan DM yang dinyatakan dalam versi cetak karya pilihan. Yang kedua adalah
database EDM mentah yang disimpan di komputer untuk mewakili profil pendekatan EDM,
serta satu set katalog untuk menstandardisasi instance nilai-nilai edukasi dan DM. Yang
ketiga adalah database EDM ad-hoc yang mewakili vektor biner untuk mengkarakterisasi
berbagai valueststances untuk masing-masing pendidikan dan sifat DM dari karya yang
dipilih.
Adapun pekerjaan EDM, itu menyediakan sumber baku untuk menentukan profil pendekatan
EDM. Profil semacam itu merupakan catatan dasar untuk menggambarkan pendekatan EDM.
Ini mencakup dua jenis sifat untuk menggambarkan karakteristik pendidikan dan DM dari
pendekatan tersebut. Yang pertama memegang tujuh ciri: fungsi, peran, jenis peran, modul,
jenis modul, sistem, dan nama sistem. Yang kedua adalah profil DM yang terdiri dari delapan
ciri: disiplin, model, tugas, metode, teknik, algoritma, persamaan, dan bingkai. Profil DM
digunakan untuk mengkarakterisasi sub-sampel dari 222 pendekatan EDM, di mana 150
sudah matang dan 72 baru jadi (yaitu, karena masih dalam proses pada tahun publikasi
mereka).

Mengenai database EDM mentah, itu mewakili profil pendekatan EDM melalui spread-sheet
dengan 15 kolom dan 2 lagi untuk mengidentifikasi pekerjaan dan tahun publikasi. Selain itu,
satu set katalog menyediakan kode untuk instantiate nilai-nilai yang menggambarkan sifat
pendidikan dan profil DM. Akibatnya, 15 katalog diatur dengan contoh contoh berikut: (1)
fungsi: 6 item untuk melabeli fungsionalitas CBES (mis., Siswa
pemodelan, penilaian, dukungan siswa); (2) peran: 9 item mengidentifikasi tujuan pendekatan
EDM (misalnya, penilaian, pengetahuan domain, sekuensing); (3) jenis peran: 40 contoh
target spesifik aplikasi (misalnya, pengaruh, perilaku, kognisi); (4) modul: 8 nilai
mengidentifikasi komponen CBES (misalnya, konten, evaluasi, bimbingan); (5) jenis modul:
5 kejadian memimpin pada tujuan modul (misalnya, menasihati, kognisi, pemantauan); (6)
sistem: 37 opsi menyatakan jenis sistem pendidikan (misalnya, WBES, ITS, LMS); (7) nama
sistem: 51 istilah label sistem pendidikan (misalnya, ASSISTments, Andes, Moodle); (8)
disiplin: 9 item (mis., Pembelajaran mesin, probabilitas, statistik); (9) model: 2 opsi:
deskriptif dan prediktif; (10) tugas: 10 varian (misalnya, aturan asosiasi, klasifikasi,
pengelompokan); (11) metode: 52 alternatif (misalnya, teorema Bayes, analisis klaster, pohon
keputusan); (12) teknik: 43 item (misalnya, kovarians, faktorisasi, heuristik); (13) algoritma:
143 opsi (misalnya, J48, Apriori, k-means); (14) persamaan: 40 opsi (misalnya, aljabar linear,
kesalahan kuadrat rata-rata, rangkaian waktu); (15) bingkai: 18 instance (misalnya, kriteria
informasi Akaike, basis pengetahuan Bayesian, model set kasar).
Sebagai hasil dari pra-pemrosesan database EDM mentah, integritas dan konsistensi dari
informasi yang disimpan dalam database EDM ad-hoc dijamin. Selain itu, profil pendekatan
EDM diubah menjadi vektor yang terdiri atas item alfanumerik yang memberi label nilai-nilai
ciri sesuai dengan kode yang dinyatakan oleh katalog masing-masing. Misalnya, item vektor
[185, 2010, SM-B, SM, B, SMM, CO, ITS, Aljabar, ML, D, CU, DT, k-means] masing-
masing mewakili: paper-id, tahun publikasi , fungsi pemodelan perilaku siswa, peran
pemodelan siswa, jenis peran perilaku, modul model siswa, jenis modul kognisi, sistem ITS,
nama sistem Aljabar, disiplin pembelajaran mesin, model deskriptif, tugas pengelompokan,
pohon keputusan, algoritma k-means . Namun, untuk memfasilitasi proses statistik dan
penambangan, vektor alfanumerik diubah menjadi baris biner (misalnya, [185, 2010,0, 1, 0,
0, 0, 0, 0, 0, 0, 0, 1,0,. . .]), di mana 1 pertama mengidentifikasi fungsi pemodelan perilaku
siswa ‘‘ SM-B ’’, dan yang kedua 1 menggambarkan peran pemodelan siswa ‘‘ SM ’’, dan
seterusnya.

3. RESULT

Pengembangan tahap kedua yang membentuk metode untuk penemuan pengetahuan


menghasilkan sampel dari 240 karya yang memenuhi kriteria yang diberikan dalam
Bagian 2.3. Dalam arti, sampel mencerminkan pemuda EDM sedang berlangsung. Selama
analisis sampel ditemukan bahwa sebagian besar dari 222 pendekatan sesuai dengan
pemodelan siswa. Karena itu, ketidakseimbangan dalam struktur sebelumnya dari survei
itu diperhatikan. Jadi, untuk menyesuaikan organisasi yang relevan dari subyek yang
menunjukkan set yang seimbang dari pekerjaan yang homogen, yang disebut
fungsionalitas dan alat, proses pengelompokan dicapai sebagai berikut:

Setelah database EDM ad-hoc dihasilkan, beberapa statistik deskriptif diperkirakan


menghasilkan satu set fungsi EDM representatif. Hasil utama diuraikan pada Tabel 11. Ini
memberikan gambaran dari karya yang disajikan dalam subbagian berikut. Ini
dikumpulkan pada tiga tingkat, yang pertama merupakan karya EDM yang dikumpulkan
dalam survei ini, yang kedua sesuai dengan pendekatan EDM dan alat EDM, dan yang
ketiga dicadangkan untuk masing-masing enam fungsi dan tiga jenis alat. Kolom pertama
mengidentifikasi tingkat agregasi. Kolom lainnya mengungkapkan jumlah karya yang
dipublikasikan per total, dalam proses, dan matang, yang disegmentasikan oleh periode
(misalnya, 2010 hingga kuartal pertama 2013) dan tahun-tahun (misalnya, 2010,
2011,2012, dan yang pertama seperempat dari 2013).
4. DUSCUSSION

Anda mungkin juga menyukai