Anda di halaman 1dari 6

Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6

UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

IMPLEMENTASI KLASIFIKASI SOAL


BERDASARKAN TAKSONOMI BLOOM
MENGGUNAKAN ALGORITMA SVM

Selvia Ferdiana Kusuma1, Agustono Heriadi2, Mohammad Farid Naufal3


1,2
Teknik Informatika, , Politeknik Kediri
3
Teknik Informatika, Fakultas Teknik, Universitas Surabaya
E-mail: *1selvia@poltek-kediri.ac.id, 2agustono@poltek-kediri.ac.id,
3
faridnaufal@staff.ubaya.ac.id

Abstrak – Proses penilaian merupakan Kata Kunci — Taksonomi Bloom, Algortima


aspek penting dalam pembelajaran. SVM, leksikal, sintaktik, ekstraksi fitur
Penilaian harus dilakukan secara benar agar
dapat mengukur kemampuan peserta didik.
Pada soal-soal yang digunakan untuk ujian
pada program Studi Teknik Informatika
Politeknik Kediri belum dilakukan
pengklasifikasian soal berdasar tingkat Abstract – The assessment process is an
kesulitannya. Sehingga pada proses penilaian important aspect in learning. Assessment
tidak didasarkan atas pemberian soal-soal must be done correctly in order to measure
dengan tingkat kesulitan yang berbeda. Pada the ability of learners. Exam questions in
tahun 1995, Benjamin Bloom telah Informatics Engineering of Polytechnic
memperkenalkan adanya proses Kediri has not been classified based on the
pengklasifikasian soal berdasarkan tingkat difficulty levels. It cause the assessment
kesulitannya, metode tersebut dinamakan process is not based on the provision of the
Taksonomi Bloom. Proses pengklasifikasian problems with different difficulty levels. In
soal sesuai level pada taksonomi bloom 1995, Benjamin Bloom introduced the
tidaklah mudah jika dilakukan secara classification process based on the difficulty
manual. Proses otomatisasi klasifikasi perlu levels, the method is called Bloom's
dilakukan ketika akan melakukan klasifikasi Taxonomy. The process of classifying
soal dalam jumlah yang banyak, misalkan questions based on difficulty levels in bloom
pada proses pengklasifikasian soal pada taxonomy is not an easy task if it is done
bank soal. Otomatisasi dilakukan selain manually. Classification automation process
untuk mempersingkat waktu juga untuk needs to be done when we classify questions
mengurangi tendensi dari ahli pada in large amounts for example classification
pengklasifikasian soal. Proses klasifikasi process in question bank. Automation process
dilakukan dengan pengidentifikasian fitur not only for time saving but also to reduce the
leksikal dan sintaktik sebagai proses tendency of experts in classifying questions.
ekstraksi fitur, kemudian hasil ekstraksi fitur The classification process is done by
diklasifikasikan menggunakan algoritma extracting lexical and syntactic features then
SVM. Penelitian ini menghasilkan sebuah classified using SVM algorithm. This
aplikasi yang dapat melakukan research produce an application that can
pengklasifikasian sejumlah soal berdasarkan classifies a number of questions based on
taksonomi bloom menggunakan algoritma Bloom Taxonomy using SVM algorithm. The
SVM. Aplikasi ini memiliki akurasi applications has a classification accuracy of
klasifikasi soal sebesar 86%. about 86%.

365
Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6
UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

Keywords — Bloom Taxonomy, SVM pada setiap soal [3]. Proses identifikasi
Algorithm, lexical, syntactic, feature tersebut digunakan sebagai proses ekstraksi
extraction. fitur yang kemudian hasil ekstraksi fitur
tersebut digunakan sebagai dasar proses
pengklasifikasian. Penelitian terdahulu yang
1. PENDAHULUAN dijadikan dasar penelitian ini adalah
penelitian Kusuma, Daniel dan Yuhana tahun
Proses penilaian merupakan aspek 2015 yang berjudul Automatic Indonesia’s
penting dalam pembelajaran. Penilaian harus Questions Classification Based On Bloom’s
dilakukan secara benar agar dapat mengukur Taxonomy Using Natural Language
kemampuan peserta didik dengan baik. Soal- Processing [3]. Penelitian tersebut dipilih
soal yang digunakan untuk ujian pada menjadi dasar penelitian karena memiliki
program Studi Teknik Informatika Politeknik jenis kesamaan dalam bahasa yang digunakan
Kediri belum diklasifikasikan berdasar yaitu Bahasa Indonesia. Selain penelitian
tingkat kesulitannya. Sehingga pada beberapa tersebut sebenarnya telah ada penelitian
proses penilaian belum didasarkan atas terdahulu yang membahas tentang
pemberian soal-soal dengan tingkat kesulitan pengklasifikasian soal berdasarkan
yang berbeda. Taksonomi Bloom namun penelitian-
Pada tahun 1995, Benjamin Bloom telah penelitian tersebut ditujukan untuk soal-soal
memperkenalkan proses pengklasifikasian yang menggunakan Bahasa Inggris.
soal berdasarkan tingkat kesulitann, metode Penelitian tersebut diantaranya adalah Yahya
tersebut dinamakan Taksonomi Bloom. & Osman yang mengklasifikasikan
Konsep ini terbagi menjadi tiga domain/ranah pertanyaan sesuai taksonomi bloom
kemampuan intelektual yaitu kognitif, afektif menggunakan Support Vector Machine [1].
dan psikomotorik. Aspek kognitif berkaitan Klasifikasi yang dilakukan menghasilkan
erat dengan pengetahuan dan pengembangan akurasi 87,4%. Penelitian ini tidak
kemampuan intelektual [1]. Aspek kognitif menggunakan fitur semantik maupun
dibagi menjadi 6 level yaitu pengetahuan, sintaktik, akurasi yang didapatkan hanya
pemahaman, penerapan, analisa, sintesa dan berdasarkan Bag Of Word (BOW). Penelitian
evaluasi. Tahun 1994 Lorin Anderson kedua adalah milik Omar yang dilakukan
Krathwohl dan para ahli psikologi aliran pada tahun 2011. Penelitian tersebut
kognitivisme memperbaiki taksonomi bloom menggunakan beberapa aturan yang dibuat
agar sesuai dengan kemajuan zaman [2]. berdasarkan struktur soal yang digunakan
Perubahan tersebut membuat level kognitif untuk melakukan klasifikasi. Selain itu Omar
Taksonomi Bloom berubah menjadi juga melakukan pembobotan kategori untuk
mengingat, memahami, mengaplikasikan, menangani overlapping kata kunci pada
menganalisis, mengevaluasi dan taksonomi bloom yang memungkinkan
menciptakan. adanya kesamaan kata kunci pada level yang
Proses pengklasifikasian soal sesuai berbeda [5]. Penelitian ketiga adalah Haris &
level pada taksonomi bloom tidaklah mudah Omar pada tahun 2012 yang melakukan
jika dilakukan secara manual [3]. Proses klasifikasi berdasarkan aturan yang telah
otomatisasi klasifikasi perlu dilakukan ketika dibuat. Aturan dibuat berdasarkan pola pada
akan melakukan klasifikasi soal dalam data latih. Hasil akurasi yang didapatkan pada
jumlah yang banyak, misalkan pada proses penelitian Haris & Omar (2012) sebesar 77%
pengklasifikasian soal pada bank soal. [6]. Penelitian keempat adalah milik
Berbeda dengan pengklasifikasian teks yang Abduljabbar & Omar pada tahun 2015 yang
berfokus pada level dokumen, menggunakan 3 metode seleksi fitur yaitu
pengklasifikasian soal akan berfokus pada hal mutual information, odd ratio and chi-square
yang lebih sempit lagi yaitu kalimat dan kata untuk meningkatkan hasil akurasi klasifikasi
proses tersebut memiliki tingkat kesulitan [7]. Penelitian tersebut merupakan perbaikan
tersendiri [4]. Menurut penelitian penelitian metode dari penelitian yang pernah dilakukan
Kusuma, Daniel dan Yuhana tahun 2015 Haris & Omar pada tahun 2012 dengan
proses klasifikasi soal berdasarkan perbaikan akurasi klasifikasi sebesar 12% .
Taksonomi Bloom dapat dilakukan dengan Melalui penelitian ini diharapkan
pengidentifikasian fitur leksikal dan sintaktik implementasi yang dilakukan dapat

366
Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6
UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

digunakan untuk mengklasifikasikan soal- 2.1. Dataset


soal di Program Studi Teknik Informatika
Politeknik Kediri berdasarkan taksonomi Penelitian ini menggunakan dataset yang
bloom secara otomatis sehingga proses berasal dari soal-soal Ujian Tengah Semester
pengklasifikasian soal dapat dilakukan secara (UTS) dan Ujian Akhir Semester (UAS)
lebih cepat. Program Studi Teknik Informatika Politeknik
Kediri. Dataset yang digunakan berjumlah
120 soal. 90 soal akan digunakan sebagai
data latih dan 30 soal akan digunakan sebagai
2. METODE PENELITIAN data uji. Contoh soal sesuai dengan
Taksonomi Bloom ditunjukkan pada Tabel 1.
Tahapan metodologi penelitian pada Tabel 1. Contoh Soal Sesuai Taksonomi
penelitian ini meliputi pengumpulan dataset, Bloom
praproses data, ekstraksi fitur, kemudian
proses klasifikasi. Alur tahapan penelitian Level
ditunjukkan pada Gambar 1. No Taksonomi Contoh Soal
Bloom
1 Mengingat Sebutkan 3 fungsi
dari proses partisi
2 Memahami jelaskan pola kerja
AJAX
3 Menerapkan Hitunglah waktu
tunggu dan turn
around data di atas
dengan
menggunakan
algoritma First
Come First Served
4 Menganalisis Bagaimana
Praproses

mekanisme kode
hamming mampu
mendeteksi posisi bit
yang berubah
tersebut
5 Mengevaluasi Apakah program
yang menggunakan
perulangan do while
akan menjalankan
programnya minimal
1 kali
6 Menciptakan Buatlah program
untuk memperjelas
gambar dengan
melakukan proses
kontras

2.2. Praproses
Praproses adalah langkah awal sebelum
melakukan klasifikasi. Terdapat 5 proses
Gambar 1. Alur Metodologi penelitian dalam lingkup praproses yaitu penyelarasan
huruf, tokenizing, penghapusan stopwords,
Secara lebih detail alur pada gambar 1 stemming, dan yang terakhir POS tagging.
akan dijelaskan sebagai berikut. Proses penyelarasan huruf merupakan proses
pengubahan huruf kapital menjadi huruf non-

367
Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6
UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

kapital. Proses ini diperlukan karena proses ekstraksi fitur. Tujuan dari ekstraksi fitur
identifikasi string biasanya bersifat case adalah mendapatkan informasi unik yang
sensitive, sehingga sebaiknya semua huruf nantinya dapat digunakan untuk melakukan
memiliki jenis yang sama. Proses tokenizing klasifikasi. Fitur yang digunakan pada
digunakan untuk menguraikan sebuah string penelitian ini adalah fitur leksikal dan
menjadi satuan kata. Setelah string berubah sintaktik. Penggunaan kedua fitur tersebut
menjadi satuan kata kemudian dilakukan dipilih karena penggunaan kata kunci untuk
proses penghapusan stopwords. Proses pengidentifikasian level soal ini juga belum
selanjutnya adalah stemming kata, proses ini tentu efisien kerena terkadang dalam satu
dilakukan untuk memperoleh kata dasar dari soal juga mengandung kata kunci ganda,
setiap kata. Proses penghapusan stopwords misalkan pada soal “Sebutkan 3 fungsi dari
dan proses stemming dapat dilakukan untuk proses partisi! ”. Soal tersebut mengandung 2
mereduksi fitur, dan mengurangi kata kunci yang berada pada 2 level yang
kompleksitas dari vektor fitur. Hal ini akan berbeda yaitu kata sebutkan yang mengacu
meningkatkan kualitas klasifikasi [8]. Kata pada kata kunci level mengingat, dan kata
dasar yang telah didapatkan kemudian proses yang mengacu pada level
ditentukan jenis katanya melalui proses POS mengaplikasikan. Hal tersebut membuktikan
tagging. Contoh hasil praproses sampai tahap bahwa apabila hanya menggunakan kata
stemming ditunjukkan pada Tabel 2. kunci saja sebagai metode untuk melakukan
otomatisasi klasifikasi soal belumlah cukup.
Tabel 2. Contoh Hasil Praproses Sampai
Tahap Stemming 2.3.1 Fitur Leksikal

Hasil Praproses Fitur leksikal yang digunakan pada


No Contoh Soal Sampai Tahap penelitian ini diperoleh dari kata tanya yang
Stemming digunakan. Proses ekstraksi fitur leksikal
P1 Sebutkan 3 fungsi sebut-fungsi- dilakukan dengan menghitung jumlah kata
dari proses partisi proses-partisi tanya yang digunakan dalam satu soal.
P2 jelaskan pola kerja jelas-pola-kerja Penggunaan jumlah kata tanya sebagai fitur
AJAX AJAX karena kata tanya tersebut dianggap mampu
P3 Hitunglah waktu hitung-tunggu- merepresentasikan level taksonomi bloom.
tunggu dan turn turn-around- Misalkan pada soal “Siapakah penemu
around data di atas data- guna- algoritma SVM?” kata tanya siapa mengacu
dengan algoritma-First- pada taksonomi bloom level mengingat.
menggunakan Come-First- Sedangkan pada soal “Mengapa perulangan
algoritma First Served do while akan menjalankan programnya
Come First Served minimal 1 kali?” kata tanya mengapa
P4 Bagaimana bagaimana- mengacu pada taksonomi bloom level
mekanisme kode mekanisme- menganalis. Contoh perhitungan fitur leksikal
hamming mampu kode-hamming untuk perhitungan kata tanya ditunjukkan
mendeteksi posisi –deteksi-posisi- pada Tabel 3. Perhitungan fitur tersebut
bit yang berubah bit-ubah-sebut berdasarkan contoh soal yang digunakan pada
tersebut Tabel 1.
P5 Apakah program apakah-
Tabel 3. Contoh Ekstraksi Fitur Leksikal
yang program-guna-
menggunakan ulang-do-while-
No Keterangan P1 P2 P3 P4 P5
perulangan do jalan- program-
while akan minimal-kali 1 Apa (What) 0 0 0 0 1
menjalankan
2 Dimana 0 0 0 0 0
programnya
(Where)
minimal 1 kali 3 0 0 0 0 0
Siapa (Who)
2.3. Ekstraksi Fitur 4 0 0 0 0 0
Kapan (When)
Guna dapat melakukan klasifikasi pada 5 0 0 0 0 0
sebuah kalimat soal, maka diperlukan

368
Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6
UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

6 Mengapa (Why) 0 0 0 1 0 2.4. Klasifikasi


7 Bagaimana Proses klasifikasi adalah proses
(How) menentukan sebuah objek ke dalam suatu
kategori yang telah ditentukan [9]. Proses
klasifikasi pada penelitian ini dilakukan
2.3.2 Fitur Sintaktik terhadap 120 dataset. 2/3 dari dataset tersebut
akan digunakan sebagai data latih dan 1/3 nya
Fitur sintaktik didapatkan dari hasil
akan digunakan sebagai data uji. Sehingga
proses ekstraksi pada kata kunci dan POS
dari 120 data tersebut ada 90 data yang
tagging. Proses ekstraksi fitur kata kunci
dilakukan dengan menghitung frekuensi digunakan sebagai data latih dan 30 soal yang
kemunculan kata kunci yang ada pada soal digunakan sebagai data uji. Proses klasifikasi
pada penelitian ini dilakukan menggunakan
lalu memetakannya sesuai dengan letak kata
algortitma SVM dengan teknik SMO.
kunci pada level Taksonomi Bloom.
Algoritma tersebut dipilih karena menurut
Kemudian informasi tersebut akan ditabelkan
agar mudah untuk diklasifikasikan. beberapa penelitian terdahulu algoritma
Penggunaan banyaknya jenis kata dan tersebut memiliki akurasi yang tinggi [1] [3]
[7]. Proses klasifikasi dilakukan
perhitungan frekwensi kemunculan kata
kunci digunakan sebagai fitur karena menggunakan library weka yang
banyaknya jenis kata yang digunakan dan digabungkan dengan aplikasi berbasis web
yang telah dibuat. Guna memvalidasi
jumlah kata kunci dalam suatu soal dapat
keberhasilan proses klasifikasi yang telah
membantu dalam proses klasifikasi. Soal
dilakukan diperlukan sebuah proses
yang memiliki kemiripan akan menghasilkan
penilaian. Proses penilaian dapat dilakukan
pola yang cenderung sama. Contoh
menggunakan perhitungan akurasi. Nilai
perhitungan kata kunci ditunjukkan pada
akurasi adalah proporsi jumlah prediksi data
Tabel 4, sedangkan contoh perhitungan jenis
kata yang digunakan ditunjukkan pada Tabel yang benar diklasifikasikan dari kesulurah
5. Perhitungan fitur tersebut berdasarkan dataset. Persamaan yang digunakan untuk
menghitung akurasi ditunjukkan pada
contoh soal yang digunakan pada Tabel 1.
persamaan 1.

Tabel 4. Contoh Ekstraksi Fitur Kata Kunci Akurasi = (1)

No Keterangan P1 P2 P3 P4 P5
1 Mengingat 1 1 0 2 1 3. HASIL DAN PEMBAHASAN
2 Memahami 0 2 1 1 0
3 Menerapkan 1 0 2 0 1 Implementasi proses klasifikasi
4 Menganalisis 0 0 0 1 0 dilakukan menggunakan aplikasi berbasis
5 Mengevaluasi 0 1 0 0 0 web. Pengguna dapat memasukkan soal yang
6 Menciptakan 0 1 0 1 0 akan diklasifikasikan pada kolom input soal.
Setelah diproses maka hasil klasifikasi akan
muncul di bagian kolom hasil. Contoh proses
Tabel 5. Contoh Ekstraksi Fitur Pos Tagging
pengklasifikasian ditunjukkan pada Gambar
No Keterangan P1 P P3 P4 P5 2.
2
1 Jumlah kata 3 2 2 4 5
benda
2 Jumlah kata 0 1 0 0 1
sifat
3 Jumlah kata 1 0 2 2 1
kerja
4 Jumlah kata 0 1 7 3 3
selain yang
disebutkan
Gambar 2. Tampilan Proses Klasifikasi

369
Seminar Nasional Inovasi Teknologi ISBN : 978-602-61393-0-6
UN PGRI Kediri, 22 Februari 2017 e-ISSN : 2549-7952

Proses uji coba klasifikasi dilakukan terhadap dikembangkan untuk dapat membangkitkan
30 soal yang digunakan sebagai data uji. soal dari beberapa jenis pertanyaan yang
Secara detail hasil klasifikasi ditunjukkan telah dimasukkan. Sehingga jenis soal yang
pada Tabel 6. dihasilkan bisa lebih bervariasi dan proses
pembuatan soal tidak dilakukan secara
Tabel 6. Hasil Confusion Matrix manual lagi.

a b c d e f Klasifikasi
5 0 0 0 0 0 a Mengingat DAFTAR PUSTAKA
0 5 0 0 0 0 b Memahami
0 0 3 0 0 2 c Menerapkan
0 0 0 4 1 0 d Menganalisis [1] A. A. Yahya and A. Osman, "Aotomatic
0 0 0 0 5 0 e Mengevaluasi Classification Of Questions Into Bloom's
Cognitive Levels Using Support Vector
0 0 1 0 0 4 f Menciptakan
Machines," pp. 1-6, 2011.

Berdasarkan informasi dari Tabel 6 diketahui [2] M. Taher, "Urgensi Taksonomi Bloom
bahwa ada 2 soal level mengaplikasikan Domain Kognitif Versi Baru Dalam
diklasifikasikan sebagai level membuat, 1 Kurikulum," Balai Diklat Keagamaan Medan,
soal level menganalisis yang diklasifikasikan Medan, 2013.
sebagai level mengevaluasi dan 1 soal level
membuat diklasifikasikan sebagai level [3] S. F. Kusuma, D. Siahaan and U. L. Yuhana,
mengaplikasikan. Sehingga secara "Automatic Indonesia’s Questions
keseluruhan ada 26 soal yang benar Classification Based On Bloom’s Taxonomy
Using Natural Language Processing," in
diklasifikasikan dan ada 4 soal yang salah International Conference on Information
diklasifikasikan. Nilai akurasi klasifikasi Technology Systems and Innovation (ICITSI),
dihitung menggunakan persamaan 1 dan Bandung, 2015.
didapatkan hasil klasifikasi sebesar 86%.
[4] A. Sangodiah, R. Ahmad and W. F. Ahmad,
"A Review in Feature Extraction Approach in
4. SIMPULAN Question Classification Using Support Vector
Machine," IEEE, pp. 536-541, 2014.
Berdasarkan implementasi klasifikasi
[5] N. Omar, S. S. Haris, R. Hassan, H. Arshad,
soal yang telah dilakukan dapat disimpulkan M. Rahmat, N. F. A. Zainal and R. Zulkifli,
bahwa: "Automated analysis of exam questions
1. Proses klasifikasi soal-soal mata kuliah according to bloom’s taxonomy," Procedia -
Teknik Informatika berdasarkan Social and Behavioral Sciences, pp. 297-303,
Taksonomi Bloom dapat dilakukan 2012.
menggunakan fitur leksikal dan fitur
sintaktik dari soal-soal tersebut. [6] S. S. Haris and N. Omar, "A Rule-based
2. Proses klasifikasi soal-soal berdasarkan Approach in Bloom’s Taxonomy Question
Taksonomi Bloom menggunakan Classification through Natural Language
Processing".
algoritma SVM memiliki akurasi yang
tinggi dengan tingkat kebenaran 86%. [7] D. A. Abduljabbar and N. Omar, "Exam
Questions Classification Based On Bloom's
Taxonomy Cognitive Level Using Classifiers
5. SARAN Combination," Journal of Theoretical and
Applied Information Technology, pp. 447-455,
Kesalahan klasifikasi kemungkinan 2015.
disebabkan masih terbatasnya data latih yang
digunakan sehingga pola yang dihasilkan [8] N. Yusof and C. J. Hui, "Determination of
Bloom's Cognitive Level of Question Items
belum mampu mengenali keseluruhan pola Using Artificial Neural Network," IEEE, pp.
data uji. Jadi sebaiknya untuk penelitian 866-869, 2010.
kedepannya jumlah data latih bisa
diperbanyak. Selain proses pengklasifikasian [9] S. Raharjo and E. Winarko, "Klasterisasi,
soal, sebaiknya kedepannya sistem ini

370

Anda mungkin juga menyukai