Anda di halaman 1dari 17

PEMANFAATAN TEXT MINING MENGGUNAKAN

ALGORITMA HIERARCHIAL CLUSTERING PADA SISTEM


PENILAIAN UJIAN JAWABAN ESAI OTOMATIS

MAKALAH

Diajukan sebagai Salah Satu Syarat untuk Memperoleh Nilai Plagirism Checker
sebagai syarat kelulusan Pelatihan ICT 2019

Oleh
MUHAMMAD NABIL
1177050073

BANDUNG
2019 M/1441 H
DAFTAR ISI
KATA PENGANTAR .............................................................................................................iii
BAB I ........................................................................................................................................ 1
PENDAHULUAN ................................................................................................................... 1
1.1. Latar Belakang Masalah ............................................................................................. 1
1.2. Rumusan Masalah ....................................................................................................... 3
1.3. Tujuan ........................................................................................................................... 3
BAB II ...................................................................................................................................... 4
PEMBAHASAN ...................................................................................................................... 4
2.1. Metode Pengembangan Sistem Penilaian Esai Otomatis ......................................... 4
2.2. Implementasi Text Mining pada Sistem Penilaian Ujian.......................................... 7
BAB III................................................................................................................................... 11
PENUTUP.............................................................................................................................. 11
3.1. Kesimpulan ................................................................................................................. 11
DAFTAR PUSTAKA ............................................................................................................ 12

i
DAFTAR GAMBAR

Gambar 1 Alur proses metode pengembangan V-Model .......................................................... 4


Gambar 2 proses clustering dengan menggabungkan 2 cluster yang saling berdekatan........... 9
Gambar 3 Dendrogram, menunjukkan hubungan hierarkial antar cluster ................................ 9

ii
KATA PENGANTAR

Segala puji dan syukur senantiasa dipanjatkan kepada Allah SWT. Shalawat serta
salam juga senantiasa tercurahkan kepada junjungan Nabi Muhammad SAW, kepada
keluarga, sahabat, hingga para pengikutnya hingga akhir zaman. Berkat nikmat dan
anugerah Tuhan Yang Maha Kuasa, penyusun mampu menyelesaikan tugas makalah
yang berjudul “Pemanfaatan Text mining Menggunakan Algoritma Hierarchial
Clustering Pada Sistem Penilaian Ujian Jawaban Esai Otomatis”.

Dalam penyusunan makalah ini, penyusun menyadari banyaknya halangan dan


hambatan yang dihadapi. Tetapi, berkat bantuan, dorongan, dan bimbingan dari orang
tua, rekan, serta pembimbing pelatihan ICT UIN Sunan Gunung Djati Bandung,
hambatan dan masalah-masalah tersebut dapat teratasi.

Akhirya, penyusun menyadari bahwa makalah yang disusun masih jauh dari
kesempurnaan. Maka dari itu, penyusun mengharapkan sumbangsih kritik dan saran
yang membangun agar di waktu yang akan datang dapat menyusun tulisan yang lebih
baik lagi. Akhir kata, semoga Allah SWT, memberikan pertolongan kepada semua
orang menjalani kehidupan ini.

Bandung, 21 November 2019

Penyusun

iii
BAB I

PENDAHULUAN

1.1. Latar Belakang Masalah


Teknologi informasi merupakan teknologi yang menggabungkan komputasi dengan
komunikasi untuk melakukan tugas-tugas informasi sehingga arus informasi dapat
berjalan dengan baik. Saat ini, teknologi informasi berkembang dengan sangat pesat
dan hampir menyentuh semua bidang kehidupan. Hal ini memerlukan adanya
peningkatan kinerja baik dari segi efektifitas dan efisiensi. Salah satu sector penting
yang harus diperhatikan peningkatan efisiensi dan efektivitas kinerjanya adalah sektor
pendidikan.

Indonesia telah menerapkan suatu sistem Pendidikan yang telah lama bertahan dan
telah diterapkan di hampir semua sekolah baik negeri maupun swasta. Jenjang
Pendidikan di Indonensia, dibagi menjadi empat jenjang yaitu anak usia dini, dasar,
menengah, dan tinggi. Saat ini seluruh penduduk Indonesia diharuskan mengikuti
program wajib belajar pendidikan dasar selama sembilan tahun. Sedangkan siswa yang
ingin melanjutkan jenjang ke berikutnya harus mengikuti proses ujian negara. Dengan
Perkembangan teknologi informasi saat ini menuntut suatu sistem pengujian yang
efektif dan efisien serta mampu melakukan pengujian secara cepat, tepat dan
memudahkan dalam melakukan pengujian serta penilaian itu sendiri. Pada penelitian
ini akan dilakukan perancangan sistem ujian dengan memanfaatkan soal essay. Ujian
dalam bentuk essay dapat melatih siswa dalam menyampaikan informasi secara verbal
serta menuntut pemahaman yang lebih baik akan suatu ilmu dan dapat digunakan untuk
mengukur tingkat pemahaman siswa akan suatu ilmu secara lebih mendalam.

Masalahnya, proses penilaian pada ujian bertipe essay akan memakan lebih banyak
waktu dan tenaga dibandingkan dengan ujian bertipe pilihan ganda yang sifatnya lebih
cepat dan singkat. Diperlukan suatu metode penilaian yang dapat mempersingkat

1
waktu dan meminimalisir tenaga yang dibutuhkan untuk melakukan penilaian terhadap
ujian jenis essay.

Penilaian esai otomatis atau Automated Essay Scoring (AES) adalah penggunaan
program komputer khusus untuk memberikan nilai pada esai yang ditulis dalam
kerangka/setting Pendidikan[1]. Salah satu metode AES yang digunakan dalam
penelitian ini adalah metode text mining, yang merupakan variasi dari data mining yang
berusaha menemukan pola yang menarik dari sekumpulan data tekstual yang berjumlah
besar. Tujuannya adalah untuk mencari kata-kata yang dapat mewakili isi dari
dokumen sehingga dapat dilakukan analisis keterhubungan antar dokumen[2].

Salah satu teknik yang dikenal dalam data mining yaitu clustering. Pengertian
clustering dalam data mining adalah pengelompokkan sejumlah data atau objek ke
dalam cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang
semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. Sampai saat
ini, para ilmuwan masih terus melakukan berbagai usaha untuk melakukan perbaikan
model cluster dan menghitung jumlah cluster yang optimal sehingga dapat dihasilkan
cluster yang paling baik. Ada dua metode clustering yang kita kenal, yaitu hierarchical
clustering dan partitioning. Metode hierarchical clustering sendiri terdiri dari
complete linkage clustering, single linkage clustering, average linkage clustering dan
centroid linkage clustering. Sedangkan metode partitioning sendiri terdiri dari k-means
dan fuzzy k-means[3].

Berdasarkan uraian permasalahan tersebut maka dibuatlah aplikasi penilaian otomatis


pada sistem ujian jawaban esai berbasis web yang berfungsi untuk memberi
kemudahan dalam proses ujian. Pada aplikasi penilaian tersebut, akan
diimplementasikan algoritma hierarchical clustering.

Berdasarkan permasalahan tersebut, maka judul penelitian ini adalah, “Pemanfaatan


Text mining Menggunakan Algoritma Hierarchial Clustering Pada Sistem
Penilaian Ujian Jawaban Esai Otomatis”.

2
1.2. Rumusan Masalah
1. Apa metode yang digunakan dalam pengembangan sistem penilaian ujian esai
otomatis?
2. Bagaimana implementasi teknik text mining dalam sistem peniliana ujian esai
otomatis?

1.3. Tujuan
1. Metode yang digunakan dalam pengembangan sistem penilaian ujian esai
otomatis.
2. Implementasi teknik text mining dalam sistem peniliana ujian esai otomatis.

3
BAB II

PEMBAHASAN

2.1. Metode Pengembangan Sistem Penilaian Esai Otomatis


Metode yang digunakan untuk mengembangkan sistem ini adalah dengan
menggunakan model pengembangan perangkat lunak V-Model. Model ini merupakan
pengembangan lebih lanjut dari model waterfall. Dalam model ini, proses
pengembangan dilakukan menggunakan percabangan, tidak seperti model waterfall
yang melakukan proses pengembangan secara linear. Model pengembangan ini
menggambarkan hubungan antara tahap pengembangan software dengan tahap
pengujiannya[4].

Gambar 1 Alur proses metode pengembangan V-Model

Penjelasan mengenai proses-proses pada metode pengembangan V-Model dapat


diuraikan sebagai berikut:

4
A. Fase Verifikasi
1. Requirement Analysis
Ini adalah fase pertama dalam siklus pengembangan di mana persyaratan produk
dipahami dari perspektif pelanggan. Fase ini melibatkan komunikasi terperinci dengan
pelanggan untuk memahami harapannya dan persyaratan yang tepat. Ini adalah
kegiatan yang sangat penting dan perlu dikelola dengan baik, karena sebagian besar
pelanggan tidak yakin tentang apa yang sebenarnya mereka butuhkan. Perencanaan
desain pengujian penerimaan dilakukan pada tahap ini karena persyaratan bisnis dapat
digunakan sebagai input untuk pengujian penerimaan.

2. System Design
Setelah Anda memiliki persyaratan produk yang jelas dan terperinci, sekarang saatnya
untuk merancang sistem yang lengkap. Desain sistem akan memiliki pemahaman dan
perincian perangkat keras dan pengaturan komunikasi lengkap untuk produk yang
sedang dikembangkan. Rencana uji sistem dikembangkan berdasarkan desain sistem.
Melakukan ini pada tahap sebelumnya menyisakan lebih banyak waktu untuk
pelaksanaan tes yang sebenarnya nanti.

3. Architectural Design
Spesifikasi arsitektur dipahami dan dirancang dalam fase ini. Biasanya lebih dari satu
pendekatan teknis diusulkan dan berdasarkan kelayakan teknis dan finansial, keputusan
akhir diambil. Desain sistem dipecah lebih lanjut menjadi modul yang mengambil
fungsi yang berbeda. Ini juga disebut sebagai Desain Tingkat Tinggi atau High Level
Design (HLD).
Transfer data dan komunikasi antara modul internal dan dengan dunia luar (sistem lain)
dipahami dan didefinisikan dengan jelas dalam tahap ini. Dengan informasi ini, tes
integrasi dapat dirancang dan didokumentasikan selama tahap ini.

5
4. Module Design
Dalam fase ini, desain internal terperinci untuk semua modul sistem ditentukan, disebut
sebagai Low Level Design (LLD). Penting bahwa desainnya kompatibel dengan modul
lain dalam arsitektur sistem dan sistem eksternal lainnya[5]. Tes unit merupakan bagian
penting dari setiap proses pengembangan dan membantu menghilangkan kesalahan dan
kesalahan maksimum pada tahap yang sangat awal. Tes unit ini dapat dirancang pada
tahap ini berdasarkan pada desain modul internal.

5. Coding Phase
Pengkodean aktual dari modul sistem yang dirancang dalam fase desain diambil pada
fase Pengkodean. Bahasa pemrograman yang paling cocok diputuskan berdasarkan
kebutuhan sistem dan arsitektur.

Pengkodean dilakukan berdasarkan pedoman dan standar pengkodean. Kode melewati


banyak ulasan kode dan dioptimalkan untuk kinerja terbaik sebelum pembangunan
terakhir diperiksa ke dalam repositori.

B. Fase Validasi
1. Unit Testing
Tes unit dirancang dalam fase desain modul dijalankan pada kode selama fase validasi
ini. Pengujian unit adalah pengujian pada tingkat kode dan membantu menghilangkan
bug pada tahap awal, meskipun semua cacat tidak dapat diungkap oleh pengujian unit.

2. Integration Testing
Pengujian integrasi dikaitkan dengan fase desain arsitektur. Tes integrasi dilakukan
untuk menguji koeksistensi dan komunikasi modul internal dalam sistem.

6
3. System Testing
Pengujian sistem secara langsung terkait dengan fase desain sistem. Tes sistem
memeriksa seluruh fungsionalitas sistem dan komunikasi sistem yang sedang
dikembangkan dengan sistem eksternal. Sebagian besar masalah kompatibilitas
perangkat lunak dan perangkat keras dapat diungkap selama pelaksanaan pengujian
sistem ini.

4. Acceptance Testing
Pengujian penerimaan dikaitkan dengan fase analisis kebutuhan bisnis dan melibatkan
pengujian produk di lingkungan pengguna. Tes penerimaan mengungkap masalah
kompatibilitas dengan sistem lain yang tersedia di lingkungan pengguna. Ini juga
menemukan masalah non fungsional seperti beban dan cacat kinerja di lingkungan
pengguna yang sebenarnya.

2.2. Implementasi Text Mining pada Sistem Penilaian Ujian


Pada bagian ini, implementasi yang akan dibahas merupakan implementasi text mining
pada jawaban ujian esai yang tersimpan di dalam database sistem ujian, yang mana text
jawaban ujian disimpan dalam bentuk dokumen pdf. Text mining sendiri merupakan
proses penambangan data berupa text yang biasanya bersumber dari dokumen.
Tujuannya, adalah untuk mencari kata-kata yang bisa merepresentasikan isi dari
dokumen tersebut agar nantinya dapat dilakukan analisis keterhubungan antar
dokumen[6].

Secara umum, text mining dapat dikelompokkan menjadi 4 langkah, yaitu:

1. Information Retrieval
Ini adalah langkah pertama dalam proses penambangan data. Langkah ini
melibatkan bantuan mesin pencari untuk mengetahui kumpulan teks yang juga
dikenal sebagai corpus teks yang mungkin memerlukan beberapa konversi.

7
Teks-teks ini juga harus disatukan dalam format tertentu yang akan membantu
bagi pengguna untuk memahami. Biasanya XML adalah standar untuk
penambangan teks.

2. Natural Language Processing


Langkah ini memungkinkan sistem untuk melakukan analisis tata bahasa dari
kalimat untuk dapat memahami teks. Langkah ini juga diperlukan untuk
menganalisis teks dalam struktur.

3. Information Extraction
Ini adalah tahap kedua yang dilakukan untuk mengidentifikasi makna mark-up
teks tertentu. Pada tahap ini, metadata ditambahkan ke database atribut teks.
Hal Ini juga melibatkan penambahan nama atau lokasi ke teks. Langkah ini
memungkinkan mesin pencari untuk mendapatkan informasi dan mencari tahu
hubungan antara teks menggunakan metadata mereka.

4. Text mining
Tahap terakhir adalah penambangan data menggunakan tools/teknik yang
berbeda. Langkah ini dilakukan untuk menemukan kesamaan antara informasi
yang memiliki arti yang sama yang akan sulit ditemukan. Penambangan teks
adalah alat yang meningkatkan proses penelitian dan membantu pengujian
query[7]. Dalam kasus ini, teknik yang digunakan untuk melakukan text mining
pada sistem ujian esai berbasis web adalah teknik hierarchical clustering.
Hierarchical clustering dimulai dengan memperlakukan setiap pengamatan
sebagai kelompok yang terpisah. Kemudian, ia berulang kali mengeksekusi dua
langkah berikut: (1) mengidentifikasi dua cluster yang berdekatan, dan (2)
menggabungkan dua cluster yang paling mirip. Hal ini terus berlanjut sampai
semua cluster bergabung bersama. Hal ini diilustrasikan dalam gambar di
bawah ini.

8
Gambar 2 proses clustering dengan menggabungkan 2 cluster yang saling berdekatan

Output utama dari hierarchical clustering adalah dendogram, yang


menunjukkan hubungan hierarkial antar cluster.

Gambar 3 Dendrogram, menunjukkan hubungan hierarkial antar cluster

Setelah proses ini selesai, kemudian dilanjutkan dengan mengukur jarak


cluster/persamaan antar cluster, yang mana jarak tersebut telah dihitung
berdasarkan panjang garis lurus yang digambar dari satu cluster ke cluster yang
lain. Hal ini dikenal sebagai jarak Euclidean/Euclidean distance[8]. Setelah
memilih metrik jarak, perlu ditentukan pula dari mana jarak dihitung. Sebagai
contoh, hal ini dapat dihitung antara dua bagian yang paling mirip dari sebuah

9
cluster (hubungan tunggal), dua bit yang paling mirip dari sebuah cluster
(hubungan lengkap), pusat dari cluster (hubungan rata-rata), atau beberapa
kriteria lain.

Seperti halnya metrik jarak, pilihan kriteria keterkaitan/ linkage criteria harus
dibuat berdasarkan pertimbangan teoretis dari domain aplikasi[9]. Masalah
teoritis utama adalah apa yang menyebabkan variasi. Dalam kasus ini, metode
lingkage criteria yang digunakan adalah metode Ward, yang menentukan
pengamatan mana yang dikelompokkan berdasarkan pengurangan jumlah jarak
kuadrat dari setiap pengamatan dari pengamatan rata-rata dalam sebuah
cluster[10]. Hasilnya sering tepat karena konsep jarak ini cocok dengan asumsi
standar tentang bagaimana menghitung perbedaan antara kelompok dalam
statistik (mis., ANOVA, MANOVA).

10
BAB III

PENUTUP

3.1. Kesimpulan
Proses penilaian ujian esai menggunakan text mining memakan lebih sedikit waktu
ketimbang penilaian esai secara manual. Hal ini dikarenakan jawaban akan langsung
dicocokkan dengan kunci jawaban secara otomatis. Sistem ujian yang dirancang
merupakan sistem berbasis web yang didesain sangat sederhana agar dapat
memudahkan siswa atau pengguna dalam mengoperasikannya.

Pengembangan sistem dilakukan dengan menggunakan V-Model yang merupakan


pengembangan dari model waterfall. Model ini dipilih karena lebih efisien dan
memakan lebih sedikit waktu karena menggunakan alur pengerjaan percabangan.
Terdapat dua fase yang digunakan dalam model ini, yaitu fase verifikasi dan fase
validasi.

Teknik text mining yang diajukan menggunakan teknik hierarchical clustering. Setelah
dilakukan pengambilan informasi, pengolahan Bahasa natural, dan ekstraksi informasi,
sistem akan mengelompokkan informasi menjadi cluster-cluster kecil. Kemudian,
cluster yang berdekatan akan digabungkan menjadi satu cluster baru. Proses ini terus
berlanjut hingga seluruh cluster menyatu, sehingga menghasilkan dendogram dan pada
akhirnya dapat dihitung jarak cluster(persamaan) dan kriteria keterkaitan antar cluster.

11
DAFTAR PUSTAKA

[1] F. Y. Maulana, “Implementasi Text Mining Pada Penilaian Otomatis Sistem


Ujian Jawaban Esai Dengan Metode Hirarki Clustering,” pp. 1–5.

[2] J. O. Contreras, S. Hilles, and Z. B. Abubakar, “Automated Essay Scoring with


Ontology based on Text Mining and NLTK tools,” 2018 Int. Conf. Smart
Comput. Electron. Enterp. ICSCEE 2018, pp. 1–6, 2018.

[3] M. Chen and X. Li, “Relevance-Based Automated Essay Scoring via


Hierarchical Recurrent Model,” in Proceedings of the 2018 International
Conference on Asian Language Processing, IALP 2018, 2019, pp. 378–383.

[4] “SDLC - V-Model - Tutorialspoint.” [Online]. Available:


https://www.tutorialspoint.com/sdlc/sdlc_v_model.htm. [Accessed: 22-Nov-
2019].

[5] J. O. Clark, “System of systems engineering and family of systems engineering


from a standards,v-model, and dual-v model perspective,” in 2009 IEEE
International Systems Conference Proceedings, 2009, pp. 381–387.

[6] D. S. McNamara, S. A. Crossley, R. D. Roscoe, L. K. Allen, and J. Dai, “A


hierarchical classification approach to automated essay scoring,” Assess. Writ.,
vol. 23, pp. 35–59, 2015.

[7] N. Zhong, Y. Li, and S. T. Wu, “Effective pattern discovery for text mining,”
IEEE Trans. Knowl. Data Eng., vol. 24, no. 1, pp. 30–44, 2012.

[8] P. Li, F. Liu, and E. Z. Zhu, “MSTI: A New Clustering Validity Index for
Hierarchical Clustering,” in Proceedings - 2018 4th Annual International
Conference on Network and Information Systems for Computers, ICNISC
2018, 2018, pp. 208–212.

12
[9] T. Matsumoto, W. Sunayama, Y. Hatanaka, and K. Ogohara, “Data Analysis
Support by Combining Data Mining and Text Mining,” in Proceedings - 2017
6th IIAI International Congress on Advanced Applied Informatics, IIAI-AAI
2017, 2017, pp. 313–318.

[10] “What is Hierarchical Clustering? | Displayr.com.” [Online]. Available:


https://www.displayr.com/what-is-hierarchical-
clustering/?utm_referrer=https://www.google.com/. [Accessed: 22-Nov-2019].

13

Anda mungkin juga menyukai