AES
AES
MAKALAH
Diajukan sebagai Salah Satu Syarat untuk Memperoleh Nilai Plagirism Checker
sebagai syarat kelulusan Pelatihan ICT 2019
Oleh
MUHAMMAD NABIL
1177050073
BANDUNG
2019 M/1441 H
DAFTAR ISI
KATA PENGANTAR .............................................................................................................iii
BAB I ........................................................................................................................................ 1
PENDAHULUAN ................................................................................................................... 1
1.1. Latar Belakang Masalah ............................................................................................. 1
1.2. Rumusan Masalah ....................................................................................................... 3
1.3. Tujuan ........................................................................................................................... 3
BAB II ...................................................................................................................................... 4
PEMBAHASAN ...................................................................................................................... 4
2.1. Metode Pengembangan Sistem Penilaian Esai Otomatis ......................................... 4
2.2. Implementasi Text Mining pada Sistem Penilaian Ujian.......................................... 7
BAB III................................................................................................................................... 11
PENUTUP.............................................................................................................................. 11
3.1. Kesimpulan ................................................................................................................. 11
DAFTAR PUSTAKA ............................................................................................................ 12
i
DAFTAR GAMBAR
ii
KATA PENGANTAR
Segala puji dan syukur senantiasa dipanjatkan kepada Allah SWT. Shalawat serta
salam juga senantiasa tercurahkan kepada junjungan Nabi Muhammad SAW, kepada
keluarga, sahabat, hingga para pengikutnya hingga akhir zaman. Berkat nikmat dan
anugerah Tuhan Yang Maha Kuasa, penyusun mampu menyelesaikan tugas makalah
yang berjudul “Pemanfaatan Text mining Menggunakan Algoritma Hierarchial
Clustering Pada Sistem Penilaian Ujian Jawaban Esai Otomatis”.
Akhirya, penyusun menyadari bahwa makalah yang disusun masih jauh dari
kesempurnaan. Maka dari itu, penyusun mengharapkan sumbangsih kritik dan saran
yang membangun agar di waktu yang akan datang dapat menyusun tulisan yang lebih
baik lagi. Akhir kata, semoga Allah SWT, memberikan pertolongan kepada semua
orang menjalani kehidupan ini.
Penyusun
iii
BAB I
PENDAHULUAN
Indonesia telah menerapkan suatu sistem Pendidikan yang telah lama bertahan dan
telah diterapkan di hampir semua sekolah baik negeri maupun swasta. Jenjang
Pendidikan di Indonensia, dibagi menjadi empat jenjang yaitu anak usia dini, dasar,
menengah, dan tinggi. Saat ini seluruh penduduk Indonesia diharuskan mengikuti
program wajib belajar pendidikan dasar selama sembilan tahun. Sedangkan siswa yang
ingin melanjutkan jenjang ke berikutnya harus mengikuti proses ujian negara. Dengan
Perkembangan teknologi informasi saat ini menuntut suatu sistem pengujian yang
efektif dan efisien serta mampu melakukan pengujian secara cepat, tepat dan
memudahkan dalam melakukan pengujian serta penilaian itu sendiri. Pada penelitian
ini akan dilakukan perancangan sistem ujian dengan memanfaatkan soal essay. Ujian
dalam bentuk essay dapat melatih siswa dalam menyampaikan informasi secara verbal
serta menuntut pemahaman yang lebih baik akan suatu ilmu dan dapat digunakan untuk
mengukur tingkat pemahaman siswa akan suatu ilmu secara lebih mendalam.
Masalahnya, proses penilaian pada ujian bertipe essay akan memakan lebih banyak
waktu dan tenaga dibandingkan dengan ujian bertipe pilihan ganda yang sifatnya lebih
cepat dan singkat. Diperlukan suatu metode penilaian yang dapat mempersingkat
1
waktu dan meminimalisir tenaga yang dibutuhkan untuk melakukan penilaian terhadap
ujian jenis essay.
Penilaian esai otomatis atau Automated Essay Scoring (AES) adalah penggunaan
program komputer khusus untuk memberikan nilai pada esai yang ditulis dalam
kerangka/setting Pendidikan[1]. Salah satu metode AES yang digunakan dalam
penelitian ini adalah metode text mining, yang merupakan variasi dari data mining yang
berusaha menemukan pola yang menarik dari sekumpulan data tekstual yang berjumlah
besar. Tujuannya adalah untuk mencari kata-kata yang dapat mewakili isi dari
dokumen sehingga dapat dilakukan analisis keterhubungan antar dokumen[2].
Salah satu teknik yang dikenal dalam data mining yaitu clustering. Pengertian
clustering dalam data mining adalah pengelompokkan sejumlah data atau objek ke
dalam cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang
semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. Sampai saat
ini, para ilmuwan masih terus melakukan berbagai usaha untuk melakukan perbaikan
model cluster dan menghitung jumlah cluster yang optimal sehingga dapat dihasilkan
cluster yang paling baik. Ada dua metode clustering yang kita kenal, yaitu hierarchical
clustering dan partitioning. Metode hierarchical clustering sendiri terdiri dari
complete linkage clustering, single linkage clustering, average linkage clustering dan
centroid linkage clustering. Sedangkan metode partitioning sendiri terdiri dari k-means
dan fuzzy k-means[3].
2
1.2. Rumusan Masalah
1. Apa metode yang digunakan dalam pengembangan sistem penilaian ujian esai
otomatis?
2. Bagaimana implementasi teknik text mining dalam sistem peniliana ujian esai
otomatis?
1.3. Tujuan
1. Metode yang digunakan dalam pengembangan sistem penilaian ujian esai
otomatis.
2. Implementasi teknik text mining dalam sistem peniliana ujian esai otomatis.
3
BAB II
PEMBAHASAN
4
A. Fase Verifikasi
1. Requirement Analysis
Ini adalah fase pertama dalam siklus pengembangan di mana persyaratan produk
dipahami dari perspektif pelanggan. Fase ini melibatkan komunikasi terperinci dengan
pelanggan untuk memahami harapannya dan persyaratan yang tepat. Ini adalah
kegiatan yang sangat penting dan perlu dikelola dengan baik, karena sebagian besar
pelanggan tidak yakin tentang apa yang sebenarnya mereka butuhkan. Perencanaan
desain pengujian penerimaan dilakukan pada tahap ini karena persyaratan bisnis dapat
digunakan sebagai input untuk pengujian penerimaan.
2. System Design
Setelah Anda memiliki persyaratan produk yang jelas dan terperinci, sekarang saatnya
untuk merancang sistem yang lengkap. Desain sistem akan memiliki pemahaman dan
perincian perangkat keras dan pengaturan komunikasi lengkap untuk produk yang
sedang dikembangkan. Rencana uji sistem dikembangkan berdasarkan desain sistem.
Melakukan ini pada tahap sebelumnya menyisakan lebih banyak waktu untuk
pelaksanaan tes yang sebenarnya nanti.
3. Architectural Design
Spesifikasi arsitektur dipahami dan dirancang dalam fase ini. Biasanya lebih dari satu
pendekatan teknis diusulkan dan berdasarkan kelayakan teknis dan finansial, keputusan
akhir diambil. Desain sistem dipecah lebih lanjut menjadi modul yang mengambil
fungsi yang berbeda. Ini juga disebut sebagai Desain Tingkat Tinggi atau High Level
Design (HLD).
Transfer data dan komunikasi antara modul internal dan dengan dunia luar (sistem lain)
dipahami dan didefinisikan dengan jelas dalam tahap ini. Dengan informasi ini, tes
integrasi dapat dirancang dan didokumentasikan selama tahap ini.
5
4. Module Design
Dalam fase ini, desain internal terperinci untuk semua modul sistem ditentukan, disebut
sebagai Low Level Design (LLD). Penting bahwa desainnya kompatibel dengan modul
lain dalam arsitektur sistem dan sistem eksternal lainnya[5]. Tes unit merupakan bagian
penting dari setiap proses pengembangan dan membantu menghilangkan kesalahan dan
kesalahan maksimum pada tahap yang sangat awal. Tes unit ini dapat dirancang pada
tahap ini berdasarkan pada desain modul internal.
5. Coding Phase
Pengkodean aktual dari modul sistem yang dirancang dalam fase desain diambil pada
fase Pengkodean. Bahasa pemrograman yang paling cocok diputuskan berdasarkan
kebutuhan sistem dan arsitektur.
B. Fase Validasi
1. Unit Testing
Tes unit dirancang dalam fase desain modul dijalankan pada kode selama fase validasi
ini. Pengujian unit adalah pengujian pada tingkat kode dan membantu menghilangkan
bug pada tahap awal, meskipun semua cacat tidak dapat diungkap oleh pengujian unit.
2. Integration Testing
Pengujian integrasi dikaitkan dengan fase desain arsitektur. Tes integrasi dilakukan
untuk menguji koeksistensi dan komunikasi modul internal dalam sistem.
6
3. System Testing
Pengujian sistem secara langsung terkait dengan fase desain sistem. Tes sistem
memeriksa seluruh fungsionalitas sistem dan komunikasi sistem yang sedang
dikembangkan dengan sistem eksternal. Sebagian besar masalah kompatibilitas
perangkat lunak dan perangkat keras dapat diungkap selama pelaksanaan pengujian
sistem ini.
4. Acceptance Testing
Pengujian penerimaan dikaitkan dengan fase analisis kebutuhan bisnis dan melibatkan
pengujian produk di lingkungan pengguna. Tes penerimaan mengungkap masalah
kompatibilitas dengan sistem lain yang tersedia di lingkungan pengguna. Ini juga
menemukan masalah non fungsional seperti beban dan cacat kinerja di lingkungan
pengguna yang sebenarnya.
1. Information Retrieval
Ini adalah langkah pertama dalam proses penambangan data. Langkah ini
melibatkan bantuan mesin pencari untuk mengetahui kumpulan teks yang juga
dikenal sebagai corpus teks yang mungkin memerlukan beberapa konversi.
7
Teks-teks ini juga harus disatukan dalam format tertentu yang akan membantu
bagi pengguna untuk memahami. Biasanya XML adalah standar untuk
penambangan teks.
3. Information Extraction
Ini adalah tahap kedua yang dilakukan untuk mengidentifikasi makna mark-up
teks tertentu. Pada tahap ini, metadata ditambahkan ke database atribut teks.
Hal Ini juga melibatkan penambahan nama atau lokasi ke teks. Langkah ini
memungkinkan mesin pencari untuk mendapatkan informasi dan mencari tahu
hubungan antara teks menggunakan metadata mereka.
4. Text mining
Tahap terakhir adalah penambangan data menggunakan tools/teknik yang
berbeda. Langkah ini dilakukan untuk menemukan kesamaan antara informasi
yang memiliki arti yang sama yang akan sulit ditemukan. Penambangan teks
adalah alat yang meningkatkan proses penelitian dan membantu pengujian
query[7]. Dalam kasus ini, teknik yang digunakan untuk melakukan text mining
pada sistem ujian esai berbasis web adalah teknik hierarchical clustering.
Hierarchical clustering dimulai dengan memperlakukan setiap pengamatan
sebagai kelompok yang terpisah. Kemudian, ia berulang kali mengeksekusi dua
langkah berikut: (1) mengidentifikasi dua cluster yang berdekatan, dan (2)
menggabungkan dua cluster yang paling mirip. Hal ini terus berlanjut sampai
semua cluster bergabung bersama. Hal ini diilustrasikan dalam gambar di
bawah ini.
8
Gambar 2 proses clustering dengan menggabungkan 2 cluster yang saling berdekatan
9
cluster (hubungan tunggal), dua bit yang paling mirip dari sebuah cluster
(hubungan lengkap), pusat dari cluster (hubungan rata-rata), atau beberapa
kriteria lain.
Seperti halnya metrik jarak, pilihan kriteria keterkaitan/ linkage criteria harus
dibuat berdasarkan pertimbangan teoretis dari domain aplikasi[9]. Masalah
teoritis utama adalah apa yang menyebabkan variasi. Dalam kasus ini, metode
lingkage criteria yang digunakan adalah metode Ward, yang menentukan
pengamatan mana yang dikelompokkan berdasarkan pengurangan jumlah jarak
kuadrat dari setiap pengamatan dari pengamatan rata-rata dalam sebuah
cluster[10]. Hasilnya sering tepat karena konsep jarak ini cocok dengan asumsi
standar tentang bagaimana menghitung perbedaan antara kelompok dalam
statistik (mis., ANOVA, MANOVA).
10
BAB III
PENUTUP
3.1. Kesimpulan
Proses penilaian ujian esai menggunakan text mining memakan lebih sedikit waktu
ketimbang penilaian esai secara manual. Hal ini dikarenakan jawaban akan langsung
dicocokkan dengan kunci jawaban secara otomatis. Sistem ujian yang dirancang
merupakan sistem berbasis web yang didesain sangat sederhana agar dapat
memudahkan siswa atau pengguna dalam mengoperasikannya.
Teknik text mining yang diajukan menggunakan teknik hierarchical clustering. Setelah
dilakukan pengambilan informasi, pengolahan Bahasa natural, dan ekstraksi informasi,
sistem akan mengelompokkan informasi menjadi cluster-cluster kecil. Kemudian,
cluster yang berdekatan akan digabungkan menjadi satu cluster baru. Proses ini terus
berlanjut hingga seluruh cluster menyatu, sehingga menghasilkan dendogram dan pada
akhirnya dapat dihitung jarak cluster(persamaan) dan kriteria keterkaitan antar cluster.
11
DAFTAR PUSTAKA
[7] N. Zhong, Y. Li, and S. T. Wu, “Effective pattern discovery for text mining,”
IEEE Trans. Knowl. Data Eng., vol. 24, no. 1, pp. 30–44, 2012.
[8] P. Li, F. Liu, and E. Z. Zhu, “MSTI: A New Clustering Validity Index for
Hierarchical Clustering,” in Proceedings - 2018 4th Annual International
Conference on Network and Information Systems for Computers, ICNISC
2018, 2018, pp. 208–212.
12
[9] T. Matsumoto, W. Sunayama, Y. Hatanaka, and K. Ogohara, “Data Analysis
Support by Combining Data Mining and Text Mining,” in Proceedings - 2017
6th IIAI International Congress on Advanced Applied Informatics, IIAI-AAI
2017, 2017, pp. 313–318.
13