Anda di halaman 1dari 13

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Lihat diskusi, statistik, dan profil penulis untuk publikasi ini di:https://www.researchgate.net/publication/350085135

Penelusuran Dokumen Hasil Uji EPPS Menggunakan Metode Indexing

Artikeldi dalamIOP Conference Series Material Science and Engineering · Februari 2021
DOI: 10.1088/1757-899X/1077/1/012032

KUTIPAN BACA
0 69

2 penulis, termasuk:

Kahfiara Krisna
Universitas Gadjah Mada

1PUBLIKASI0KUTIPAN

LIHAT PROFIL

Semua konten yang mengikuti halaman ini diunggah olehKahfiara Krisnapada 19 Juli 2022.

Pengguna telah meminta peningkatan file yang diunduh.


Seri Konferensi IOP: Ilmu dan Teknik Material

KERTAS •AKSES TERBUKA Anda mungkin juga suka

- Pembelajaran mesin dalam aliran pasien:


Penelusuran Dokumen Hasil Uji EPPS Menggunakan ulasan Rasheed El-Bouri, Thomas Taylor,
Alexey Youssef dkk.
Metode Indexing - Model berbasis perfusi CT memprediksi hasil
pada pasien stroke saat bangun yang diobati
dengan aktivator plasminogen jaringan
Mengutip artikel ini: Kahfiara Krisna dan Sri Mulyati 2021Konferensi TIO Ser.: Ibu. Sains. Eng.1077 rekombinan
012032 Miloš Ajevi, Giovanni Furlanis, Alex Buoite
Stella dkk.

- Investigasi Numerik Tekanan Fluktuasi dan


Kavitasi di dalam Tabung Draft Turbin
Francis dengan Penerimaan Udara melalui
Lihatartikel daring untuk pembaruan dan penyempurnaan. Sirip
Ruizhi Zhang, An Yu, Michihiro Nishi dkk.

Konten ini diunduh dari alamat IP 119.12.179.219 pada 19/07/2022 pukul 09:06
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

Penelusuran Dokumen Hasil Uji EPPS Menggunakan Metode


Indexing

Kahfiara Krisna1, Sri Mulyati2


Jurusan Informatika Universitas Islam Indonesia, Yogyakarta

Surel:116523234@students.uii.ac.id ,2mulya@uii.ac.id

Abstrak.Studi ini berfokus pada pencarian dokumen hasil tes EPPS, terutama yang diselenggarakan di sektor
pendidikan untuk menyeleksi calon mahasiswa dalam proses penerimaan perguruan tinggi. Telah terjadi
peningkatan yang cukup besar dari data penerimaan seiring dengan diadakannya tes penerimaan setiap
tahun untuk calon siswa di setiap awal tahun akademik. Beberapa fakultas dapat menyelenggarakan tes
EPPS pada tes penerimaan tahap kedua setelah calon mahasiswa lulus tahap pertama selain mengikuti tes
penerimaan umum. Berbagai pengujian ini menyebabkan akumulasi data yang sangat besar dengan
informasi yang berbeda-beda, sehingga menyulitkan penyelenggara untuk menemukan dokumen yang
berisi 15 aspek informasi yang dibutuhkan dalam tampilan informasi yang komprehensif. Dengan demikian,
perlu diterapkan suatu metode pengindeksan dengan memiliki indeks yang telah ditentukan sebelumnya
untuk mengambil informasi yang diperlukan dalam suatu dokumen tertentu atau untuk mencari dokumen
lain yang terkait dengan cara pengindeksan. Penelitian ini menggunakan 74 dokumen pdf sebagai dataset.
Secara khusus, 60 dataset digunakan sebagai referensi untuk mengambil frase pada data tertentu, dan 14
dataset digunakan untuk menguji data. Hasilnya mengungkapkan data yang paling signifikan dengan rata-
rata presisi 0,89, recall 0,93 dan f-measure 0,91.

Kata kunci:metode pengindeksan, dokumen, pencarian

1. Perkenalan
Administrator tes psikologi memiliki beberapa dokumen yang disimpan dalam direktori
komputer. Salah satu dokumen yang disimpan adalah hasil tes EPPS. jumlah dokumen hasil tes
sesuai dengan jumlah peserta yang menyelesaikan tes. Tes EPPS (Edward Personal Preference
Schedule) adalah tes psikologis yang dilakukan oleh peserta tes individu atau oleh organisasi.
Tes EPPS banyak digunakan di sektor pendidikan, terutama untuk menyeleksi calon mahasiswa
masuk perguruan tinggi. Biasanya, file hasil tes EPPS akan disimpan sebagai dokumen pdf yang
berisi matriks psikogram dan hasil akhir kinerja peserta tes.
Saat tahun ajaran baru dimulai, banyak sekali calon mahasiswa yang mendaftar masuk universitas
berdasarkan jurusan yang mereka inginkan. Penerimaan data pelamar yang tidak terhitung jumlahnya beserta
hasil tes EPPS mereka akan menghasilkan tumpukan data yang sangat besar yang membutuhkan penyimpanan
data yang besar di setiap periode tes. Mengingat banyaknya data calon pendaftar baru dan informasi baru, sulit
bagi penyelenggara untuk memberikan hasil seleksi yang akurat kepada calon mahasiswa. Tampilan data yang
tidak efektif dan tidak lengkap mengharuskan pihak penyelenggara menyaring kembali sejumlah dokumen dan
mencari hasil pencarian tertentu sesuai dengan penilaian yang telah ditentukan. Apalagi kondisi ini diperparah
dengan tidak adanya data rekaman yang dapat menampilkan informasi baru

Konten dari karya ini dapat digunakan berdasarkan persyaratan dariLisensi Creative Commons Attribution 3.0. Setiap distribusi lebih lanjut dari
karya ini harus mempertahankan atribusi kepada penulis dan judul karya, kutipan jurnal dan DOI.
Diterbitkan di bawah lisensi oleh IOP Publishing Ltd 1
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

menurut data yang ada dalam penyajian yang lebih efisien agar mudah dipahami baik oleh ahli maupun penyelenggara,
yang masih menjadi kendala saat ini. Pada waktu-waktu tertentu juga sulit untuk menemukan dokumen tertentu yang
berisi kata-kata yang diperlukan. Satu-satunya cara untuk menemukan informasi tertentu dari kumpulan dokumen
adalah dengan mencari kata-kata serupa yang terdapat dalam sebuah dokumen. Proses ini biasanya dilakukan secara
manual yang tentunya memakan waktu lama, terutama bila ada kebutuhan untuk mencari dokumen tertentu dalam
jumlah banyak.
Mencari dokumen tertentu melalui metode indeks membantu menemukan indeks yang berisi aspek yang
diperlukan dari hasil tes EPPS dan menemukan indeks kata yang dicari dalam dokumen. Pengklasifikasian
dokumen berdasarkan kesamaannya dapat dilakukan melalui metode pengindeksan kata dari sekumpulan
dokumen. Proses pengindeksan bertujuan untuk mengubah dokumen yang tidak terstruktur menjadi dokumen
terstruktur untuk memudahkan proses pencarian indeks kata yang diperlukan dan dengan demikian dapat
menampilkan dokumen tersebut [1].
Berdasarkan penjelasan di atas, penelitian ini bertujuan untuk mengusulkan suatu metode untuk
memudahkan penyelenggara dalam mencari data yang dibutuhkan dan menyaring jumlah pelamar potensial
dengan mencari informasi penting dan dibutuhkan dari kesimpulan tes psikologi EPPS menggunakan aspek
kebutuhan yang telah ditentukan dan dengan menemukan posisi dokumen yang disimpan. Penelitian ini
ditujukan bagi siswa SMA jurusan IPA yang akan mendaftar ke Fakultas Kedokteran UII.
Oleh karena itu, peneliti mencoba mengusulkan metode pengindeksan sebagai cara yang efisien untuk mencari
informasi dan kesamaan dokumen untuk menemukan informasi yang sesuai mengenai aspek-aspek yang diperlukan
yang terkandung dalam kesimpulan tes EPPS dan untuk mencari kesamaan data yang direkam dengan informasi data
baru. untuk mendapatkan hasil yang setinggi-tingginya berdasarkan aspek-aspek yang dibutuhkan oleh penyelenggara.
Sistem ini, kamus atau arti yang terkait dengan aspek kebutuhan dikembangkan dalam alat ukur yang digunakan
sehingga pencarian dapat spesifik dengan isi dokumen dalam direktori referensi. Penelitian ini dirumuskan untuk
menjawab pertanyaan penelitian sebagai berikut, (1) bagaimana menemukan dan menampilkan informasi yang
terkandung dalam matriks hasil tes EPPS psikogram untuk memudahkan pencarian kebutuhan yang diinginkan?

Makalah ini ditulis berdasarkan struktur makalah penelitian sebagai berikut: latar belakang,
tinjauan karya terkait (literatur), metodologi penelitian, hasil dan pembahasan, dan kesimpulan
penelitian ini.

2. Tinjauan Pustaka
Metode pengindeksan adalah proses menemukan informasi dari database dokumen yang besar dan tidak terstruktur sebagai
tanggapan atas permintaan yang diperlukan [2]. Proses indexing dilakukan untuk menampilkan informasi yang diinginkan dalam
database dengan mengorganisir kumpulan dokumen yang tidak terorganisir menjadi dokumen yang lebih terstruktur untuk
memudahkan pengambilan dan pencarian dokumen berdasarkan informasi yang terkandung dalam dokumen yang dibutuhkan
[3].
Penelitian ini membahas tentang tes EPPS (Edward Personal Preference Schedule) sebagai salah satu bentuk
tes kepribadian yang terdiri dari beberapa pilihan jawaban yang akan dipilih individu sesuai dengan pertanyaan
yang tersedia. Tes ini bertujuan untuk mengetahui kebutuhan pribadi yang mencerminkan kepribadian individu
[4]. Tes ini dikembangkan oleh Allen L. Edward dengan meminta kita memilih lima belas aspek yang diperlukan
dari dua puluh poin yang disusun yang mengacu pada konsep kepribadian Murray. Tes kepribadian ini berisi 225
soal yaitu yang memaksa, objektif dan non proyektif. Tes EPPS diberikan untuk mengamati kebutuhan spesifik
individu melalui 15 aspek yang diperlukan [5].
Sudah ada beberapa peneliti sebelumnya yang mengangkat topik ini sebagai referensi penelitian ini.
Penelitian pertama membahas penggunaan metode indexing dalam proses pencarian dokumen yang dihasilkan
dari hasil pencarian manual. Keuntungan dari index retrieval terletak pada penyimpanan data terstruktur untuk
menyimpan berbagai dokumen dalam jumlah besar. Proses pencarian dilakukan dengan membuat indeks kata
dari dokumen [1].
Kajian kedua mengangkat topik tentang pencarian dokumen teks arsip surat dengan menggunakan metode
indexing dan query. Penelitian ini membahas proses pemulihan informasi dengan indeks agar dokumen dapat
diambil kembali saat dibutuhkan dan dapat ditemukan dengan mudah. Itu juga menggunakan indeks

2
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

metode untuk mengambil indeks yang telah terdaftar di database untuk mencari kalimat yang diinginkan. Dengan
pengolahan yang lebih detail pada proses pengembangan query, pengelompokan kata dapat diringkas dengan lebih
sederhana [2].
Penelitian ketiga berjudul “Ekstraksi Kata Kunci Dokumen Tunggal dalam Bahasa Indonesia
Menggunakan Frase Chunking” [6]. Penelitian ini membahas tentang pembentukan kata kunci dari
dokumen secara otomatis dengan menggunakan frase concatenation. Pemotongan frasa dilakukan dengan
menggunakan pola Part of Speech (POS) untuk mengekstrak frasa dan kata kunci. Kata kunci dipilih dari
kandidat berdasarkan jumlah kata dalam frase dan beberapa jenis bentuk data frase. Kata kunci terpendek
dengan string yang dikurangi diekstraksi dari abstrak dan diurutkan berdasarkan nilai frekuensi tertinggi.
Penelitian ini melakukan eksperimen dengan menggunakan jenis frase seperti sumber kata kunci yang
berbeda, variasi pola frase dan memberikan perbandingan kinerja antara jenis frase.
Penelitian keempat membahas penggunaan pendekatan retrieval sebagai solusi untuk masalah yang ada dengan
mengandalkan konsep daripada kata kunci untuk pengindeksan dan retrieval. Ini bertujuan untuk mengambil dokumen
yang relevan dengan permintaan pengguna tertentu. Pengindeksan dan pembobotan dokumen dan kueri dilakukan
dengan menggunakan entitas semantik, konsep, dan kata kunci. Dalam pendekatan ini, konsep-konsep diidentifikasi dari
dokumen dan diukur menurut distribusi frekuensinya dan kemiripannya dengan konsep lain dalam dokumen [7].

Teknik yang digunakan untuk dokumen teks banyak digunakan dengan teknik IR (Indexing and Retrieval). Tujuan
dari sistem IR adalah untuk mengambil materi yang relevan dari database dokumen sebagai tanggapan atas permintaan
[8]. Kelima penelitian tersebut membahas tentang perancangan sistem temu kembali informasi dengan menggunakan
Vector Space Model dalam tracking dan juga pengukuran kesamaan Cosine Similarity sebagai metode untuk meranking
dokumen yang ditemukan sesuai dengan kata kunci/query[9]

3. Metodologi Penelitian
Kami mengusulkan teknik ekstraksi kata kunci otomatis menggunakan frase dalam dokumen berbahasa Indonesia.
Gambar 1 menunjukkan metodologi penelitian ini.

Gambar 1.Metodologi Penelitian

3.1. Konversi Dokumen


Pada tahap ini, hasil psikotes calon pelamar dikumpulkan dalam satu folder EPPS dalam bentuk pdf.
Dokumen tersebut akan menjadi data input untuk diproses lebih lanjut. Hasil tes EPPS berisi dua paragraf
kalimat yang berkaitan dengan aspek yang paling dan paling tidak dibutuhkan pelamar. Data hasil
pengujian EPPS akan diambil dengan mengindeks paragraf “deskripsi” yang muncul pada dokumen dan
akan diproses lebih lanjut melalui proses preprocessing.

3.2. Preprocessing
Preprocessing merupakan proses tahap awal yang dipersiapkan untuk melakukan pengolahan lebih lanjut
terhadap teks pada data sebelum melalui proses indexing. Proses pada tahap preprocessing ini hanya
meliputi beberapa langkah yaitu casefolding (mengubah huruf depan menjadi huruf kecil) dan tokenizing
(memisahkan setiap kata menjadi satu baris saja). Hasil preprocessing nantinya akan disimpan dan

3
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

dikonversi ke file csv. File CSV adalah hasil dari proses konversi dokumen dan preprocessing
dari hasil tes EPPS.

3.3. Pisahkan Data


Pada tahap ini dataset dibagi secara acak menjadi data latih dan data uji dengan perbandingan 80% : 20%.
Data latih akan digunakan sebagai sumber pembentukan daftar frase dan label, yang nantinya akan
dicocokkan dengan dokumen. Sedangkan data uji berguna untuk mencari kejadian dengan nilai yang mirip
dengan data yang direkam.

3.4. Pelabelan Manual


Pada titik ini, file csv yang dikonversi akan berisi tabel "frasa" dan "label". Tabel-tabel sudah diisi oleh frase-
frase oleh sistem dari hasil konversi, sedangkan tabel label masih dibiarkan kosong sehingga perlu
dilakukan pelabelan secara manual oleh peneliti. Label akan dimasukkan secara manual berdasarkan
singkatan nama aspek kebutuhan. Frasa yang diberi label berisi inisial “other” atau “O” jika terdapat frasa
yang tidak terkait dengan label dan inisial dari 15 aspek kebutuhan jika frasa tersebut ada hubungannya
dengan label.

Gambar 2.Proses Identifikasi Informasi

3.5. Formasi Daftar Frasa


Pada tahap ini, data latih yang diberi label akan mengambil indeks dari setiap kata yang berisi frasa dengan
inisial selain "lainnya" untuk memisahkan frasa yang akan disimpan dalam file csv baru bernama
"phrase_list.csv". Frasa mengambil setiap pasangan frasa dan label yang telah diinput secara manual oleh
pakar. Frasa dalam daftar frasa akan diurutkan secara acak berdasarkan kata panjang dan pendek yang
diberi label oleh peneliti dalam proses pelabelan manual. Dalam proses pelabelan manual, penulis
memberi label pada tiga atau lebih kata/token pada file, yang akan muncul di bagian atas daftar.
Sebaliknya, kata-kata dengan label lebih sedikit akan muncul di baris paling bawah dari daftar frasa.

3.6. Identifikasi Informasi

4
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

Dalam penelitian ini, metode pengindeksan kata digunakan untuk mencari informasi terkait calon pelamar.
Informasi yang ditemukan adalah label pada setiap file. Pada tahap ini, sistem akan mengidentifikasi frasa
dengan mencocokkan label yang ditentukan dalam daftar_frasa. Untuk melakukan proses tersebut diperlukan
data uji untuk mengetahui kesesuaian model yang dibuat untuk mencari informasi yang muncul beserta nama-
nama aspek kebutuhan. Proses tersebut diidentifikasi berdasarkan kata “tetapi” setelah kalimat, yang akan
membuat sistem mengklasifikasikan kalimat tertentu sebagai kebutuhan tertinggi (most prioriored need) dan
kebutuhan terendah (least priority need). Setelah itu, sistem akan memeriksa indeks berdasarkan frasa apa saja
yang muncul di dokumen untuk mengidentifikasi kalimat yang mengacu pada label pada daftar_frasa. Keluaran
akan memberikan gambaran frase dan label yang muncul pada setiap file beserta label dan ringkasan aspek
kebutuhan yang keluar dari file tersebut. Hasil txt disimpan di folder yang berbeda dengan folder dokumen.
Gambar 2 menunjukkan proses identifikasi informasi.

3.7. Pencarian Dokumen


Setelah hasil pencarian aspek kebutuhan yang diinginkan diketahui pada tahap ini, maka hasil tersebut akan menjadi
acuan untuk melihat calon pendaftar FK UII yang memiliki kebutuhan tertinggi pada aspek tersebut. Pencarian dokumen
dapat memudahkan pihak penyelenggara untuk menemukan dokumen calon pelamar FK UII berdasarkan 15 kebutuhan
yang diinginkan sebagai komponen penilaian selanjutnya. Misalnya, sistem dapat mengenali kebutuhan "ACH" sebagai
kebutuhan tertinggi, dan dengan demikian sistem akan menampilkan data pelamar mana yang memiliki kebutuhan
tertinggi untuk aspek kebutuhan tersebut. gambar 3 menunjukkan proses pencarian dokumen

Gambar 3.Proses pencarian dokumen

3.8. Evaluasi
Selanjutnya untuk melakukan pengujian model, diperlukan data asli dan data baru yang akan diuji untuk
mendapatkan nilai derajat yang sama. Setelah mendapatkan dokumen yang berisi informasi yang relevan, data
uji akan mengevaluasi data asli terhadap data baru dengan mencari nilai derajat yang sama. Kemudian, akan
dievaluasi setiap jenis bentuk frase berdasarkan presisi, daya ingat, dan f-ukurannya. Data yang akan digunakan
sebagai data uji berjumlah 20% dari keseluruhan data, yaitu sebesar 0,20.

5
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

4. Hasil
Penelitian sebelumnya menunjukkan metode pengindeksan sebagai metode yang cocok untuk memecahkan masalah
dalam pencarian dokumen. Tahap pemodelan data yang diperoleh bertujuan untuk menghasilkan sistem yang mampu
mengidentifikasi setiap kata yang muncul terkait dengan 15 aspek kebutuhan yang telah ditentukan dan memberikan
informasi aspek kebutuhan mana yang muncul pada akhir pengujian EPPS. Untuk membantu pembuatan model ini,
peneliti menggunakan bahasa pemrograman python3 melalui terminal dan IDE Visual Code.

Dijelaskan pada formula 3.1 akan dilakukan proses konversi dokumen hasil tes EPPS yang disimpan
dalam bentuk file pdf menjadi file csv yang mengambil paragraf pada indeks “deskripsi”. Sebelum
mengubah data menjadi file CSV, data teks dikonversi ke format txt untuk mendapatkan semua teks dalam
file PDF. Proses konversi dokumen membutuhkan proses preprocessing casefolding menggunakan fungsi
text.lower() dan tokenization menggunakan fungsi word_tokenize. Keluaran salah satu dari 74 dokumen
yang dikonversi menjadi dokumen dan preprocessing disajikan pada gambar 4.

Gambar 4.Output dari konversi dokumen

Setelah mendapatkan dokumen hasil konversi, 74 dokumen tersebut akan dipecah menjadi dua
bagian, yaitu data latih dan data uji dengan rasio default 20% dari data latih. Data latih dan data uji
yang telah dikonversi akan diberi label secara manual oleh peneliti dengan melihat beberapa kriteria
dari aspek persyaratan pada tes EPPS. Pelabelan dilakukan langsung dari file csv setiap dokumen.
Kriteria aspek kebutuhan beserta kata kunci disajikan pada Tabel 1.
Selanjutnya pada proses yang dijelaskan pada formula 3.4, teks pada “description” dipisahkan dan disimpan
dalam bentuk csv “phrase_list” dengan tabel yang berisi pasangan antara frase dan label. Proses penyortiran
menggunakan fungsi “diurutkan” untuk mengurutkan frasa yang diberi label oleh pengarang. Frasa dalam
daftar_frasa akan diurutkan berdasarkan frasa yang diberi label dengan tiga atau dua kata atau hanya satu kata
sehingga disimpan menurut kata terpanjang dan terpendek yang dimasukkan oleh penulis. Daftar frasa daftar
dapat dilihat pada Gambar 5.

6
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

Tabel 1.Aspek kebutuhan dan kata kunci.

Aspek Kebutuhan Kata kunci

Prestasi (ACH) Memperoleh sesuatu, mencapai prestasi, mencapai,


berprestasi, meraih sesuatu.
Kehormatan (DEF) menyesuaikan diri, mengikuti aturan, patuh
terhadap aturan.
Pesan (ORD) org hidup, barang,ide, keteraturan, sistematis.
Pameran (EXH) Mengekspresikan diri, percaya diri, yakin
dengan kemampuan.
Otonomi (AUT) Mandiri, tidak tergantung, penilaian/pendapat,
tergantung pada orang.

Afiliasi (AFF) Memberikan perhatian, pergaulan harmonis,


lingkungan sosial, menaruh perhatian, berinteraksi

Intrasepsi (INT) Berempati, bersimpati, peka, memahami,


merasakan, memahami orang.
Bantuan (SUC) Dimanjakan, diperhatikan, diurus

Dominasi (DOM) Mendominasi, mendominasi, mempengaruhi, mengatur


orang, menonjolkan diri, ketua kelompok.

Abasement (ABS) Mengakui kesalahan, merasa bersalah,


menyalahkan diri sendiri

Pemeliharaan (NUR) Menolong, merawat orang/benda, menjaga barang,


merawat orang.

Ubah (CHG) Melakukan perubahan, menghindari rutinitas, sesuatu


yang tetap.

Ketahanan (AKHIR) Menyelesaikan pekerjaan, ketekunan, keuletan,


kegigihan, ketahanan, teratur.

Heteroseksual (HET) Seksual, mengikuti pendapat

Agresi (AGG) Mendobrak, berperilaku agresif

4.1. Identifikasi Informasi


Dalam proses identifikasi informasi, sistem akan menampilkan makna yang terkandung dalam
psikogram tes EPPS untuk memudahkan mengetahui aspek kebutuhan mana yang muncul dalam
kesimpulan tes EPPS calon pelamar. Proses identifikasi informasi kita perlu mencari indeks untuk
memisahkan paragraf yang menggambarkan kebutuhan tertinggi dan terendah. Dalam hal ini, kata
yang membedakan kebutuhan tertinggi dan terendah adalah kata “namun” di awal kalimat.

Beberapa karakter yang muncul juga akan diganti menggunakan regular expression library di python.
Gambar 6 menunjukkan output dari informasi identifikasi berdasarkan phrase_list.csv. Frasa “Kebutuhan
tertinggi” menampilkan daftar frasa yang berisi kebutuhan tertinggi hasil tes EPPS, sedangkan frasa
“Kebutuhan terendah” menampilkan daftar frasa yang berisi kebutuhan terendah pelamar. Daftar frasa
menunjukkan informasi tentang frasa dan label yang ditulis dalam kalimat penutup tes EPPS

7
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

hasil. “Aspek kebutuhan” yang terdapat pada output ini menunjukkan secara singkat aspek kebutuhan berdasarkan frase
indeks dan label yang telah ditentukan.

Gambar 5.Daftar_frasa

Gambar 6.Contoh dokumen hasil proses identifikasi informasi

8
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

4.2. Pencarian Dokumen


Setelah sistem menemukan dan mengidentifikasi informasi, maka akan lebih mudah bagi kita untuk mencari
dokumen melalui aspek kebutuhan yang tertera pada hasil setiap dokumen yang teridentifikasi pada proses
sebelumnya. Pencarian dokumen ini dapat dilakukan setiap kali seorang pengguna ingin mencari suatu informasi
dari beberapa dokumen berdasarkan 15 aspek kebutuhan yang diinginkan. Jika pengguna membutuhkan
pencarian "ACH" dan "DEF", sistem akan secara acak mencari dokumen yang berisi kata-kata tersebut sebagai
aspek kebutuhan tertinggi sesuai dengan hasil yang diinginkan. Gambar 7 menunjukkan hasil proses pencarian
dokumen dengan menggunakan label "ACH" dan "DEF" yang diinginkan yang dapat disimpan dalam bentuk file
txt sesuai kebutuhan ahli.

Gambar 7.Hasil implementasi file berdasarkan aspek kebutuhan “ACH” dan “DEF”

4.3. Evaluasi
Tahap selanjutnya adalah menguji dan mengevaluasi data uji dengan data asli pada sistem untuk mencari
kemunculan nilai derajat yang mirip. Itu menunjukkan 14 data uji yang telah dipecah sebelumnya dalam
proses 3.2. Dalam evaluasi ini digunakan precision, recall, dan f-measure sebagai bentuk evaluasi sistem.
Hasil akhir pengujian model dihasilkan dari perhitungan nilai rata-rata setiap dokumen yang ditunjukkan
padaMeja 2.

Meja 2.Rata-rata per dokumen


Presisi Mengingat F-Ukur
Berarti 0,89 0,93 0,91

Tabel 2 menampilkan rata-rata hasil evaluasi dengan menggunakan berbagai jenis bentuk frase. Pencarian ini
mendapatkan hasil terbaik dari semua jenis bentuk frase yang direduksi dengan nilai f-measure sebesar 0,97 untuk
semua data. Hasil pengujian di atas tidak mengandung aspek akurasi karena akurasi lebih sesuai untuk distribusi kelas,
sedangkan f-measure merupakan metrik yang lebih baik untuk kasus dengan ketidakseimbangan dalam mengevaluasi
model.

5. Diskusi
Pada penelitian ini sistem dirancang dengan menggunakan metode indexing berdasarkan daftar frase yang
peneliti buat untuk mendapatkan informasi dalam teks “deskripsi” hasil tes EPPS. Berdasarkan tinjauan pustaka,
metode pengindeksan dalam penelitian ini dilakukan dengan menambahkan daftar frasa sebagai kamus

9
ICITDA 2020 Penerbitan TIO
Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

untuk membantu mengidentifikasi informasi dan untuk mengetahui dokumen mana yang dibutuhkan oleh
penyelenggara. Gambar 3 menampilkan 60 daftar frase yang terbentuk. Pembentukan daftar frasa dilakukan
dengan melihat contoh kasus pemotongan frasa dan pengenalan entitas nama, dimana jenis pemotongan
didasarkan pada tag frasa yang digunakan pada pohon parse dan nama tag frasa serta metode pengklasifikasian
frasa teks dengan aturan tertentu berdasarkan kelas kata. (POS) [10], [11].
Metode pengindeksan memperoleh hasil yang cukup baik karena hanya menggunakan sedikit data. Hasil ini
diperoleh dari daftar frase yang teridentifikasi, yang digunakan sebagai referensi. Hasilnya, sistem dapat mencocokkan
informasi yang muncul pada teks “deskripsi” tes EPPS dengan menghasilkan frase dan label beserta aspek kebutuhan
yang muncul untuk memudahkan pengguna dalam membaca informasi tersebut. Namun, metode tersebut masih
terkendala ketika harus menangani data dalam jumlah besar karena akan membutuhkan pembaruan menyeluruh untuk
memeriksa keakuratan pelabelan manual. Namun demikian, karena kasus ini menggunakan pelabelan manual, maka
perlu ditambahkan sistem yang diperbarui untuk memeriksa kinerja sistem agar tidak terjadi kesalahan pada data yang
diinput. Oleh karena itu, sangat penting bagi seorang ahli di bidang ini untuk melakukan pelabelan manual untuk
menghindari informasi yang salah.
Dalam hal ini, sistem tidak fokus pada penggunaan stopword removal, tetapi pada penghapusan kata “other” yang
terdapat pada dokumen yang telah diberi label “O” secara manual untuk membuat daftar frase atau phrase_list.
Pengembangan stopword removal merupakan topik yang cukup besar untuk penelitian masa depan untuk memastikan
apakah itu harus digunakan atau tidak. Dalam evaluasi, hasil tidak diperhitungkan dalam perhitungan akurasi karena
dalam hasil pencarian akurasi akan mendekati 100% atau hasil “True Negative” yang memiliki nilai tak terhingga
walaupun pada kenyataannya hasilnya justru sebaliknya. Beberapa contoh yang ada, seperti yang ditunjukkan oleh TN,
berisi kata-kata yang tidak dapat diidentifikasi dan tidak boleh diidentifikasi, tetapi tetap dihitung menggunakan rumus
akurasi yang menghasilkan hasil mendekati 100%.

6. Kesimpulan
Berdasarkan tahapan awal hingga akhir penelitian, dapat disimpulkan bahwa metode
mengidentifikasi informasi melalui proses pengindeksan merupakan metode yang dapat diterapkan.
Metode ini dapat digunakan untuk mencari informasi terkait aspek kebutuhan yang dibutuhkan oleh
tes terstruktur EPPS untuk calon pelamar, karena dapat mencari informasi dengan mengacu pada
informasi yang diidentifikasi dalam daftar frase. Perhitungan f-measure diperoleh hasil 0,91, presisi
0,89, dan recall 0,93.
Namun cara tersebut tidak menjadi tolak ukur untuk membuat sistem yang baik, karena masih membutuhkan pembaharuan
dan pengembangan lebih lanjut. Oleh karena itu, diharapkan adanya penelitian selanjutnya untuk mengembangkan penelitian
saat ini dengan beberapa elemen yang diperbaiki seperti dengan memperbanyak jumlah dataset dan memperbaharui daftar
frase secara terus menerus agar mendapatkan hasil yang lebih baik. Penting juga untuk mengembangkan penelitian saat ini
dengan terus-menerus memeriksa dan mengoreksi kata kunci dalam file PDF yang dikonversi. Perkembangan lain yang mungkin
dapat berupa penggunaan metode lain yang lebih cocok dari metode pengindeksan.

Referensi
[1] Hidayat W 2013Indexing and Retrieval Engine untuk Dokumen Berbahasa Indonesia dengan
Menggunakan Inverted Index
[2] Heriyanto 2015 Pencarian dokumen teks arsip suratSeminar Nasional Informatika (SEMNASIF)
hal 173–7
[3] Broder AZ, Eiron N, Fontoura M, Herscovici M, Lempel R, McPherson J, Qi R dan Shekita E 2006
Pengindeksan Konten bersama dalam sistem pencarian informasiKemajuan Teknologi
Database - EDBT 2006. Catatan Kuliah EDBT 2006 Ilmu Komputervol 3896 ed Y Ioannidisdkk (
Berlin, Heidelberg: Springer) hal 313–30
[4] Lubin B, Larsen RM, Matarazzo JD dan Seever M 1985 Pola penggunaan tes psikologi di
lima pengaturan profesionalPsikolog Amerika40(7)hal 857–61
[5] Piedmont RL dan Costa P 1992 Penilaian jadwal preferensi pribadi Edwards
dari perspektif model lima faktorJ. Penilaian Kepribadianvol58no 1 hal

10
TACSaya
Saya
STATS NHai P weSaya
l Bkamu V

ICITDA 2020 Penerbitan TIO


Konferensi TIO Seri: Ilmu dan Teknik Material 1077 (2021) 012032 doi:10.1088/1757-899X/1077/1/012032

67–78
[6] Trisna Polri dan Nurwidyantoro A 2020 Ekstraksi kata kunci dokumen tunggal dalam bahasa Indonesia
Indonesia menggunakan frase chunkingTelekomunikasi, Komputasi, Elektronika dan Kontrol
(TELKOMNIKA)18hal 1917–25
[7] Boubekeur F dan Azzoug W 2013 Pengindeksan berbasis konsep dalam temu kembali informasi teksInt. J. dari
Ilmu Komputer & Teknologi Informasi. (IJCSIT)vol5no 1 hal 119–36
[8] Lu Guajun 1999Sistem Manajemen Basis Data Multimedia (London: Artech House, Inc)
[9] Bakala N 2019 Sistem temu kembali informasi dengan menggunakan model ruang vektorInt. J. Ilmiah dan
Teknologi. Risetvol8terbitan 10 hal 1563–8
[10] Yang J 2004 Frase chunking untuk penguraian yang efisien dalam terjemahan mesinMICAI 2004:
Kemajuan dalam Kecerdasan Buatan, MICAI 2004, Catatan Kuliah Ilmu Komputervol 2972R
Monroy Rdkk (Berlin, Heidelberg: Springer) hal 478–87
[11] Arman AA , Putra ABN, Purwarianti A dan Kuspriyanto 2013 Pemotongan frase sintaksis untuk
Bahasa IndoProcedia Technol.11hal 635–40

11

Anda mungkin juga menyukai