Anda di halaman 1dari 6

JURNAL TEKNIK INFORMATIKA VOL. 8 NO.

2, OKTOBER 2015 1

IMPLEMENTASI NATURAL LANGUAGE PROCESSING DALAM PENGUKURAN


KETEPATAN EJAAN YANG DISEMPURNAKAN (EYD) PADA ABSTRAK SKRIPSI
MENGGUNAKAN ALGORITMA FUZZY LOGIC
Nisa Kurniasih Wangsanegara1, Beki Subaeki2
1,2
Jurusan Teknik Informatika, Fakultas Sains dan Teknologi
UIN Sunan Gunung Djati Bandung
Email : nisawangsa@gmail.com, beki807@gmail.com

ABSTRAK

Ejaan yang Disempurnakan merupakan salah satu aspek penting dalam penulisan suatu
dokumen. Penggunaan ejaan harus sesuai dengan yang tertera pada aturan baku yang
dikeluarkan oleh Kementerian Pendidikan Nasional. Kesalahan yang banyak terjadi yaitu
dalam penulisan kata, tanda baca, dan huruf kapital. Aplikasi ini akan mengidentifikasi dan
menghitung jumlah kesalahan penulisan huruf kapital/ kata dan tanda baca. Pengukur
penggunaan ketepatan EYD ini dibuat menggunakan metode Fuzzy Logic Tsukamoto. Proses
yang dilakukan dalam metode Tsukamoto yaitu: fuzzifikasi, pembentukan rule, mesin
inferensi, dan defuzzifikasi. Jumlah kata yang saat ini tersedia dalam aplikasi ini yaitu 31.759
kata yang sebagian besar diambil dari Kamus Besar Bahasa Indonesia. Aplikasi ini dibangun
menggunakan MySQL sebagai database dan menggunakan tools PHP yang berbasis website.
Berdasarkan pengujian yang dilakukan terhadap 20 abstrak skripsi, presentase kesesuaian
hasil identifikasi yaitu 70% sesuai dengan hasil identifikasi secara manual.
Kata kunci: EYD, penulisan, Fuzzy Logic Tsukamoto, PHP.

ABSTRACT

Enhanced Spelling is one of the important aspects of writing a document. The use of spelling
must match those on the standard rules issued by the Ministry of National Education. Errors
that occur are in spelling, punctuation, and capitalization. This app will identify and count the
number of writing errors capital letters / words and punctuation. Estimator use EYD accuracy
is made using the method of Fuzzy Logic Tsukamoto. Process conducted in Tsukamoto
methods are: fuzzification, the establishment of the rule, the inference engine and
defuzzification. The number of words that are currently available in this application, namely
31 759 words, mostly taken from Indonesian dictionary. This application is built using
MySQL as the database and using tools PHP-based website. Based on tests performed on 20
abstract thesis, namely the identification of conformity percentage of 70% in accordance with
the results of the identification manually.
Kata kunci: EYD, penulisan, Fuzzy Logic Tsukamoto, PHP.
JURNAL TEKNIK INFORMATIKA VOL. 8 NO. 2, OKTOBER 2015 2

I. Pendahuluan (NLP) adalah upaya untuk mengekstrak


EYD merupakan kependekan dari Ejaan lebih jauh representasi dari suatu teks bebas.
Yang Disempurnakan. EYD memuat tentang Hal ini dapat dimasukkan secara kasar seperti
tata bahasa Indonesia yang baik dan benar. mencari siapa melakukan apa kepada siapa,
EYD diresmikan pada tanggal 16 Agustus kapan, di mana, bagaimana dan mengapa. NLP
1972 oleh Presiden Republik Indonesia. biasanya membuat penggunaan konsep-konsep
Peresmian itu berdasarkan Putusan Presiden linguistic seperti kata benda, kata kerja, kata
No. 57 Tahun 1972. EYD mengalami beberapa sifat, dan lainnya dan struktur gramatikal (baik
kali revisi, yaitu pada tahun 1987 melalui direpresentasikan sebagai ungkapan-ungkapan
keputusan Menteri Pendidikan dan seperti frase nomina atau frase preposisional,
Kebudayaan Nomor 0543a/U/1987 tanggal 9 atau hubungan ketergantungan seperti subjek
September 1987 tentang Penyempurnaan dari- atau objek-dari) [1].
Pedoman Umum Ejaan Bahasa Indonesia yang
Disempurnakan dan tahun 2009 melalui b. Ejaan Yang Disempurnakan (EYD)
keputusan Menteri Pendidikan Nasional yang Ejaan yang Disempurnakan (EYD)
mengeluarkan Permen (Peraturan Menteri) merupakan kumpulan aturan-aturan yang
Pendidikan Nasional Nomor 46 Tahun 2009 mengatur penulisan kata beserta tanda baca
tanggal 31 Juli 2009 tentang Pedoman Umum dalam bahasa Indonesia. EYD diresmikan pada
Ejaan Bahasa Indonesia yang Disempurnakan. tanggal 16 Agustus 1972 oleh Presiden
EYD merupakan salah satu aspek penting Republik Indonesia. Peresmian itu berdasarkan
dalam pembuatan suatu teks baik berupa essay, Putusan Presiden No. 57 Tahun 1972.
jurnal, karya ilmiah, dan lainnya. Kesalahan EYD mengalami beberapa kali revisi, yaitu
penulisan yang biasanya terjadi yaitu pada pada tahun 1987 melalui keputusan Menteri
penulisan huruf kapital, penggunaan tanda Pendidikan dan Kebudayaan Nomor
baca, dan penulisan kata. 0543a/U/1987 tanggal 9 September 1987
Natural Language Processing tentang Penyempurnaan Pedoman Umum
(Pemrograman Bahasa Alami) adalah Ejaan Bahasa Indonesia yang Disempurnakan
pembuatan program yang memiliki dan tahun 2009 melalui keputusan Menteri
kemampuan untuk memahami bahasa manusia. Pendidikan Nasional yang mengeluarkan
Tujuan dari pemrograman bahasa alami adalah Permen (Peraturan Menteri) Pendidikan
melakukan proses pembuatan model Nasional Nomor 46 Tahun 2009 tanggal 31
komputasi dari bahasa sehingga dapat terjadi Juli 2009 tentang Pedoman Umum
suatu interaksi antara manusia dengan EjaanBahasa Indonesia yang Disempurnakan.
komputer dengan perantara bahasa alami. Dalam Peraturan Menteri Pendidikan Nasional
Dalam bukunya [4] menuliskan bahwa Nomor 46 Tahun 2009 tersebut dijelaskan
konsep tentang logika fuzzy diperkenalkan mengenai aturan-aturan penulisan dalam
oleh Prof. Lotfi Astor Zadeh pada tahun 1962. Bahasa Indonesia diantaranya penulisan huruf
Logika fuzzy adalah metodologi sistem kontrol kapital, penggunaan tanda baca [3].
pemecahan masalah, yang cocok untuk
diimplementasikan pada sistem, mulai dari c. Fuzzy Logic Tsukamoto
sistem yang sederhana, sistem kecil, embedded Logika fuzzy adalah metodologi sistem
system, jaringan PC, multi-channel atau work kontrol pemecahan masalah, yang cocok untuk
station berbasis akuisisi data, dan sistem diimplementasikan padasistem, mulai dari
kontrol. sistem yang sederhana, system kecil,
embedded system, jaringan PC, multi-channel
II. Landasan Teori atau work station berbasis akuisisi data, dan
a. Natural Language Processing system kontrol [4]. Logika fuzzy dikenalkan
Natural Language Processing oleh Prof. Lotfi Astor Zadeh pada tahun 1962.
(Pemrograman Bahasa Alami) adalah Logika fuzzy memungkinkan memiliki derajat
pembuatan program yang memiliki keanggotaan suatu variable berada pada
kemampuan untuk memahami bahasa manusia. interval 0-1. Salah satu cara yang dapat
Pada prinsipnya bahasa alami adalah suatu digunakan untuk mendapatkan nilai
bentuk representasi dari suatu pesan yang ingin keanggotaan adalah dengan melalui
dikomunikasikan antar manusia. pendekatan fungsi. Beberapa fungsi yang
sering digunakan yaitu grafik keanggotaan
JURNAL TEKNIK INFORMATIKA VOL. 8 NO. 2, OKTOBER 2015 3

kurva linear dan grafik keanggotaan kurva Algoritma ini diterapkan pada saat
segitiga. Pada grafik keanggotaan kurva linear penghitungan nilai penulisan abstrak
naik (Gambar 1), kenaikan himpunan dimulai skripsi.
pada nilai domain yang memiliki derajat
keanggotaan nol (0) bergerak kekanan menuju III. Analisis dan Perancangan
nilai domain yang memiliki derajat Proses pada logika fuzzy yaitu fuzzifikasi,
keanggotaan lebih tinggi [2]. pembentukan aturan, mesin inferensi, dan
defuzzifikasi.
a. Fuzzifikasi
1. Fungsi keanggotaan SP
sedikit [x] =

Gambar 1 Grafik keanggotaan kurva


linear naik [2] cukup [x] =

Gambar 2 Grafik keanggotaan kurva banyak [x] =


linear turun [2]

Nilai keanggotaan untuk kesalahan penulisan


input 5 adalah:
spbanyak [5] = 0
Gambar 3 Grafik Keanggotaan Segtiga spcukup [5] = 0
[2] spsedikit [5] = 1

2. Fungsi keanggotaan ST

Fungsi keanggotaan: sedikit [x] =

[x] =
cukup [x] =

Alur kerja logika fuzzy dimuali dengan


fuzzifikasi, pembentukan rule, mesin inferensi,
dan defuzzifikasi. Cara kerja logika fuzzy
dapat dilihat pada Gambar 4.

banyak [x] =

Nilai Keanggotaan untuk kesalahan tanda


baca input 0 adalah:
stbanyak [0] = 0
stcukup [0] = 0
Gambar 4 Cara Kerja Logika Fuzzy stsedikit [0] = 1
JURNAL TEKNIK INFORMATIKA VOL. 8 NO. 2, OKTOBER 2015 4

b. Pembentukan Aturan Jenis file yang dapat dibaca yaitu doc,


Aturan untuk menghitung nilai abstrak docx, txt, dan pdf. Gambar 5. merupakan
dapat dilihat pada Tabel 1. gambar dari halaman utama aplikasi. Pada
halaman ini terdapat dua kotak, yang
Tabel 1 Aturan Fuzzy
pertama untuk memasukkan teks yang
No Kode Aturan Konsekuen
If SP sedikit and akan diidentifikasi kesalahan penulisannya,
1 [R1] Nilai A
ST sedikit then dan yang kedua untuk melihat hasil
If SP sedikit and identifikasi. Berikut merupakan potongan
2 [R2] Nilai B
ST cukup then
If SP sedikit and source code dari halaman utama aplikasi.
3 [R3] Nilai C
ST banyak then
If SP cukup and <div class='container-fluid'>
4 [R4] Nilai B
ST sedikit then <a href="index"><div class='page-header'>
If SP cukup and <h1 class='pull-left'>
5 [R5] Nilai C <i class='icon-book'></i>
ST cukup then
If SP cukup and <span>Cek EYD</span>
6 [R6] Nilai D <small>(Ejaan Yang
ST banyak then
Disempurnakan)</small>
If SP banyak </h1>
7 [R7] and ST sedikit Nilai C </div></a>
then <div class="row-fluid" >
If SP banyak <div class="span6 box box-nomargin">
8 [R8] and ST cukup Nilai D <div id="sub3">
then <div class="box-header green-
If SP banyak background">
9 [R9] and ST banyak Nilai E <div class="title"><i class="icon-
then edit"></i> Masukkan Teks:</div>
</div>
<div class="box-content">
c. Mesin Inferensi <div>
<textarea id="sumber"
Pada metode Tsukamoto, digunakan class="span12" rows="16" ></textarea>
fungsi implikasi MIN yaitu dengan cara </div>
mengambil nilai minimum dari variabel <button class="btn btn-primary btn-
block btn-large" name="button" valign="right"
input sebagai output-nya untuk id="cek" style="margin-bottom:5px"
mendapatkan predikat tiap-tiap rule. type="submit">
Masing-masing nilai predikat akan <i class="icon-chevron-sign-
right"></i> Proses</button>
digunakan untuk menghitung keluaran <a href="file" type='button'
hasil inferensi secara tegas (crisp) name='type' class="btn btn-link"
masing-masing rule. style="color:blue;">Upload File</a>
</div>
SP sedikit ST </div>
sedikit </div>
Predikat1 = Min (SP sedikit; <div class="span6 box">
<div class="box-header red-background">
ST sedikit) <div class="title"><i class="icon-
level-down"></i> Hasil</div>
d. Defuzzifikasi </div>
<div class="box-content" id="hasil">
Proses defuzzifikasi ini menggunakan </div>
metode rata-rata (average). </div>
</div></div>
z* =

z*=
z* = 100 (A)

IV. Implementasi dan Pengujian


a. Halaman Utama
Pada halaman utama terdapat text area
untuk teks yang akan diidentifikasi. User
dapat copy-paste teks pada text area atau Gambar 5 Halaman Utama
dengan memanfaatkan fitur upload file.
JURNAL TEKNIK INFORMATIKA VOL. 8 NO. 2, OKTOBER 2015 5

b. Baca Teks per kata (baris ke-8) dan akan dihitung


Halaman selanjutnya yaitu baca teks. jumlah katanya (baris ke-9). Kemudian
Setelah user meng-upload file, user menekan teks yang telah dipecah akan diidentifikasi
tombol baca teks dan teks akan terlihat pada (baris ke-12 sampai baris ke-40). Lalu,
kolom 1. Dapat dilihat pada Gambar 6.
akan dihitung jumlah tanda baca yang ada
dalam teks tersebut (baris ke-42 sampai
baris ke-48).
Algoritma Fuzzy Logic Tsukamoto
digunakan ketika proses pemberian nilai
kesalahan tulisan dan saat penentuan nilai
akhir dari teks yang diidentifikasi. Nilai
berupa angka dari 0-100, dan nilai akhir
Gambar 6. Baca Teks yaitu A, B, C, D, dan E.
c. Hasil Identifikasi d. Pengujian
Setelah user menekan tombol proses, maka
Pengujian dilakukan dengan dua cara,
akan muncul teks hasil identifikasi pada kolom
2 beserta keterangan kesalahan dan nilai. pertama dilakukan secara manual oleh
Dapat dilihat pada Gambar 7. pembuat aplikasi, dan kedua oleh aplikasi
yang telah dibuat. Dalam pengujian
dihitung berapa banyak kesalahan tanda
baca dan penulisan yang terdapat dalam
setiap abstrak skripsi. Abstrak skripsi yang
diuji sebanyak 20 abstrak skripsi. Tabel 2
merupakan hasil pengujian pada abstrak
skripsi yang dilakukan.

Tabel 2 Hasil Pengujian


Gambar 7. Hasil Identifikasi No Abstr Jeni Jumlah kesalahan Ket
ak ke- s Berdasarka Berdasarka .
File n periksa n hasil
Berikut potongan source code saat proses manual aplikasi
identifikasi teks: 1 1 doc 7 7
2 2 doc 8 8
3 3 docx 0 0
4 4 docx 2 2
5 5 doc 1 1
6 6 docx 2 2
7 7 doc 1 2
8 8 docx 2 2
9 9 docx 6 6
10 10 pdf 3 15
11 11 pdf 4 29
12 12 pdf 1 11
13 13 pdf 2 6
14 14 doc 5 5
15 15 pdf 8 21
16 16 txt 0 0
17 17 txt 2 2
18 18 txt 7 7
19 19 txt 2 2
20 20 txt 5 5
Baris ke-2 merupakan code untuk
mengambil teks dari teks area. Teks yang
diambil tadi, akan dipecah-pecah menjadi
JURNAL TEKNIK INFORMATIKA VOL. 8 NO. 2, OKTOBER 2015 6

Presentase kesesuaian hasil hitung aplikasi [3] Kao, Anne and Stephen R. Poteet
dan manual: (Eds). 2007. Natural Language
Processing and Text Mining. London:
Presentase = (14/20) x 100% Springer.
= 70 % [4] Kusumadewi, Sri, Hari Purnomo. 2010.
Berdasarkan hasil persentase diatas Aplikasi Logika Fuzzy Untuk
maka penulis dapat menyimpulkan bahwa Pendukung Keputusan. Yogyakarta:
hasil 70% sudah reliable. Ini dikarenakan Graha Ilmu.
pengujian yang dilakukan secara berulang [5] Manik, Ngarap Im. 2010.
dihasilkan nilai yang konsiten dengan Perancangan Program Aplikasi
kondisi yang berbeda. Hasil pesentase Pengenalan Teks Menggunakan Fuzzy
diatas dapat dijadikan acuan untuk Logic. Jakarta: Universitas BINUS.
pengkuran abstrak pada penulisan skripsi [6] Menteri Pendidikan Nasional
dikarenakan derajat ketepatannya sangat Republik Indonesia. 2009. Pedoman
besar. Umum Ejaan Bahasa Indonesia Yang
Perbedaan antara hasil hitung aplikasi Disempurnakan. Jakarta.
dan manual disebabkan oleh kurangnya [7] Pressman, Roger S.. 2002. Rekayasa
kosakata yang terdapat dalam database Perangkat Lunak (Buku Satu). CV.
aplikasi dan kesalahan identifikasi tanda Andi Offset. Yogyakarta.
baca. [8] Sutojo, T, Edy Mulyanto dan Vincent
Suhartono. 2011. Kecerdasan Buatan.
e. Kesimpulan Yogyakarta: Andi.
Berdasarkan uraian implementasi dan [9] Yakub. 2012. Pengantar Sistem
pengujian aplikasi pengukur ketepatan Informasi. Yogyakarta: Graha Ilmu.
penggunaan EYD dapat disimpulkan bahwa
metode Fuzzy Logic Tsukamoto dapat
diterapkan dalam perhitungan nilai
penggunaan tanda baca dan penulisan kata
yang terdapat pada sebuah abstrak skripsi.
Hasil pengujian terhadap 20 abstrak skripsi
menunjukkan 70% sesuai dengan pemeriksaan
manual.

f. Saran
Setelah mengevaluasi proses dan hasil dari
aplikasi pengukur ketepatan penggunaan EYD
ini, maka penulis memiliki saran untuk
pengembangan aplikasi selanjutnya yaitu
penambahan identifikasi kata asing untuk teks
yang diidentifikasi.

g. Daftar Pustaka
[1] Daeli, Irlani. Natural Language
Processing Analysis Of Sentences
With Turbo Prolog.Universitas
Gunadarma.
[2] Kadir, Abdul dan Terra CH.
Triwahyuni.2003. Pengenalan
Teknologi Informasi. CV. Yogyakarta:
Andi Offset.

Anda mungkin juga menyukai