Anda di halaman 1dari 3

Jurnal Informatika Polinema ISSN: 2614-6371 E-ISSN: 2407-070X

ANALISA SISTEM KLASIFIKASI JUDUL SKRIPSI


MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER
Dwi Puspitasari1, Pramana Yoga Saputra2, Ilham Agung Prakoso3

Teknik Informatika, Teknologi Informasi, Politeknik Negeri Malang


1
dwipuspitasari@polinema.ac.id,, 2pramanay@polinema.ac.id, 3ilhamagungp6196@gmail.com

Abstrak

Skripsi adalah hasil karya tulis ilmiah yang berbasis pada penelitian dengan mengulas permasalahan beserta solusi
yang dihasilkan pada disiplin ilmu tertentu. Hal ini juga didukung oleh rujukan pustaka terdahulu, beserta temuan
dari hasil pengembangan eksperiman, pengamatan dengan arahan dosen pembimbing. Pada Jurusan Teknik
Informatika Politeknik Negeri Malang terdapat banyak judul skripsi dalam berbagai bidang yang telah dibuat,
tetapi judul tersebut belum terklasifikasikan kedalam bidangnya masing-masing. Berangkat dari masalah yang ada,
dibuatlah sistem klasifikasi judul skripsi dengan mengambil studi kasus dijurusan Teknologi Informasi Politeknik
Negeri Malang. Pada sistem ini data judul skripsi akan dikategorikan kedalam daftar bidang keahlian Teknik
Informatika, sehingga setiap judul akan memiliki label sesuai dengan kategori bidang keahlian yang ada. Mengacu
pada Association for Computing Machinery (ACM) terdapat 24 kategori bidang keahlian diantaranya : Networking,
Information Management, Web and Mobile System, Platform Technology, System Integration, Software
Fundamental, Cyber Security, Global Prfessional Practice, System Administration and Maintenance, Applied
Network, Data Scalability, Integrated System, IoT, Software development Management, User Experience Desain,
Virtual System and Services, Social Responsibility, Mobile Aplication, Cloud Computing, Information Retrival,
Digital Image Processing, CyberSecurity Emerging Challenges, Geographical Information Service dan Game
Development.Pengkategorian judul skripsi sangat diperlukan untuk mengetahui persebaran judul skripsi pada
masing-masing kategori. Penelitian ini bertujuan untuk mengkategorikam judul skripsi dibidang informatika
kedalam 24 kategori menggunakan Naïve Bayes Classifier, karena menurut penelitian sebelumnya metode tersebut
memberikan nilai akurasi yang cenderung baik. Pengujian algoritma menggunakan data training pada 50 judul,
100 judul dan 150 judul menghasilkan nilai akurasi sebesar 52%, 56% dan 58%. Berdasarkan penelitian tersebut
dapat disimpulkan bahwa semakin banyak data training yang digunakan, maka nilai akurasi akan semakin
meningkat.

Kata Kunci : klasifikasi, persebaran judul skripsi, Naïve Bayes Classifier

1. Pendahuluan Skripsi adalah istilah yang digunakan di


Indonesia untuk mengilustrasikan suatu karya tulis
Perkembangan data teks saat ini telah ilmiah berupa paparan tulisan hasil penelitian sarjana
mencapai jumlah yang cukup besar. Hal tersebut S1 yang membahas suatu permasalahan atau
disebabkan oleh berkembangnya dunia teknologi fenomena dalam bidang ilmu tertentu berdasarkan
informasi yang terdiri dari data teks di dalamnya. Saat hasil kajian pustaka yang diteliti oleh para ahli, hasil
ini, berbagai macam media online seperti blog, situs penelitian lapangan atau hasil pengembangan atau
berita online, dan jejaring sosial menjadi sumber data eksperimen. Skripsi merupakan karya tulis ilmiah
teks yang sangat potensial untuk digali lebih dalam. berdasarkan hasil penelitian lapangan atau studi
Namun, data berbentuk teks memiliki karakteristik kepustakaan yang disusun mahasiswa sesuai dengan
yang tidak terstruktur dan banyak memuat noise. bidang studinya sebagai tugas akhir dalam studi
Oleh karena itu, text mining memiliki peran penting formalnya di Perguruan Tinggi (Munslich Mansnur,
dalam pengolahan data teks. Diantara proses yang 2009;
dapat dilakukan dalam text mining adalah klasifikasi
teks. 2. Landasan Teori
Klasifikasi teks dapat didefinisikan sebagai
proses untuk menentukan suatu dokumen teks ke 2.1 Text Mining
dalam suatu kelas tertentu. Dengan mengaplikasikan Text Mining adalah proses yang mencoba
proses- proses dalam text mining, maka akan mengekstrak informasi berguna dari teks natural
diperoleh pola-pola data, tren, dan ekstraksi dari language. Hal itu bisa diartikan sebagai proses
pengetahuan-pengetahuan yang potensial dari data menganalisa teks untuk mengekstrak informasi yang
teks. Salah satu bentuk data teks yang dapat diolah berguna untuk tujuan tertentu Lokesh & Parul (2013).
yaitu data teks judul skripsi. Text mining memiliki tujuan dan menggunakan

H a l a m a n | 43
Volume 5, Edisi 1, November 2018

proses yang sama dengan data mining, namun - Daftar kategori bidang keahlian jurusan
memiliki input yang berbeda. teknologi informasi mengacupada Association
for Computing Machinery (ACM) Daftar kata
2.2 Naive Bayes Classifier stopword Bahasa Indonesia, stopword adalah
kata-kata yang diabaikan dalam pemprosesan
Naïve Bayes Classifier merupakan salah satu data, contoh: ada.apa.awal,bagi, dll.
metoda machine learning yang memanfaatkan
perhitungan probabilitas dan statistik yang 3.2. Metode Pengolahan Data
dikemukakan oleh ilmuwan Inggris Thomas Bayes,
yaitu memprediksi probabilitas di masa depan Data judul Skripsi yang digunakan yaitu data
berdasarkan pengalaman di masa sebelumnya. pada tahun 2014 hingga tahun 2017 yang didapat dari
Metode NBC menempuh dua tahap dalam proses website jurnal informatika polinema(JIP) dan website
klasifikasi teks, yaitu tahap pelatihan dan tahap jurnal seminar informatika aplikatif polinema (SIAP).
klasifikasi. Pada tahap pelatihan dilakukan proses Data tersebut perlu dilakukan pengolahan agar
analisis terhadap sampel dokumen berupa pemilihan menjadi data yang mudah digunakan dalam proses
vocabulary, yaitu kata yang mungkin muncul dalam klasifikasi. Data judul akan mengalami penyeleksian
koleksi dokumen sampel yang sedapat mungkin dapat kata- kata sehingga judul menjadi lebih ringkas.
menjadi representasi dokumen. Selanjutnya adalah Beberapa komponen dari judul akan dihapus untuk
penentuan probabilitas prior bagi tiap kategori diseleksi. Proses ini dapat disebut dengan
berdasarkan sampel dokumen. preprocessing. Setelah proses preprocessing selesai
maka data akan diproses menggunakan algoritma
2.3 Skripsi Naïve Bayes Classifier agar menghasilkan nilai
peluang pada masing masing kategori. Nilai ini yang
Skripsi adalah istilah yang digunakan di akan menjadi masukan untuk proses klasifikasi pada
Indonesia untuk mengilustrasikan suatu karya tulis tahap testing.
ilmiah berupa paparan tulisan hasil penelitian sarjana
S1 yang membahas suatu permasalahan / fenomena
dalam bidang ilmu tertentu dengan menggunakan
kaidah-kaidah yang berlaku. Skripsi merupakan
karya tulis ilmiah berdasarkan hasil penelitian
lapangan dan atau studi kepustakaan yang disusun
mahasiswa sesuai dengan bisang studinya sebagai
tugas akhir dalam studiformalnya di Perguruan
Tinggi.Skripsi adalah karya ilmiah yang ditulis
mahasiswa program S-1 yang membahas topik atau
bidang tertentu berdasarkan hasil kajian pustaka yang
diteliti oleh para ahli, hasil penelitian lapangan atau
hasil pengembangan atau eksperimen (Munslich
Mansnur, 2009: 4).

3. Metodologi

3.1. Metode Pengumpulan Data

Metode pengumpulan data digunakan untuk


mengumpulkan data- data pendukung yang
dibutuhkan dalam proses pembuatan aplikasi.
Beberapa cara yang dapat digunakan adalah melalui
studi literatur, yaitu dengan mengumpulkan dan
mempelajari beberapa referensi dari berbagai sumber
yang berkaitan dengan judul penelitian yang
dilakukan.
Data-data yang dibutuhkan dalam penelitian ini
adalah sebagai berikut :
- Dataset judul skripsi pada jurusan teknologi
informasi tahun 2014 sampai tahun 2017 yang
diambil dari website jurnal informatika
polinema(JIP), webite jurnal seminar
informatika aplikatif polinema (SIAP) dan juga
dosen panitia skripsi

44 | H a l a m a n
Jurnal Informatika Polinema ISSN: 2614-6371 E-ISSN: 2407-070X

3.3. Metode Pengujian Sistem 4. Kesimpulan dan Saran

a. Pengujian Perangkat Lunak Berdasarkan hasil penelitian dan pengujian


Pengujian perangkat lunak merupakan proses tingkat akurasi yang telah dilakukan dapat ditarik
untuk mengtahui apakah sistem berjalan dengan baik kesimpulan sebagai berikut:
dan tidak ada kerusakan. Metode pengujian yang 1. Algoritma Naïve Bayes Classifier dapat
digunakan adalah black box. Black box testing adalah digunakan untuk mengklasifikasikan judul skrpsi
pengujian yang dilakukan hanya mengamati hasil 2. Pengujian dengan menggunakan jumlah data
eksekusi melalui data uji dan memeriksa fungsional training yang berbeda menghasilkan nilai akurasi
dari perangkat lunak. yang berbeda dengan kecenderungan akurasi yang
semakin meningkat. Hasil akurasi klasifikasi
b. Performa Algoritma algoritma Naïve Bayes Classifier menggunakan
Untuk mengetahui performa algoritma yang training 50 judul,100 judul,150 judul didapat akurasi
digunakan yaitu Naïve Bayes Classifier maka perlu sistem sebesar 52%, 56 %,dan 58%.
dilakukan pengujian tingkat akurasi dan presisi.
Tahap yang dilakukan dalam analisis tingkat akurasi Daftar Pustaka:
dan presisi sebagai berikut:
Hamza, Amir. 2012 “Klasifikasi Teks Dengan Naïve
- Merekap klasifikasi opini yang dilakukan melalui Bayes Classifier (Nbc) Untuk Pengelompokan
testing menggunakan aplikasi Teks Berita Dan Abstract Akademis” Prosiding
- Merekap klasifikasi opini yang dilakukan melalui Seminar Nasional Aplikasi Sains & Teknologi
testing secara manual (SNAST) Periode III .
- Melakukan perbandingan antara hasil Lokesh, Kumar & Parul, Kalra Bhatia. 2013. “Text
klasifikasi opini melalui testing menggunakan Mining: Concepts, Process And Applications”.
aplikasi dengan testing secara manual Journal of Global Research in Computer
- Melakukan penghitungan hasil yang sama dan Science
hasil yang berbeda dari kedua testing yang Nathaniel Chandra, Daniel., Indrawan, Gede.,
dilakukan Sukajaya, Nyoman, Klasifikasi Berita Lokal
- Melakukan penghitungan tingkat akurasi Radar Malang Menggunakan Metode Naïve
algoritma Naïve Bayes Classifier dengan rumus Bayes Dengan Fitur N-Gram. Jurnal Ilmiah
sebagai berikut: Teknologi dan Informasia ASIA (JITIKA)
Vol.10, No.1, ISSN: 0852-730X. Singaraja.
100 (1) Universitas Pendidikan Ganesha
Sukma, Alifian., Puji Santoso, Bagus., Ramadhan,
- Melakukan penghitungan hasil yang positif dan Dian., Wiraswari, Ni Made Ayu Karina., Sari,
negativ Tiara Ratna., “Klasifikasi Dokumen Bahasa
- Melakukan penghitungan tingkat presisi Jawa Menggunkan Metode N-Gram” Jurusan
algoritma Naïve Bayes Classifier dengan rumus Sistem Informasi, Fakultas Sains dan
sebagai berikut : Teknologi Universitas Airlangga, Surabaya
Vicky Indriyono,Bonifacius., Ema Utami.
100 (2) “Klasifikasi Jenis Buku Berdasarkan Judul dan
Sinopsis Menggunakan Metode NBC ” .Program
Pascasarjana Magister Teknik
Informatika.STMIK AMIKOM, Yogyakarta

H a l a m a n | 45

Anda mungkin juga menyukai