Abstrak
Skripsi adalah hasil karya tulis ilmiah yang berbasis pada penelitian dengan mengulas permasalahan beserta solusi
yang dihasilkan pada disiplin ilmu tertentu. Hal ini juga didukung oleh rujukan pustaka terdahulu, beserta temuan
dari hasil pengembangan eksperiman, pengamatan dengan arahan dosen pembimbing. Pada Jurusan Teknik
Informatika Politeknik Negeri Malang terdapat banyak judul skripsi dalam berbagai bidang yang telah dibuat,
tetapi judul tersebut belum terklasifikasikan kedalam bidangnya masing-masing. Berangkat dari masalah yang ada,
dibuatlah sistem klasifikasi judul skripsi dengan mengambil studi kasus dijurusan Teknologi Informasi Politeknik
Negeri Malang. Pada sistem ini data judul skripsi akan dikategorikan kedalam daftar bidang keahlian Teknik
Informatika, sehingga setiap judul akan memiliki label sesuai dengan kategori bidang keahlian yang ada. Mengacu
pada Association for Computing Machinery (ACM) terdapat 24 kategori bidang keahlian diantaranya : Networking,
Information Management, Web and Mobile System, Platform Technology, System Integration, Software
Fundamental, Cyber Security, Global Prfessional Practice, System Administration and Maintenance, Applied
Network, Data Scalability, Integrated System, IoT, Software development Management, User Experience Desain,
Virtual System and Services, Social Responsibility, Mobile Aplication, Cloud Computing, Information Retrival,
Digital Image Processing, CyberSecurity Emerging Challenges, Geographical Information Service dan Game
Development.Pengkategorian judul skripsi sangat diperlukan untuk mengetahui persebaran judul skripsi pada
masing-masing kategori. Penelitian ini bertujuan untuk mengkategorikam judul skripsi dibidang informatika
kedalam 24 kategori menggunakan Naïve Bayes Classifier, karena menurut penelitian sebelumnya metode tersebut
memberikan nilai akurasi yang cenderung baik. Pengujian algoritma menggunakan data training pada 50 judul,
100 judul dan 150 judul menghasilkan nilai akurasi sebesar 52%, 56% dan 58%. Berdasarkan penelitian tersebut
dapat disimpulkan bahwa semakin banyak data training yang digunakan, maka nilai akurasi akan semakin
meningkat.
H a l a m a n | 43
Volume 5, Edisi 1, November 2018
proses yang sama dengan data mining, namun - Daftar kategori bidang keahlian jurusan
memiliki input yang berbeda. teknologi informasi mengacupada Association
for Computing Machinery (ACM) Daftar kata
2.2 Naive Bayes Classifier stopword Bahasa Indonesia, stopword adalah
kata-kata yang diabaikan dalam pemprosesan
Naïve Bayes Classifier merupakan salah satu data, contoh: ada.apa.awal,bagi, dll.
metoda machine learning yang memanfaatkan
perhitungan probabilitas dan statistik yang 3.2. Metode Pengolahan Data
dikemukakan oleh ilmuwan Inggris Thomas Bayes,
yaitu memprediksi probabilitas di masa depan Data judul Skripsi yang digunakan yaitu data
berdasarkan pengalaman di masa sebelumnya. pada tahun 2014 hingga tahun 2017 yang didapat dari
Metode NBC menempuh dua tahap dalam proses website jurnal informatika polinema(JIP) dan website
klasifikasi teks, yaitu tahap pelatihan dan tahap jurnal seminar informatika aplikatif polinema (SIAP).
klasifikasi. Pada tahap pelatihan dilakukan proses Data tersebut perlu dilakukan pengolahan agar
analisis terhadap sampel dokumen berupa pemilihan menjadi data yang mudah digunakan dalam proses
vocabulary, yaitu kata yang mungkin muncul dalam klasifikasi. Data judul akan mengalami penyeleksian
koleksi dokumen sampel yang sedapat mungkin dapat kata- kata sehingga judul menjadi lebih ringkas.
menjadi representasi dokumen. Selanjutnya adalah Beberapa komponen dari judul akan dihapus untuk
penentuan probabilitas prior bagi tiap kategori diseleksi. Proses ini dapat disebut dengan
berdasarkan sampel dokumen. preprocessing. Setelah proses preprocessing selesai
maka data akan diproses menggunakan algoritma
2.3 Skripsi Naïve Bayes Classifier agar menghasilkan nilai
peluang pada masing masing kategori. Nilai ini yang
Skripsi adalah istilah yang digunakan di akan menjadi masukan untuk proses klasifikasi pada
Indonesia untuk mengilustrasikan suatu karya tulis tahap testing.
ilmiah berupa paparan tulisan hasil penelitian sarjana
S1 yang membahas suatu permasalahan / fenomena
dalam bidang ilmu tertentu dengan menggunakan
kaidah-kaidah yang berlaku. Skripsi merupakan
karya tulis ilmiah berdasarkan hasil penelitian
lapangan dan atau studi kepustakaan yang disusun
mahasiswa sesuai dengan bisang studinya sebagai
tugas akhir dalam studiformalnya di Perguruan
Tinggi.Skripsi adalah karya ilmiah yang ditulis
mahasiswa program S-1 yang membahas topik atau
bidang tertentu berdasarkan hasil kajian pustaka yang
diteliti oleh para ahli, hasil penelitian lapangan atau
hasil pengembangan atau eksperimen (Munslich
Mansnur, 2009: 4).
3. Metodologi
44 | H a l a m a n
Jurnal Informatika Polinema ISSN: 2614-6371 E-ISSN: 2407-070X
H a l a m a n | 45