Seminar Tutup Kartika Sari

SKRIPSI
PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA

MENGGUNAKAN ALGORITMA NAIVE BAYES PADA
PROGRAM STUDI TEKNIK INFORMATIKA
GROUPING OF STUDENT RESEARCH TITLES USING THE

NAIVE BAYES ALGORITHM IN THE INFORMATICS
ENGINEERING STUDY PROGRAM
KARTIKA SARI
D02 16 368

FAKULTAS TEKNIK
UNIVERSITAS SULAWESI BARAT
MAJENE
2022
q
SKRIPSI

GROUPING OF STUDENT RESEARCH TITLES USING THE

NAIVE BAYES ALGORITHM IN THE INFORMATICS
ENGINEERING STUDY PROGRAM
Diajukan Sebagai Salah Satu Syarat Dalam Memperoleh Gelar

Sarjana Bidang Ilmu Teknik Informatika
KARTIKA SARI
D02 16 368

FAKULTAS TEKNIK
MAJENE
2022
ii
HALAMAN PERSETUJUAN
PENELITIAN S1

Diusulkan Oleh
KARTIKA SARI
D02 16 368
Telah disetujui
Pada tanggal 14 Maret 2021
Pembimbing
Pembimbing I Pembimbing II
Nurdina Rasyid, S.Pd., M.Pd Nahya Nur,ST., M.Kom

NIDN. 0003028703 NIP. 19911105 201903 2 024
iii
SKRIPSI

Telah dipersiapkan dan disusun oleh
KARTIKA SARI
D02 16 368
Telah dipertahankan di depan Tim Penguji
Pada Tanggal
Susunan Tim Penguji
Pembimbing I/Penguji Penguji I
Nurdina Rasyid, S. Pd., M.Pd Ir. Sugiarto Cokrowibowo, S.Si., MT

NIDN. 0003028703 NIP. 19860524 201504 1 004
Pembimbing II/Penguji Penguji II
Nahya Nur, ST., M.Kom Ismail, S.Pd., M.Pd

NIP. 19911105 201903 2 024 NIDN. 0911128203
Penguji III
Farid Wajidi, S.Kom., MT

NIP.19890418 201903 1 018
iv
PERNYATAAN
Dengan ini saya menyatakan bahwa Skripsi yang berjudul “
Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma
Naive Bayes pada Program Studi Teknik Informatika” ini tidak terdapat
karya yang pernah diajukan untuk memperoleh gelar kesarjanaan disuatu
Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya
atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali
yang secara tertulis terdapat di dalam naskah ini dan disebutkan dalam daftar
pustaka.
Majene, 17 November 2022
KARTIKA SARI
D02 16 368
v
KATA PENGANTAR
Assalamualaikum wr.wb.
Segala Puji dan syukur kami panjatkan kehadirat Allah SWT yang telah
melimpahkan rahmat dan hidayahnya. Sholawat serta salam tak lupa peneliti
tuturkan kepada Nabi Muhammad SAW, serta kepada keluarga dan para
sahabatnya. Sehingga peneliti dapat menyelesaikan skripsi dengan judul
“Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma
Naive Bayes Pada Program Studi Teknik Informatika“. Sebagai salah satu
syarat untuk menyelesaian Program Sarjana (S1) Program Studi Teknik
Informatika, Fakultas Teknik, Universitas Sulawesi Barat.
Terselesaikannya tugas akhir ini tidak terlepas dari bantuan berbagai pihak,
oleh sebab itu penulis mengucapkan rasa terima kasih yang besar kepada :
1. Keluarga Penulis : Budiman dan Mahdalena selaku kedua orang tua penulis
yang tidak bosan-bosannya memberikan dukungan dan motivasi kepada
penulis selama dalam proses penyelesaian skripsi ini.
2. Bapak Muh. Fahmi Rustam, S.Kom., M.T selaku Ketua Prodi Teknik
Informatika, Fakultas Teknik, Universitas Sulawesi Barat.
3. Ibu Nurdina Rasyid, S.Pd., M.Pd selaku pembimbing pertama yang telah
banyak meluangkan waktu dan tenaga serta perhatiannya guna memberikan
bimbingan demi terselesaikannya tugas akhir ini.
4. Ibu Nahya Nur, ST., M.Kom selaku pembimbing kedua yang telah sabar dan
telaten membimbing serta membagikan ilmu dan waktunya kepada peneliti.
vi
5. Bapak Ir. Sugiarto Cokrowibowo, S.Si., MT, Bapak Ismail, S.Pd., M.Pd, dan
Bapak Farid Wajidi, S.Kom., MT, selaku penguji yang memberikan koreksi
serta saran perbaikan terhadap tugas akhir ini.
6. Seluruh Bapak dan Ibu dosen Program Studi Teknik Informatika, Fakultas
Teknik yang telah memberikan ilmu dan motivasi kepada peneliti mulai dari
semester pertama sampai dengan penyusunan skripsi.
7. Seluruh staf Fakultas Teknik Universitas Sulawesi Barat.
8. Rekan-rekan mahasiswa jurusan Teknik Informatika 2016, teristimewa untuk
teman-teman seperjuangan kelas D yang telah banyak memberikan bantuan
dan dukungan kepada peneliti selama perkuliahan sampai pada penyusunan
skripsi ini.
Peneliti menyadari bahwa skripsi ini tidak luput dari berbagai kekurangan.
Oleh karenanya, peneliti mengharapkan kritik dan saran demi kesempurnaan
kedepannya sehingga dapat memberikan manfaat bagi masyarakat pada dunia
pendidikan. Aamiin.
Majene, 24 Agustus 2022
KARTIKA SARI
D02 16 368
vii
ABSTRAK
Judul skripsi yang sudah dibuat mahasiswa khususnya pada program studi
Teknik Informatika Unsulbar, Terdapat tiga konsentrasi yaitu Sistem cerdas
(Smart System), Rekayasa Perangkat Lunak (Software Engineering) dan Jaringan
Komputer (Internet Of Thingts). Namun pengelompokan judul tugas akhir
mahasiswa di UNSULBAR khususnya prodi informatika belum terklasifikasi
secara maksimal, sesuai dengan peminatan dan pengembangan ilmu informatika
yang terus berubah mengikuti perkembangan zaman. Hal tersebut diharapkan
dapat membantu dalam memberikan gambaran kepada mahasiswa untuk mencari
judul yang relevan dengan bidang konsentrasi mahasiswa tersebut. Untuk
melakukan klasifikasi atau pengelompokan topik skripsi mahasiswa yang ada
dijurusan teknik informatika. Pengelompokan skripsi dilakukan dengan melihat
judul dari setiap skripsi yang telah dibuat oleh mahasiswa. Terdapat banyak teknik
klasifikasi yang dikenal. Teks mining salah satu teknik yang digunakan untuk
melakukan klasifikasi dokumen dimana teks mining merupakan variasi data
mining yang berusaha menetukan pola menarik dari sekumpulan data tekstual
yang berjumlah besar. Hasil penerapan algoritma naïve bayes telah berhasil dalam
melakukan klasifikasi judul skripsi menggunakan algoritma naive bayes dapat
dilakukan dalam mengelompokan judul skripsi sesuai kelas topiknya. Dari hasil
pengujian akurasi yang dilakukan terhadap 150 data training dan 100 data testing
yang digunakan diperoleh tingkat akurasi sebesar 97 %. Adapun pengujian presisi
didapatkan nilai sebesar 0,97 %, Recall mendapat nilai sebesar 0,96 % dan nilai
laju error sebesar 0,03 %. Berdasarkan hasil pengujian dapat diketahui bahwa
implementasi metode naive bayes dalam melakukan pengklasifikasian judul
skripsi kedalam kategori kelas sudah baik, dapat dilihat dari tingkat akurasi yang
diperoleh terhadap 100 data testing dan 150 data training.
Kata Kunci : Naïve Bayes, Data Mining, Klasifikasi Judul.
viii
ABSTRACT
The title of the thesis that has been made by students, especially in the
Unsulbar Informatics Engineering study program, has three concentrations,
namely Smart Systems, Software Engineering and Computer Networks (Internet
Of Things). However, the grouping of students' final assignments at UNSULBAR,
especially the informatics study program, has not been maximally classified, in
accordance with the interest and development of informatics science which
continues to change following the times. This is expected to help in providing an
overview for students to find titles that are relevant to the student's field of
concentration. To classify or group thesis topics for students in the department of
informatics engineering. The thesis grouping is done by looking at the title of each
thesis that has been made by students. There are many known classification
techniques. Text mining is one of the techniques used to classify documents where
text mining is a variation of data mining that seeks to determine interesting
patterns from a large set of textual data. The results of the application of the
Naive Bayes algorithm have succeeded in classifying thesis titles using the Naive
Bayes algorithm, which can be done in grouping thesis titles according to the
topic class. From the results of the accuracy tests carried out on 150 training data
and 100 testing data used, an accuracy rate of 97% was obtained. The precision
test got a value of 0.97%, Recall got a value of 0.96% and an error rate value of
0.03%. Based on the test results, it can be seen that the implementation of the
Naive Bayes method in classifying thesis titles into class categories is good, it can
be seen from the level of accuracy obtained for 100 testing data and 150 training
data.
Keywords: Naïve Bayes, Data Mining, Title Classification.
ix
DAFTAR ISI
SAMPUL....................................................................................................... i
HALAMAN JUDUL .................................................................................... ii
HALAMAN PERSETUJUAN .................................................................... iii
HALAMAN PENGESAHAN ..................................................................... iv
PERNYATAAN ........................................................................................... v
KATA PENGANTAR ................................................................................. vi
ABSTRAK .................................................................................................... viii
DAFTAR ISI................................................................................................. x
DAFTAR TABEL ........................................................................................ xi
DAFTAR GAMBAR ................................................................................... xii
BAB I PENDAHULUAN ............................................................................ 1
A. Latar Belakang ................................................................................... 1
B. Rumusan Masalah............................................................................... 3
C. Tujuan Penelitian ................................................................................ 4
D. Manfaat Penelitian .............................................................................. 4
E. Batasan Masalah ................................................................................. 4
BAB II TINJAUAN PUSTAKA ................................................................. 5
A. Tugas Akhir ........................................................................................ 5
B. Data Mining ........................................................................................ 6
C. Klasifikasi .......................................................................................... 7
D. Text Preprocessing ............................................................................. 7
E. Term Weighting .................................................................................. 9
F. Algoritma Naive Bayes....................................................................... 11
G. PHP .................................................................................................... 14
H. MySQL............................................................................................... 14
I. XAMPP............................................................................................... 15
J. Confusion Matriks .............................................................................. 16
K. Accuracy ............................................................................................. 16
L. Perhitungan Presisi ............................................................................. 17
M. Recall .................................................................................................. 17
N. Cross Validation ................................................................................. 17
O. Penelitian Terkait................................................................................ 20
BAB III METODE PENELITIAN............................................................. 26
A. Jenis Penelitian ................................................................................... 26
B. Metode Pengembangan Sistem .......................................................... 27
C. Tahapan Penelitian ............................................................................. 29
D. Lokasi Waktu Penelitian..................................................................... 35
E. Gambaran Umum Sistem ................................................................... 35
F. Perancangan Data Flow Diagram ....................................................... 36
G. Teknik Pengumpulan Data ................................................................. 38
H. Teknik Analisis Data.......................................................................... 39
I. Teknik Pengujian ................................................................................ 39
BAB IV HASIL DAN PEMBAHASAN ..................................................... 41
x
A. Hasil.................................................................................................... 41
B. Implementasi Sistem .......................................................................... 56
C. Hasil Pegujian..................................................................................... 62
BAB V KESIMPULAN DAN SARAN ...................................................... 80
A. Kesimpulan ......................................................................................... 80
B. Saran ................................................................................................... 80
DAFTAR PUSTAKA .................................................................................. 82
xi
DAFTAR TABEL
Tabel 2.1 State Of The Art .............................................................................. 20

Tabel 4.1 Contoh Data Training..................................................................... 35
Tabel 4.2 Hasil Case Folding Judul Skripsi ................................................... 36
Tabel 4.3 Hasil Tokenisasi Judul Skripsi........................................................ 37
Tabel 4.4 Hasil Filtering/Stopword Data Judul Skripsi ................................. 38
Tabel 4.5 Hasil Stemming Data Judul Skripsi ................................................ 39
Tabel 4.6 Atribut Kata ................................................................................... 41
Tabel 4.7 Pembobotan TF .............................................................................. 42
Tabel 4.8 Hasil Pembobotan TF ..................................................................... 43
Tabel 4.9 Hasil Pembobotan IDF................................................................... 44
Tabel 4.10 Hasil Pembobotan TF-IDF ........................................................... 45
Tabel 4.11 Hasil Model Data Training Naïve Bayes ..................................... 48
Tabel 4.12 Contoh Data Testing yang akan Diuji .......................................... 49
Tabel 4.13 Model Confusion Matriks untuk Algoritma Naïve Bayes ............ 57
Tabel 4.14 Confusion Matriks ........................................................................ 59
Tabel 4.15 Pengujian K-Fold Cross Validation 1-10..................................... 61
Tabel 4.16 Confusion Matriks Fold 1 ............................................................ 62
Tabel 4.17 Pengujian K-Fold Cross Validation 11-20................................... 62
Tabel 4.33 Pengujian K-Fold Cross Validation 91-100................................. 71
Tabel 4.34 Confusion Matriks Fold 10 .......................................................... 72
Tabel 4.35 Hasil Keselurahan Pengujian........................................................ 73
xii
DAFTAR GAMBAR
Gambar 2.1 Skema 10 Fold Cross Validation.................................................. 18

Gambar 3.1 Model Pengembangan Eksperimen .............................................. 26
Gambar 3.2 Metode Waterfall .......................................................................... 27
Gambar 3.3 Alur Proses Proprocessing ........................................................... 28
Gambar 3.4 Diagram Alur Pembobotan TF-IDF ............................................. 30
Gambar 3.5 Alur Sistem Secara Umum ........................................................... 32
Gambar 3.6 Context Diagram ........................................................................... 33
Gambar 3.7 Diagram Level 0 ........................................................................... 33
Gambar 3.8 Diagram Level 1 ........................................................................... 34
Gambar 4.1 Halaman Login ............................................................................. 49
Gambar 4.2 Username dan Password Salah .................................................... 50
Gambar 4.3 Halaman Home/Beranda .............................................................. 50
Gambar 4.4 Halaman Stemming ....................................................................... 51
Gambar 4.5 Halaman Klasifikasi...................................................................... 51
Gambar 4.6 Halaman Data Testing .................................................................. 52
Gambar 4.7 Halaman Preprocessing Data Training ........................................ 52
Gambar 4.8 Halaman Preprocessing Data Testing .......................................... 52
Gambar 4.9 Halaman Data Testing .................................................................. 53
Gambar 4.10 Klasifikasi NBC.......................................................................... 53
Gambar 4.11 Halaman Hasil Klasifikasi .......................................................... 54
Gambar 4.12 Halaman Hasil Pengujian ........................................................... 54
Gambar 4.13 Grafik Hasil Pengujian Akurasi.................................................. 72
xiii
BAB I
PENDAHULUAN
A. Latar Belakang
Perkembangan teknologi saat ini sudah berkembang begitu pesat.
Perkembangan teknologi ini menyebabkan terjadinya ledakan jumlah dokumen
elektronik yang tersimpan di dalam sebuah repository perpustakaan Universitas.
Berbagai karya ilmiah dari sivitas akademika mulai dari skripsi, laporan
penelitian, laporan kerja praktik dan lain sebagainya telah tersedia dalam versi
digital. Umumnya dokumen-dokumen elektronik tersebut tidak disertai dengan
jumlah informasi atau pengetahuan yang dapat disarikan sehingga menimbulkan
penumpukan dokumen dan akan menyita resource atau memori untuk
menyimpan data tersebut (Gupta, 2012).
Tujuan pendidikan mengarah pada membentuk manusia terdidik yang
secara substansi manusia terdidik terbatas pada pengembangan kemampuan-
kemampuan tertentu, mempersiapkan peserta didik untuk dapat hidup di
masyarakat dan ditentukan oleh pihak luar individu adalah manusia yang
memiliki kecerdasan intelektual dan kecerdasan emosional. Sehingga dalam
tataran praktikal, usaha untuk memanusiakan manusia dan membentuk manusia
terdidik. Artinya, semua orang, semua lembaga, sejatinya saling melengkapi
dalam upaya mencapai tujuan pendidikan (Soyomukti dkk 2015).
1
2
Skripsi merupakan salah satu syarat yang harus dipenuhi oleh mahasiwa
untuk menyelesaikan Pendidikan di suatu perguruan tinggi. Begitu pun dengan
program studi informatika Fakultas Teknik Universitas Sulawesi Barat
(UNSULBAR) mewajibkan setiap mahasiswa tanpa terkecuali melakukan sebuah
penelitian yang dikemas dalam skripsi dan menjadi tugas akhir. Pembuatan skripsi
yang dilakukan mahasiswa bertujuan untuk agar mahasiswa mampu menyusun
dan menulis suatu karya ilmiah, sesuai dengan bidang ilmunya. Skripsi
merupakan tugas wajib yang dilakukan oleh mahasiswa sebagai syarat untuk
memperoleh gelar sarjana, skripsi adalah karya ilmiah yang diwajibkan sebagai
bagian dari persyaratan akademis diperguruan tinggi. Semua mahasiswa wajib
mengambil mata kuliah skripsi karena skripsi digunakan sebagai salah satu
prasyarat bagi mahasiswa untuk memperoleh gelar sarjana.
Pengambilan topik skripsi, pada program studi teknik informatika
memberikan beberapa pilihan topik atau peminatan yang dapat dipilih oleh
mahasiswa. (Muhammad Rafi Muttaqin dkk, 2020). Hal tersebut bertujuan agar
konsentrasi lebih spesifik dan terarah dalam satu bidang.
Judul skripsi yang sudah dibuat mahasiswa khususnya pada program studi
Teknik Informatika Unsulbar, Terdapat tiga konsentrasi yaitu Sistem cerdas
(Smart System), Rekayasa Perangkat Lunak (Software Engineering) dan Jaringan
Komputer (Internet Of Thing). Namun pengelompokan judul tugas akhir
mahasiswa di UNSULBAR khususnya prodi Informatika belum terklasifikasi
secara maksimal, sesuai dengan peminatan dan pengembangan ilmu informatika

3
yang terus berubah mengikuti perkembangan zaman. Hal tersebut diharapkan
dapat membantu dalam meberikan gambaran kepada mahasiswa untuk mencari
judul yang relevan dengan bidang konsentrasi mahasiswa tersebut. Untuk itu
dalam penelitian ini bertujuan untuk melakukan klasifikasi atau pengelompokan
topik skripsi mahasiswa yang ada dijurusan teknik informatika. Pengelompokan
skripsi dilakukan dengan melihat judul dari setiap skripsi yang telah dibuat oleh
mahasiswa. Judul ini dipilih karna dapat mendefenisikan istilah secara lebih
ringkas dan jelas pada setiap bidang penelitian skripsi, sehingga dapat digunakan
untuk mengklasifikasi topik skripsi mahasiswa diprodi teknik informatika.
Terdapat banyak teknik klasifikasi yang dikenal. Teks mining salah satu teknik
yang digunakan untuk melakukan klasifikasi dokumen dimana teks mining
merupakan variasi data mining yang berusaha menetukan pola menarik dari
sekumpulan data tekstual yang berjumlah besar (Khalida dan Bharata, 2020).
Berdasarkan uraian permasalahan diatas maka penulis mengangkat sebuah
penelitian sebagai tugas akhir dengan judul “Pengelompokan Judul Penelitian
Mahasiswa Menggunakan Algoritma Naive Bayes Pada Program Studi
Teknik Informatika”.
B. Rumusan Masalah
Berdasarkan latar belakang masalah diatas maka diperoleh rumusan
masalah yaitu bagaimana hasil implementasi sistem pengelompokan judul
penelitian mahasiswa menggunakan algoritma Naive Bayes pada program studi
teknik informatika?
4
C. Tujuan Penelitian
Adapun tujuan dari penelitian ini yaitu untuk mengetahui hasil
implementasi sistem pengelompokan judul penelitian mahasiswa menggunakan
algoritma Naive Bayes pada program studi teknik informatika.
D. Manfaat Penelitian
Adapun manfaat yang ingin diperoleh kategori judul penelitian yang
diajukan sekaligus melakukan klasifikasinya.
1. Bagi penulis dapat mengetahui bagaimana cara menerapkan ilmu-ilmu yang
sudah dipelajari selama perkuliahan terutama yang terkait text mining.
2. Bagi pihak instansi khususnya perpustakaan yang menjadi objek penelitian
dapat menerapkan pengelompokan dokumen skripsi ini untuk memudahkan
dalam hal penyusunan dokumen-dokumen skripsi yang baru.
3. Dapat dijadikan acuan untuk melihat kedekatan topik yang hampir sama antar
skripsi yang ada. Sehingga dapat digunakan sebagai referensi agar penelitian
skripsi yang baru bisa lebih variatif dari penelitian skripsi yang sudah pernah
dilakukan sebelumnya.
E. Batasan Masalah
Adapun batasan masalah dari penelitian ini yaitu :
1. Algoritma yang digunakan dalam mengklasifikasikan judul penelitian
mahasiswa prodi teknik informatika yaitu Naive Bayes.
2. Data yang diambil hanya dari mahasiswa prodi Teknik Informatika
Universitas Sulawesi Barat periode

BAB II
TINJAUAN PUSTAKA
A. Tugas Akhir
Skripsi menjadi syarat bagi mahasiswa untuk meraih gelar akademiknya
sekaligus menjadi tolak ukur untuk melihat sejauh mana pemahaman mahasiswa
terhadap ilmu yang telah dipelajarinya melalui penelitian yang dilakukan
berdasarkan fenomena atau permasalahan yang terjadi. Menurut Barnawi (2015).
Tugas akhir adalah suatukarya tulis ilmiah hasil penelitian pustaka atau lapangan
yang harus dipertahankan dihadapan penguji sebagai salah satu syarat
memperoleh gelar Sarjana (Strata-1).
Skripsi dibuat berdasarkan penugasan akademik dari institusi pendidikan
kepada mahasiswa program Sarjana di tingkat akhir. Menurut Machmud (2016)
tugas akhir merupakan salah satu jenis karya ilmiah yang disusun oleh mahasiswa
dibawah bimbingan dosen pembimbing sehingga memenuhi kaidah dan standar
kualitas sesuai dengan keilmuannya. Penulisan laporan tugas akhir harus
mengikuti kaidah dan petunjuk teknis penulisan, baik yang diterbitkan oleh
program studi masing-masing ataupun literatur yang membahas tentang penulisan
karya ilmiah (tugas akhir).
Menurut Syahdrajat (2015) tugas akhir merupakan dokumentasi berharga
diperguruan tinggi yang dapat dijadikan sebagai sumber informasi dan sumber
pembelajaran bagi segenap civitas akademik. Tugas akhir berguna dalam hal
berbagai pengetahuan dengan sejawat dan rekan-rekan untuk memberikan
5
6
sumbangan pada pendidikan, bermanfaat bagi pembaca ataupun adik-adik kelas
diperguruan tinggi dan generasi-generasi mahasiswa dimasa yang akan datang.
Berdasarkan pengertian dan uraian diatas, dapat disimpulkan bahwa tugas
akhir merupakan karya tulis ilmiah yang disusun untuk merefleksi atau
mengaplikasikan pengetahuan dan keterampilan yang sudah dimiliki sekaligus
untuk memenuhi syarat guna memperoleh gelar sarjana penuh pada tingkat
pendidikan strata satu.
B. Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik
pembelajaran computer (machine learning) untuk menganalisis dan mengekstraksi
pengetahuan (knowledge) secara otomatis. Data mining berisi pencarian trend atau
pola yang diinginkan dalam database besar untuk membantu pengambilan
keputusan di waktu yang akan dating. Pola-pola ini dikenali oleh perangkat
tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan
yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja
menggunakan perangkat pendukung keputusan lainnya (Mandias, 2015).
C. Klasifikasi
Klasifikasi merupakan bagian dari algoritma data mining, klasifikasi ini adalah
algoritma yang menggunakan data dengan target (class/label) yang berupa nilai
kategorikal/nominal (Rifqo & Wijaya, 2017). Sedangkan data mining merupakan proses
ataupun kegiatan untuk mengumpulkan data yang berukuran besar kemudian
mengekstraksi data tersebut menjadi informasi informasi yang nantinya dapat digunakan
(Putro et al, 2021).

7
Proses ini akan digunakan data training set atau data sampel yang telah
diketahui label – label atau atribut dari data sampel tersebut untuk membangun
model.
1. Proses Testing
Pada proses Testing ini dilakukan untuk mengetahui keakuratan model yang
telah dibuat pada proses training maka dibangun data yang disebut dengan data
testing untuk mengklasifikasi label – labelnya.
D. Text Preprocessing
Text preprocessing adalah proses awal dalam text mining. Preprocessing
dilakukan untuk menghilangkan bagian teks yang tidak diperlukan sehingga
mendapatkan data yang berkualitas untuk dieksekusi (Sanjaya, S., & Absar, E. A.,
2015). Adapun tahapan preprocessing berdasarkan proses yaitu:
1. Tokenizing
Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata
yang menyusunnya. Dan spasi digunakan untuk memisahkan antar kata yang
disebutkan pada prinsipnya ini adalah memisahkan setiap kata yang menyusun
suatu dokumen (Asian, 2007). Proses ini juga dilakukan penghilangan angka,
tanda baca, dan karakter lain selain huruf alphabet. Hal ini dikarenakan karakter-
karakter tersebut dianggap sebagai pemisah kata (delimiter) dan tidak memiliki
pengaruh terhadap pemrosesan teks.
2. Case Folding
Case folding tahap mengubah semua huruf dalam dokumen menjadi huruf
kecil. Hanya huruf “a” sampai dengan “z” yang diterima. Karakter selain huruf
8
dihilangkan dan dianggap delimiter (pembatas).
3. Filtering/Stopword
Filtering adalah tahap mengambil kata-kata penting dari hasil tokenizing.
Proses filtering dapat menggunakan algoritma stoplist (membuang kata yang
kurang penting) atau wordlist (menyimpan kata penting). Stoplist/ stopworld
adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-
of-words. Pada penelitian ini akan digunakan database stopword removal. Jadi
apabila ada kata yang berada dalam kamus database akan segera dihapus. Untuk
kamus stopword digunakan kamus dari tala.
Filtering adalah tahap pemilihan kata-kata penting dari hasil token, yaitu
kata-kata yang bisa digunakan untuk mewakili isi dari sebuah dokumen. Tahapan
ini adalah dengan melakukan penghilangan stopword dan juga mengubah kata-
kata ke dalam bentuk dasar terhadap kata yang berimbuhan. Stopword merupakan
kosa kata yang bukan merupakan kata unik atau ciri pada suatu dokumen atau
tidak menyampaikan pesan apapun secara signifikan pada teks atau kalimat
(Dragut et al, 2009).
4. Stemming
Stemming merupakan proses yang digunakan untuk menemukan kata dasar
dari sebuah kata dengan menghilangkan semua imbuhan (affixes) baik yang
merupakan awalan (prefixes), sisipan (infixex), akhiran (suffixes), dan kombinasi
dari awalan serta akhiran (confixes) pada kata turunan.
Stemming adalah proses pengubahan bentuk kata menjadi kata dasar atau
tahap root kata dari setiap kata hasil filtering. Stemming yang digunakan yaitu
9
stemming Nazief dan Adriani karena algoritma ini memiliki akurasi lebih besar
dibandingkan dengan algoritma Porter (Agusta, L. 2009).
E. Term Weighting
Term Weighting Menurut Asian (2007), term weighting adalah suatu
pembobotan kata dalam suatu dokumen. Perhitungan bobot tiap term dicari pada
setiap dokumen bertujuan untuk dapat mengetahui ketersediaan dan kemiripan
suatu term di dalam dokumen.
1. Term Frequency
Menurut Wurdianarto, Novianti dan Rosyidah (2014), term frequency
adalah algoritma pembobotan heuristik yang menentukan bobot dokumen
berdasarkan kemunculan term. TF adalah frekuensi kemunculan sebuah term
(kata/frasa) dalam dokumen yang bersangkutan. Semakin besar jumlah
kemunculan suatu term dalam dokumen, maka semakin besar pula bobotnya.
Untuk mendapatkan nilai TF dapat digunakan persamaan :
tft,x = ft,x (2.1)
Dimana :
x = dokumen ke-x
t = term atau kata ke-t
tft,x = banyaknya kemunculan term ke-t pada dokumen ke-x
ft,x = Frekuensi kemunculan term t dalam seluruh dokumen
2. Inverse Document Frequency (IDF)
Inverse Document Frequency (IDF) merupakan sebuah perhitungan dari
bagaimana term didistribusikan secara luas pada koleksi dokumen yang
bersangkutan. Sebelum menentukan IDF, diperlukan untuk mencari Document
Frequency (DF) yaitu banyaknya dokumen yang mengandung term atau token
10
kata ke- .Untuk mendapatkan nilai IDF dapat digunakan persamaan:

N
idft = log d⁄ (2.2)
t
Dimana :
𝑖𝑑𝑓𝑡 = inverse jumlah dokumen yang mengandung term ke-t

N = banyaknya seluruh dokumen
𝑑𝑓𝑡 = banyaknya dokumen yang mengandung term ke-t
3. Term Frequency Inverse Document Frequency (TF-IDF)
TF-IDF adalah sebuah metode yang biasanya digunakan untuk
menetapkan nilai frekuensi di setiap kata dalam dokumen atau artikel. Dalam
perhitungan setiap kata seberapa relevan kata tersebut dalam sebuah dokumen.
(Evan dan Pranowo, 2014)
TF-IDF merupakan algoritma yang pada umumnya digunakan dalam
pengolahan data yang besar, algoritma ini untuk pembobotan dalam setiap kata
dan kategori untuk mencari kesamaan kata kunci pada katagori yang ada.
Sebelum proses pembobotan kata akan dilakukan tahapan-tahapan text Pre-
processing berikut :
1. tokenizing
2. case folding
3. filtering
4. stemming
Kemudian selanjutnya adalah proses penghitungan bobot TF-IDF, bobot
query relevance dan bobot similarity. (Marlinda dam Rianto, 2013) Untuk
menghitung nilai TF-IDF yaitu:
wt,x = tft,x x idft (2.3)

11
Keterangan :
𝑤𝑡,𝑥 = bobot term terhadap dokumen

𝑡𝑓𝑡 ,𝑥 = Jumlah kemunculan term dalam dokumen
𝑖𝑑𝑓𝑡 = inverse jumlah dokumen yang mengandung term ke-t
F. Algoritma Naive Bayes
Algoritma Naive Bayes termasuk kategori klasik dengan konsep probabilitas
yang simpel. Meski demikian, algoritma ini memberikan performansi cukup baik
untuk banyak kasus modern dengan data yang besar. Algoritma Naive Bayes
menggunakan sebuah teorema kuno warisan abad ke18, yang ditemukan oleh
Thomas Bayes. Dalam Teorema Bayes, suatu probabilitas bersyarat dinyatakan
sebagai berikut.
𝑃( 𝐻 |𝑋 ) 𝑃( 𝐻)
𝑃(𝐻|𝑋 ) = (2.4)
𝑃(𝑋)
Dimana X adalah bukti, H adalah hipotesis, P(H |X) adalah probabilitas
bahwa hipotesis H benar untuk bukti X atau dengan kata lain P(H|X) merupakan
probabilitas posterior H dengan syarat X. P(X | H) adalah probabilitas bahwa
bukti X benar untuk hipotesis H atau probabilitas posterior X dengan syarat H,
P(H) adalah probabilitas prior hipotesis H, dan P(X) adalah probabilitas prior
bukti X.
Dalam bidang machine learning, X adalah sebuah tuple atau objek data, H
adalah hipotesis atau dugaan bahwa tuple X adalah kelas C. Secara spesifik dalam
masalah klasifikasi P (H | X) sebagai probabilitas bahwa hipotesis H benar untuk
tuple X atau dengan kata lain P (H | X) adalah probabilitas bahwa tuple X berada
dalam kelas C. Sementara itu, P(H) adalah probabilitas prior bahwa hipotesis H
12
benar untuk setiap tuple tidak peduli nilai-nilai atributnya sedangkan P(X) adalah
probabilitas prior dari tuple X.
Proses penggunaan model Naive Bayes classifier himpunan data training set
dimisalkan sebagai D, yang berisi sejumlah tuple X. Kelasnya dimisalkan sebagai
m, yaitu (𝐶1 , 𝐶2 , … 𝐶𝑚) adalah data bertipe kategorial untuk sebuah tuple masukan
X, setiap tuple adalah berdimensi n yang dinyatakan sebagai 𝐴1 , 𝐴2 , … 𝐴𝑛.
Probabilitas prior masing – masing kelas dihitung sehingga dihasilkan sebuah
tabel kelas, dimana P(𝐶 𝑖) = jumlah tuple dikelas 𝐶𝑖 dibagi total semua tuple dalam
himpunan data latih D.
Hitung probabilitas setiap nilai pada semua n atribut (𝐴1 , 𝐴2 , … 𝐴𝑛) untuk
seluruh m kelas (𝐶1 , 𝐶2 , … 𝐶𝑚) sehingga dihasilkan sejumlah n tabel probabilitas,
jika ada probabilitas bernilai 0, maka dilakukan Laplacian correction. Laplacian
correction atau additive smoothing adalah suatu cara untuk menangani nilai
probabilitas 0 (nol). Dari sekian banyak data di training set, pada setiap
perhitungan datanya ditambah 1 (satu) dan tidak akan membuat perbedaan yang
berarti pada estimasi probabilitas sehingga bisa menghindari kasus nilai
probabilitas 0 (nol). Sehingga dihasilkan sebanyak (n + 1) tabel, yaitu : satu tabel
probabilitas kelas dan n tabel berisi probabilitas setiap nilai pada semua atribut
yang ada. Persamaan Laplacian correction dapat dilihat pada persamaan (2.2)
berikut.
P(𝑋𝑘𝑗 | 𝐶𝑖 ) = 𝑓(𝑋𝑘𝑗 | 𝐶 𝑖 ) +1 (2.5)

f (𝐶𝑖)+ | W |
13
Dimana,
P(𝑋𝑘𝑗 | 𝐶𝑖 ) adalah peluang kata 𝑋𝑘𝑗 pada kategori 𝐶𝑖,
𝑓 (𝑋𝑘𝑗| 𝐶𝑖 ) adalah nilai frekuensi kemunculan kata 𝑋𝑘𝑗 pada kategori 𝐶𝑖,
𝑓 (𝐶 𝑖) adalah jumlah frekuensi kemunculan kata pada kategori 𝐶 𝑖,
|W| adalah jumlah keseluruhan atribut kata (token) yang digunakan.
Untuk memprediksi label kelas dari tuple X, maka harus dihitung probabilitas
P(X | 𝐶𝑖) P(𝐶𝑖) untuk setiap kelas 𝐶𝑖. Selanjutnya mencari kelas 𝐶𝑖 yang
menghasilkan probabilitas P(X | 𝐶 𝑖) P(𝐶𝑖) maksimum sebagai kelas keputusan.
Persamaan berikut dapat digunakan untuk mengklasifikasikan sebuah tuple
masukan dengan mencari probabilitas maksimum dari semua kelas yang ada
(Suyanto, 2018).
P(X|𝐶𝑖) P(𝐶 𝑖) = (∏𝑛𝑘=1 P(𝑋𝑘|𝐶𝑖) x P(𝐶𝑖 )=(P(𝑋1 |𝐶𝑖 )x … x P(𝑋𝑛|𝐶𝑖 )) x P(𝐶𝑖) (2.6)
Jika dan hanya jika.
P(X | 𝐶 𝑖 ) P(𝐶𝑖 ) > P(X | 𝐶 𝑗 ) P(𝐶𝑗 ) untuk 1 ≤ 𝑗 ≤ 𝑚, 𝑗 ≠ 𝑖 Dapat
disederhanakan ke dalam persamaan berikut.
P(𝐶𝑖) = P(𝐶𝑖 )∏𝑛𝑘=1 P(𝑋𝑘|𝐶𝑖 ) (2.7)
Naive Bayes adalah metode yang dapat melakukan pekerjaan dengan
efisien. Jika input dianggap seperangkat atribut, seperti kata-kata, kita bisa
menghitung probabilitas apakah halaman web milik kelas tertentu atau tidak.
Proses ini terdiri dari dua fase: fase training dan fase klasifikasi. Pada fase
training, filternya akan dilatih menggunakan kumpulan kata yang dikenal untuk
diklasifikasikan ke dalam halaman web. Berdasarkan kemunculannya masing-
masing kata diberikan probabilitas untuk kapasitasnya untuk menentukan kelas
klasifikasinya. Kemudian, gunakan koleksi kata filter untuk mengklasifikasikan
setiap halaman web di fase klasifikasi (Aris J. Ordoñez, 2018).

14
G. PHP
Menurut MADCOMS php adalah salah satu bahasa pemograman yang
berjalan dalam sebuah web server dan berfungsi sebagai pengolah data pada
sebuah server. Dengan menggunakan program PHP, sebuah website akan lebih
interaktif dan dinamis. PHP adalah sebuah bahasa program yang berbasis on the
fly creation, yang mengerjakan perintahnya ketika ada permintaan PHP
melakukan intrepretasi/peterjemahan skripnya pada waktu berada di server dan
yang akan diberikan kepada peminta adalah sebuah HTML murni, tanpa terdapat
skrip PHP satupun. Hal ini berbeda dengan skrip-skrip lain yang bekerja pada
client seperti java script atau Vbscript yang mengintrepretasikan skripnya pada
browser. PHP merupakan bahasa yang hanya dapat berjalan pada server yang
hasilnya dapat ditampilkan pada client, interpreter PHP dalam mengeksekusi
kode PHP pada sisi server (disebut Server-side) berbeda dengan mesin maya java
yang mengeksekusi program pada sisi client (client side ) (Solichin, A. 2016)
H. MySQL
MySQL adalah sebuah database yang didukung oleh PHP untuk
mendapatkan koneksi dan Query pada database tersebut. PHP memang
mendukung banyak database tetapi kita mengambil yang umum yaitu MySQL
dapat menyimpan semua data website seperti berita, artikel, counter dan
sebagainya dengan mudah dan terstruktur dan dapat membuka kembali dengan
mudah dan cepat.

15
Berikut merupakan beberapa fitur atau karakteristik dari MySQL yaitu :
1. Fungsi-fungsi SQL diimplementasikan kedalam class library, dan cepat dalam
melakukan Query dan biasanya tidak ada alokasi memori setelah inisialisasi
query.
2. Hak istimewa yang sangat fleksibel pada sistem password yang sangat aman
karena semua jalur password di enkripsi ketika melakukan koneksi keserver.
3. Dapat melakukan penyempurnaan pada line database pada query yang sama.
4. Mendukung ODBC(Open Database Conectivity) untuk win 32 Windows.
5. Mampu menangani database hingga 50.000.000 record dan 60.000 tabel.
6. Semua kolom mempunyai nilai default.
7. Ditulis dalam bahasa C dan C++ dan telah diuji oleh berbagai compiler. Tidak
ada kebocoran memori dan telah teruji dengan pendeteksian komersial
(Solichin, 2016).
I. XAMPP
Xampp merupakan paket web server berbasis open source yang dapat
dipasang pada beberapa sistem operasi yang ada (Windows, Linux, dan Mac
OS) (Riyanto dan Slamet, 2014). Menurut Kurniawan (2009), XAMPP
merupakan tool yang menyediakan paket perangkat lunak ke dalam satu buah
paket. Dengan menginstal XAMPP maka tidak perlu lagi melakukan instalasi
dan konfigurasi web server apache, PHP, dan MySQL secara manual. XAMPP
akan menginstalasi dan mengkonfigurasikan secara otomatis.

16
J. Confusion Matrix
Metode ini menggunakan tabel matriks seperti pada tabel dibawah, dimana
jika data set hanya terdiri dari dua kelas, kelas yang satu dianggap sebagai positif
dan yang lainnya negatif (Baharuddin, 2019).
Tabel 2.1 Confusion Matrix
Klasifikasi Data Diklasifikasikan Sebagai

Benar + (0) - (1)
+ (0) True Positive False Negative
-(1) False Positive True Negative
Dimana:
True Positive (TP) : Merupakan data positif yang diprediksi benar
True Negative (TN) : Merupakan data negatif yang diprediksi benar.
False Postive (FP) : Merupakan data negatif namun diprediksi sebagai data
positif.
False Negative (FN) : Merupakan data positif namun diprediksi sebagai data
negative.
K. Accuracy
Accuracy adalah suatu metode yang digunakan untuk melakukan
perhitungan tingkat akurasi data dengan hasil yang diperoleh pada pengujian.
Proses perhitngan nilai Accuracy disini merupakan rasio prediksi Benar (positif
dan negatif) dengan keseluruhan data. Pada penelitian menggunakan rumus
akurasi yaitu (Baharuddin dan Hasanuddin, 2019).
Accuracy = (TP + TN) / (TP+FP+FN+TN) (2.8)
Dimana :
True Positive (TP) : Merupakan data positif yang diprediksi benar
True Negative (TN) : Merupakan data negatif yang diprediksi benar.
positif.
negative.
17
L. Perhitungan Presisi
Presisi atau precission Merupakan rasio prediksi benar positif dibandingkan
dengan keseluruhan hasil yang diprediksi positf. Precission digunakan untuk
menjawab pertanyaan “Berapa persen judul skripsi yang hasil prediksi dengan
benar berdasarkan kategori dari keseluruhan mahasiswa yang diprediksi benar”
(Baharuddin, M. M., Azis, H., & Hasanuddin, T. 2019).
Precission : (TP) / (TP + FP) (2.9)
Dimana :
True Positive (TP) : Merupakan data positif yang diprediksi benar.

positif.
negative.
M. Recall
Recall merupakan rasio prediksi benar positif dibandingkan dengan
keseluruhan data yang benar positif (Baharuddin dan Hasanuddin, 2019).
Recall = (TP) / (TP + FN) (2.10)
True Positive (TP) : Merupakan data positif yang diprediksi benar.

negative.
N. K-Fold Cross Validation
Menurut Pandie (2012) k-fold cross validation merupakan salah satu
metode yang diigunakan untuk mengetahui rata-rata keberhasilan dari suatu
sistem dengan cara melakukan perulangan dengan mengacak atribut masukan
sehingga sistem tersebut teruji untuk beberapa atribut input yang acak. K-Fold
cross validation diawali dengan membagi data sejumlah fold yang diinginkan.
18
Dalam proses cross validation data akan dibagi dalam n bauh partisi dengan
ukuran yang sama D1, D2, D3. Dn selanjutnya proses testing dan training
dilakukan sebanyak n kali. Dalam iterasi ke -I partisi akan menjadi data testing
dan sisanya akan menjadi data training. k=5 atau k=10 dapat digunakan untuk
memperkirakan tingkat kesalahan yang terjadi, sebab data training pada setiap
fold cukup berbeda dengan data training yang asli. Secara keseluruhan, 5 atau 10
fold cross validation sama-sama merekomendasikan dan disepakati bersama.
Menghitung nilai akurasinya dapat dilakukan dengan menggunakan persamaan :

𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑥 100% (2.11)
𝐽𝑢𝑛𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑢𝑗𝑖
Langkah pertama untuk mendapatkan k-optimal dengan pengulangan 10
kali percobaan adalah membagi data training sebanyak 10 bagian atau kelompok
data yang sama seperti gambar 2.2
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
Testing Training
Gambar 2.1 Skema 10 Fold Cross Validation
Berdasarkan gambar diatas, pada bagian blok 1 terdiri dari data yang akan
berperan sebagai data testing dan blok lainnya berperan sebagai data training.
Setiap data testing dilakukan prediksi menggunakan algoritma naive bayes . hasil
19
klasifikasi prediksi naive bayes dibandingkan dengan klasifikasi data real dan
dihitung jumlah prediksi yang cocok dengan data asli. Tingkat akurasi yang tinggi
itulah yang terpilih menjadi nilai k terbaik (Banjarsari, 2015).

20
O. Penelitian Terkait
Tabel 2.2 State Of The Art
No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
1 Ramadhan Pengembangan penelitian ini menghasilkan Pelitian tersebut Perbedaan dengan
Rakhmat Sani, aplikasi penentuan sebuah aplikasi yang sudah memiliki persamaan penelitian penulis adalah
Junta Zeniarza, tema tugas akhir mampu melakukan proses yang sama tentang algoritma yag digunakan
Ardytha Luthfiarta berdasarkan data klasifikasi data abstrak tugas penetuan tema tugas berbeda dimana penulis
(Tahun 2016) abstrak akhir untuk menentukan akhir berdasrkan data mengguanakan algoritma
menggunakan kelasnya dengan baik. abstrak. Naive Bayes sedangkan
algoritma K-Nearest Aplikasi yang dikembangkan jurnal rujukan
Neighbor untuk penentuan tema tugas menggunkan algoritma
akhir pada perpustakaan dapat K-Nearest Neighbor.
menjadi solusi bagi operator
pada perpustakaan dalam
pendataan.
2 Ahmad Fathan Penerapan text Perhitungan precision, recall, Menggunakan Perbedaan dengan
Hidayatullah dan mining dalam dan f-score diketahui bahwa metode yang sama penelitian penulis adalah
Muhammad Rifqi klasifikasi judul hasil perhitungan ketiganya Naive Bayes penelitian tersebut
Ma’arif (Tahun skripsi memiliki pola yang sama membahas tentang
2016) dengan perhitungan akurasi. pengelompokan judul
Secara keseluruhan, hasil penelitian sedangkan
perolehan f-score dengan jurnal rujukan membahas
algoritma Naive Bayes tentang penerapan text
memberikan hasil yang lebih mining dalam klasifikasi
tinggi dibandingkan dengan judul skripsi.
algoritma SVM. Model
21
klasifikasi yang dibangun
dengan Naïve Bayes memiliki
nilai tertinggi ketika
menggunakan fitur trigram,
sementara model klasifikasi
yang dibangun dengan SVM
memiliki nilai tertinggi ketika
menggunakan fitur unigram.
3 Oman Somantri, Metode K-Means Model SVM dan K-Means Pelitian tersebut Perbedaan dengan
Slamet Wiyono, untuk optimalisasi dapat digunakan oleh para memiliki persamaan penelitian penulis adalah
Dairoh (Tahun klasifikasi tema pengambil kebijakan dalam yang sama tentang penelitian ini
2016) tugas akhir menglasifikasikan kategori mengkalasifikasi menggunakan algoritma
mahasiswa tugas akhir sebagai pendukung tugas akhir Naive Bayes sedangkan
menggunakan keputusan dalam penentuan mahasiswa. jurnal rujukan
support vector tema tersebut. K-Means menggunakan algoritma
machine (SVM) menjadi model untuk K-Means dan support
optimalisasi untuk dapat vector machine (SVM).
meningkatkan tingkat akurasi
model SVM dalam
mengklasifikasikan kategori
tema tugas akhir.
4 Utomo Pujianto, Penerapan algoritma Sistem klasifikasi yang Penelitian tersebut Perbedaan dengan
Triyanna naïve bayes classifier dikembangkan telah berhasil memiliki persamaan penelitian penulis adalah
Widiyaningtyas, untuk klasifikasi mengelompokan judul skripsi yang sama tentang penelitian tersebut
Didik Dwi judul skripsi dan dan tugas akhir berdasarkan mengklasifikasi tugas membahas tentang
Prasetya, Bintang tugas akhir Kelompok Bidang Keahlian akhir mahasiswa pengelompokan judul
Romadhon (Tahun berdasarkan (KBK) di Jurusan Teknik berdasarkan penelitian sedangkan
22
2017) kelompok bidang Elektro FT UM. Pengujian kelompok bidang jurnal rujukan membahas
keahlian performa penerapan algoritma keahlian. tentang penerapan
Naïve Bayes Classifiers algoritma Naive Bayes
menggunakan teknik K-Fold classifier untuk
Cross Validation, dengan klasifikasi judul skripsi.
jumlah tahap pengujian
sebanyak 10 kali, terhadap
1103 judul skripsi dan tugas
akhir, didapatkan hasil rata-
rata akurasi 94%, presisi 80%,
dan recall 69%.
5 Angga Cahyo Model klasifikasi Hasil penelitian menggunakan Menggunakan Perbedaan dengan
Pradikdo dan abstrak skripsi teknik penelitian action metode yang sama penelitian penulis adalah
Aidina Ristyawan menggunakan text research dengan Naive Bayes. penelitian tersebut untuk
(Tahun 2018) mining untuk menggunakan 9 siklus mengetahui hasil dari
pengkategorian pengujian dan metode text klasifikasi judul
skripsi sesuai bidang mining dengan algoritma penelitian sedangkan
kajian Naive Bayes mendapatkan jurnal rujukan untuk
pengetahuan bahwa siklus ke menghitung nilai
1 merupakan siklus terbaik probabilitas tertinggi dan
dengan akurasi 82,76% dan dapat membantu
juga pada siklus ke 1 jarak memudahkan mahasiswa
antara data testing dan Jumlah untuk mencari referensi.
klasifikasi benar tidak terlalu
jauh.
23
6 Muhammad Rafi Algoritma K-Means Hasil pengelompokan Penelitian tersebut Perbedaan dengan
Muttaqin dan untuk dianalisis dengan melihat memiliki penelitian penulis adalah
Meriska Defriani pengelompokan jumlah mata kuliah pada persamaanyang sama penelitian ini
(Tahun 2020) topik skripsi setiap kelompok bidang tentang menggunakan algoritma
mahasiswa keahlian. Jumlah mata kuliah pengelompokan judul Naive Bayes sedangkan
yang paling banyak pada suatu penelitian. jurnal rujukan
kelompok bidang keahlian menggunakan algoritma
menandakan bahwa K-Means.
mahasiswa memiliki
kemampuan lebih baik pada
bidang tersebut sehingga
direkomendasikan topik
skripsi yang sesuai dengan
kelompok bidang keahlian
tersebut. Dengan pengambilan
topik skripsi yang sesuai
dengan bidang keahlian,
harapannya mahasiswa dapat
menyelesaikan skripsinya
dengan lebih baik dan tepat
waktunya.
7 Muhammad Syafril Penerapan case Untuk rekomendasi topik Penelitian tersebut Perbedaan dengan
Hidayat, Eva Yulia based reasoning skripsi terbaik dengan memiliki persamaan penelitian penulis adalah
Puspaningrum, pada sistem menerapkan pemilihan salah yang sama tentang penelitian tersebut
Made Hanindia rekomendasi topik satu dari rekomendasi tiga mengkalsifikasi tugas membahas tentang
Prami Swari skripsi program studi similaritas tertinggi untuk akhir mahasiswa. pengelompokan judul
(Tahun 2020) informatika UPN hasil rekomendasi bidang penelitian sedangkan
24
“VETERAN” Jawa keahlian yang jurnal rujukan membahas
Timur direkomendasikan kepada tentang penentuan topik
mahasiswa yang skripsi terbaik dengan
menggunakan perhitungan menerapkan pemilihan
similaritas manhattan distance salah satu dari
dengan hasil akurasi sistem rekomendasi tiga
sebesar 87.5% dan validasi similaritas tertinggi.
menggunakan k-fold cross
validation memiliki akurasi
sebesar 79%. Nilai threshold
similaritas yang digunakan
pada fase revise adalah 50%.
8 Dezty Adhe Implementasi Text Hasil pengelompokkan yang Penelitian tersebut Perbedaan dengan
Chajannah Mining terbentuk dari dokumen memiliki penelitian penulis adalah
Rachman, dkk Pengelompokkan skripsi menggunakan metode persamaanyang sama penelitian ini
(2021) Dokumen Skripsi K-Means Clustering adalah tentang menggunakan algoritma
Menggunakan sebanyak 2 kelompok dengan pengelompokan judul Naive Bayes sedangkan
Metode K-Means anggota cluster ke-1 sebanyak penelitian. jurnal rujukan
Clustering 85 dokumen dan anggota menggunakan algoritma
cluster ke 2 sebanyak 34 K-Means.
dokumen. Dokumen-dokumen
skripsi yang masuk ke cluster
1 didominasi penelitian
dengan metode data mining
terutama tentang klasifikasi,
analisis runtun waktu, analisis
regresi, analisis data uji hidup,
25
analisis spasial dan operasi
riset. Sedangkan dokumen-
dokumen skripsi yang masuk
ke cluster 2 didominasi
penelitian dengan metode
analisis multivariat,
pengendalian mutu dan
matematika
9. Nurdina, dkk Klasifikasi Nasabah Metode Naive Bayes Persamaan pada Perbedaan pada
(2021) Bank Layak Kredit menunjukkan bahwa kinerja penelitian ini dengan penelitian ini dengan
Menggunakan naive bayes berjalan dengan yang dilakukan oleh yang dilakukan oleh
Metode Naive Bayes baik dan layak untuk di peneliti adalah peneliti adalah
implementasikan atau menggunakan permasalahan yang
digunakan untuk membantu metode yang sama diangkat berbeda karena
pihak dalam memilih calon yaitu naïve bayes peneliti mengangkat
nasabah. Pemilihan kriteria di sebagai klasifikasi. permasalahan tentang
dasarkan pada kriteria yang klasifikasi judul skripsi
diberikan oleh bank BRI
Kabupaten Majene
BAB III
METODE PENELITIAN
A. Jenis Penelitian
Penelitian ini menggunakan metode eksperimen, artinya bahwa penelitian
yang dilakukan untuk melakukan uji coba terhadap permasalahan tertentu dengan
penggunaan teori tertentu sehingga didapatkan hasil pengujian yang tepat antara
permasalahan yang diambil dengan teori yang digunakan. Data yang sudah
didapatkan akan diolah sesuai dengan tujuan dari penelitian ini yaitu
pengelompokan dokumen skripsi dengan menggunakan text mining dan naïve
bayes. Penelitian ini dilaksanakan secara bertahap dengan urutan sebagai berikut;
pertama pengambilan/pengumpulan data; kedua, preprocessing diantaranya
adalah proses case folding, tokenisasi, filtering/stopword, dan stemming; ketiga,
menentukan atribut kata; keempat, klasifikasi terdiri dari training data dan
pengujian terhadap data Testing menggunakan naïve bayes.
Pengumpulan Data
Preprocessing
Pembobotan
Training Data
Data Testing
Klasifikasi Naïve Bayes
Gambar 3.1 Model Pengembangan Eksperim
26
27
B. Metode Pengembangan Sistem
Dalam menunjang penyusunan penelitian ini, maka peneliti menggunakan
metode pengembangan perangkat lunak dan pengumpulan data-data yang
dibutuhkan. Metode yang digunakan pada pengembangan perangkat lunak
perancangan sistem informasi ujian berbasis web menggunakan model waterfall,
alasan menggunakan metode waterfall adalah Karena Metode ini tahapan dan juga
urutan dari metode yang dilakukan berurutan dan berkelanjutan, seperti layaknya
sebuah air terjun. Tahapan - tahapan model waterfall (Sukamto & Shalahuddin,
2013).
Gambar 3.2 Metode Waterfall
1. Defenisi Kebutuhan Perangkat Lunak
Berdasarkan wawancara yang telah dilakukan pada pihak prodi dan
perpustakaan, dapat diketahui bahwa data berupa judul skipsi yang ada, belum
dikelompokkan berdasarkann tema penelitinnya. Maka disimpulkan bahwa perlu
adanya sistem pengkategorian pada judul skripsi berdasarkan tema penelitiannya.
Diharapkan dengan adanya klasifikasi judul, dapat memudahkan mahasiswa
dalam mencari referensi judul skripsi atau tugas akhir berdasarkan tema yang
28
diinginkan. Pengembangan ini berfokus pada penerapan metode naïve bayes
untuk mengelompokkan judul skripsi/tugas akhir pada prodi informatika. Judul
akan dikelompokkan kedalam 3 kategori berdasarkan tema penelitian atau
konsentrasi jurusan yang dipilih. Dalam tahapan data mining ysng akan
dilakukan, dibutuhkan data training untuk pembentukan klasifikasi. Data training
diambil dari data skripsi/ tugas akhir milik jurusan prodi informatika terdahulu.
Jumlah data training tiap kelas/kategori adalah sekitar 50 judul. Pelabelan judul
yang dijadikan data training ditentukan berdasarkan deskripsi tema penelitian atau
atribut kata yang mencirikan kategori tersebut. Penentuan atribut kata dilakukan
dengan wawancara dan divalidasi oleh Kaprodi Informatika.
2. Desain Sistem dan perangkat Lunak
Desain sistem pada penelitian ini, terdiri dari pembuatan flowchart (alur
proses), data flow diagram (DFD). Tahapan judul skripsi pada sistem
digambarkan pada gambar 3.4 tahap training judul skripsi dikelompokkan
kedalam 3 kategori yang telah ditentukan, kemudian dianalisis guna membentuk
aturan klasifikasi. Pada tahap klasifikasi, sebuah dokumen baru yang belum
dikenali dikelompokkan kedalam kategori tertentu menggunakan metode naïve
bayes. DFD dari sistem klasifikasi judul skiripsi ditampilkan pada gambar 3.5,
3,7 dan 3.8
3. Implementasi
Pada tahap ini, dilakukan pembangunan sistem berdasarkan defenisi
kebutuhan dan rancangan sistem. Sistem ini dibangun dengan berbasis web,
menggunakan bahasa pemrograman PHP, pada isi tampilan menggunakan HTML

29
dan CSS. Pada sisi penyimpanan menggunakan MySQL. Sistem yang dibangun
kemudian diuji menggunakan akurasi.
4. Integrasi dan Pengujian Sistem
Pada tahap ini, satuan unit program diintegrasikan, kemudian diuji sebagai
satu sistem yang utuh. Pengujian bertujuan untuk memastikan bahwa sistem telah
memenuhi kebutuhan dan melihat kinerja dari penerapan algoritma klasifikasi.
Teknik pengujian ini dipilih untuk mengukur performa tingkat keakuratan dari
penerapan naïve bayes teknik pengujian K-Fold Cross Validation pada pengujian
K-Fold Cross Validation data training dibagi kedalam lipatan sebanyak k secara
acak tanpa penggantian, dimana lipatan dengan jumlah k-1 digunakan sebagai
model training adalah Apakah dapat mengatasi permasalahan tentang klasifikasi
judul skripsi sedangkan 1 lipatan yang tersisa digunakan untuk pengujian.
Prosedur ini diulang sebanyak k sehingga nantinya akan dapat nodel dan
perhitungan performa sebanyak k (Raschka, 2015). Tahapan pengujian K-Fold
Cross dilakukan sebanyak 10 kali pengujian.
5. Penggunaan dan Pemeliharaan
Pada tahap ini, sistem yang dibuat telah diimplementasikan atau
dioperasikan nyata oleh pengguna. Pemeliharaan sistem dilakukan jika ditemui
error yang belum ditemui pada tahap pengujian sistem sebelumnya.
C. Tahapan Penelitian
Adapun tahapan penelitian yang diperlukan sebagai berikut:
1. Pengambilan data
Pengambilan data dilakukan dengan meminta dokumen judul skripsi

30
kepada pihak Fakultas khususnya program studi Informatika Unsulbar. Data
penting yang dimaksud berupa file judul skripsi yang nantinya akan dijadikan
sebagai data uji coba terhadap keberhasilan sistem mengelompokan dokumen
skripsi yang ada. Data skripsi yang digunakan dalam penelitian ini mulai
angkatan 2009-2018.
2. Preprocessing
Preprocessing bertujuan untuk menyiapkan data agar mudah dianalisis.
Preprocessing terbagi menjadi beberapa proses yang terdiri dari case folding,
tokenizing, dan filtering. Case folding mengubah semua karakter huruf teks
menjadi huruf kecil. Karakter yang diterima hanya ‘a’ hingga ‘z’. Tokenizing
adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.
Filtering adalah proses yang dilakukan dengan mengambil kata-kata penting dari
hasil token dan menghapus stop words. Stop words adalah kata-kata yang tidak
deskriptif sehingga dapat dibuang atau dihilangkan dan tidak berpengaruh ke
dalam proses. Dalam bahasa Indonesia, contoh stop words seperti “yang”, “dan”,
“dari”, “di”, “seperti” dan lainnya.
Tahap ini merupakan tahap awal pengolahan data. Data yang digunakan
merupakan file judul skripsi, maka tahap ini sangat dibutuhkan untuk proses
pengolahan data selanjutnya. Seperti yang telah dijelaskan dibab 2, pada tahapan
preprocessing ada beberapa sub prosess yang akan dilakukan yaitu case folding,
tokenisasi, filtering/stopword dan stemming. Dimana pada tahap ini judul skripsi
ini akan diproses menggunakan text mining yaitu preprocessing.

31
Mulai
Judul Skripsi
Tokenisasi
Case Folding
Filtering/Stopword
Stemming
Kumpulan Kata Dasar
Selesai
Gambar 3.3 Alur Proses Preprocessing
a. Tokenisasi
Tahap tokenisasi adalah sebuah proses yang dilakukan untuk
menghilangkan tanda baca, angka dan semua karakter selain alphabet. Setelah itu
semua karakter selain alphabet dihilangkan, maka langkah selanjutnya yaitu
melakukan perubahan semua huruf kapital menjadi huruf kecil atau yang biasa
disebut case folding. Selanjutnya yaitu menyimpan setiap kata dari dokumen yang
telah di dapat sebelumnya menjadi kata tunggal (token).

32
b. Case Folding
maka langkah selanjutnya yaitu melakukan perubahan semua huruf kapital
menjadi huruf kecil atau yang biasa disebut case folding
c. Filtering/Stopword
Tahap selanjutnya yaitu filtering/Stopword. Pada tahap ini yaitu
membuang atau menyaring kata-kata yang dapat merepresentasikan isi dari suatu
dokumen dengan mengacu pada kamus stopword yang telah ada untuk
menentukan kata atau term mana yang seharusnya dihilangkan dan tidak
berpengaruh ke dalam proses. Dalam bahasa Indonesia, contoh stop words seperti
“yang”, “dan”, “dari”, “di”, “seperti” dan lainnya.
d. Stemming
Stemming merupakan tahapan proses untuk mengambil suatu kata inti atau
kata dasar dari hasil filtering . pada tahap ini akan dilakukan penghilangan kata
imbuhan awalan dan akhiran sehingga menghasilkan kata dasar dari setiap kata
(token).
3. Pembobotan Kata
Pembobotan adalah proses mengubah kata menjadi bentuk angka atau
vektor. TF adalah frekuensi dari kemunculan term dalam dokumen yang
bersangkutan. Semakin besar jumlah kemunculan suatu term dalam dokumen,
maka akan semakin besar bobotnya atau akan memberikan nilai kesesuaian yang
semakin besar. Sedangkan TF-IDF merupakan metode untuk menghitung nilai TF
dan IDF pada setiap token (kata) disetiap dokumen. Berikut proses pembobotan
TF-IDF yang terdapat pada gambar 3.4 dibawah ini:

33
Mulai
Preprocessing
Hasil Preprocessing
Pembobotan TF
Pembobotan DF
Pembobotan IDF
Pembobotan TF- IDF
Gambar 3.3 Diagram Alur Pembobotan TF-IDF
Penjelasan gambar 3.4 adalah setelah proses hasil preprocessing
didapatkan selanjutnya akan diproses ketahap pembobotan kata atau term.
Pembobotan ini dilakukan untuk mengetahui nilai dari setiap term yang mewakili
isi dokumen. Untuk alur proses dari pembobotan kata ditunjukkan pada gambar
3.4 diatas.
4. Klasifikasi
Proses klasifikasi halaman web menggunakan metode naive bayes
memiliki dua tahap penting yaitu training data dan testing data atau pengujian
terhadap data testing.

34
a. Tahap Training
Pada tahap ini, setiap kata yang telah diketahui nilai bobot TF-IDF nya
akan dijadikan sebagai acuan untuk mencari nilai probabilitas kategori dan
probabilitas masing-masing kata pada setiap term untuk setiap kelas dari data
latih. Pada fase training data, filternya dilatih menggunakan atribut kata yang
dikenal untuk diklasifikasikan ke dalam kategori judul menggunakan metode
naive bayes. Berdasarkan kemunculan masing-masing kata diberikan probabilitas
kapasitasnya untuk menentukan kelas klasifikasinya. Kemudian, menggunakan
koleksi kata filter untuk mengklasifikasikan setiap judul skripsi difase
klasifikasi.
b. Tahap Testing
Setelah melakukan training data yang dilakukan sebelumnya, selanjutnya
adalah melakukan pengujian terhadap model naive bayes dengan menggunakan
data testing atau judul skripsi baru yang telah diketahui kelasnya, ini dilakukan
untuk menguji kebenaran sistem klasifikasi naive bayes. Proses klasifikasi
ditentukan dengan mempelajari jejak atribut yang telah di training sebelumnya.
Tahap ini merupakan tahapan setelah proses training yang telah dilakukan diatas.
Pada tahapan ini dilakukan pengujian dengan cara menggunakan data uji kedalam
model yang telah dibentuk pada tahapan training diatas.
6. Menentukan Atribut Kata
Atribut kata (token) ditentukan berdasrkan dari hasil hitung frekuensi kata
atau kemunculan kata yang benar-benar merepresentasikan isi dari suatu judul
skripsi tersebut. Karena semakin sering kata tersebut muncul, maka dapat
35
dikatakan bahwa kata tersebut mencirikan suatu kelas tertentu. 10 kata yang
paling banyak muncul dan relefan dipilih sebagai atribut kata.
D. Lokasi dan Waktu Penelitian
Penelitian ini dilakukan di Program Studi Informatika Unsulbar, Untuk
melakukan analisis dan mendapatkan data berdasarkan latar belakang masalah
yang telah dipaparkan. Penelitian ini berlangsung dari bulan juli sampai dengan
bulan Agustus 2022. Pengumpulan data diperoleh dari studi literatur serta
wawancara dengan ketua Prodi Informatika Unsulbar.
E. Gambaran Umum Sistem
Gambaran umum ini menjelaskan tahapan yang akan digunakan untuk
memberi gambaran alur dari tiap proses. Berdasarkan permasalahn tersebut maka
diperoleh proses dimana sistem ini diawali dengan memasukkan data latih dengan
kata lain judul skripsi yang sudah diketahui kategori kelasnya yaitu RPL, Sistem
Cerdas, dan Iot. Kemudian diproses menggunakan text mining yaitu tahapan
preprocessing yang sudah dijelaskan sebelumnya. Setelah proses preprocessing
maka dilanjutkan proses selanjuntya menghitung pembobotan kata yang sudah
dijelaskan diatas. Setelah proses pembobotan kata dan sudah diketahui hasilnya
maka akan dilanjutkan pada proses perhitungan bobot probabilitas kemunculan
setiap term pada judul skripsi. menggunakan naïve bayes sehingga menghasilkan
hasil kalsifikasi judul berdasarkan kategori kelasnya. Alur sistem secara umum
dapat dilihat pada gambar 3.5

36
Mulai
Masukkan Data
Latih
Presprocessing
Data Testing
Pembobotan Kata/TF
Klasifikasi NBC
Hasil Klasifikasi
Gambar 3.5 Alur Sistem Secara Umum
F. Perancangan Data Flow Diagram
Data Flow Diagram (DFD) menggambarkan proses apa saja yang akan
berjalan pada sistem klasifikasi ini. Fase ini diawali dengan pembentukan
diagram konteks yang menggambarkan keseluruhan dari suatu sistem. Diagram
konteks dari sistem klasifikasi ini dapat dilihat pada gambar dibawah ini.
1. Context Diagram
Perancangan awal ini menggunakan diagram context yang merupakan
diagram level tertinggi. Pada diagram ini terdapat beberapa komponen yaitu
aktor, proses dan alur data. Aktor pada diagram ini yaitu admin, alur data yaitu
data training, data testing, presprocessing, klasifikasi NBC. Prosesnya yaitu
Hasil klasifikasi pengelompokan judul skripsi berdasarkan kategori. Context
diagram pada sistem ini dapat dilihat pada gambar 3.6

37
Gambar 3.6 Context Diagram
Admin menjadi sumber yang akan mengolah data judul skripsi yang ada
pada sistem ini. Data tersebut berupa judul skripsi yang diperoleh dari prodi
informatika. Admin disini dapat mengolah data judul skripsi melalui beberapa
tahap yaitu penginputan data training, data testing, preprocessing, klasifikasi
NBC dan hasil klasifikasi sehingga akan didapatkan hasil klasifikasi judul
berdasarkan kategorinya. Sistem klasifikasi ini memiliki beberapa proses di
dalamnya yang dapat dilihat pada diagram level 0. Diagram level 0 dapat dilihat
pada gambar 3.7.
Gambar 3.7 Diagram Level 0
Diagram level 0 diatas menggambarkan bahwa dalam sistem klasifikasi ini
terdapat dua proses yaitu proses memproses data training dan proses memproses
38
data testing. Proses preprocessing data terdiri atas judul skripsi dan hasil
klasifikasi. Semua proses ini dapat dilihat pada diagram level 1 yang ditunjukkan
pada gambar 3.8
Gambar 3.8 Diagram Level 1
Diagram level 1 menunjukkan proses klasifikasi judul melalui tahap
preprocessing yaitu judul skripsi yang telah diinput sebelumnya akan diproses
pada tahap preprocessing diantaranya yaitu tokenisasi, case folding,
filtering/stopword dan stemming. Setiap data training dan testing yang melalui
proses preprocessing, hasil pada tahap ini akan diproses lagi pada klasfikasi
judul menggunkan naïve bayes sehingga akan menghasilkan klasifikasi judul
skripsi berdasarkan kategori yaitu RPL, SC, dan IoT.
G. Teknik Pengumpulan Data
Teknik pengumpulan data yang dilakukan dalam penelitian ini adalah
dengan cara mengambil sekumpulan judul skripsi dari situs sintaks informatika
unsulbar berdasarkan kategori kelas yang telah ditentukan yaitu RPL, Sistem
Cerdas, dan Iot. Pengambilan judul skripsi dilakukan secara random/acak
dimana jumlah keseluruhan data yang digunakan sebanyak 250 data judul skripsi
yang terbagi dalam data training sebanyak 150 sedangkan jumlah data testing
sebanyak 100 data untuk di uji validasi kebenaran kelas klasifikasinya sesuai
39
dengan kategorinya.
H. Teknik Analisis Data
Penelitian ini menggunakan analisis data berdasarkan algoritma naive
bayes dimana algoritma ini dapat melakukan pekerjaan dengan efisien. Jika input
dianggap seperangkat atribut, seperti kata-kata, kita bisa menghitung probabilitas
apakah judul skripsi milik kelas tertentu atau tidak. Proses ini terdiri dari dua fase
yaitu fase training dan fase klasifikasi. Pada fase training, filternya akan dilatih
menggunakan kumpulan kata yang dikenal untuk diklasifikasikan berdasarkan
kategori kelasnya. Dari kemunculan term/kata untuk menghitung nilai
probabilitas masing-masing kelas berdasarkan klasifikasinya. Analisis data adalah
proses inspeksi, pembersihan dan pemodelan data dengan tujuan menemukan
informasi yang berguna, menginformasikan kesimpulan dan mendukung
pengambilan keputusan. Hal inilah yang digunakan penulis untuk mengumpulkan
data-data judul skripsi Teknik Informatika Unsulbar, data yang di dapatkan
kemudian di olah sebelum dimasukkan kedalam program untuk melihat apakah
data ini sudah bisa digunakan atau belum.
I. Teknik Pengujian
Pengujian dilakukan untuk mengetahui apakah penggunaan algoritma
Naive Bayes berhasil dalam mengklasifikasikan judul skripsi berdasarkan
kategori kelas yaitu RPL, Sistem Cerdas, dan Iot. Pengujian dilakukan dengan
menggunakan jumlah data training sebanyak 150 data yang diambil dari situs
sintaks Informatika Unsulbar berbasis web. Tahapan selanjutnya dilakukan
pengujian terhadap model klasifikasi naive bayes, dengan menginput data testing
40
sebanyak 100 judul skripsi berdasarkan 3 kelas klasifikasi yaitu RPL, Sistem
Cerdas dan Iot. Dimana pada proses testing ini akan menampilkan hasil validasi
klasifikasi model naive bayes apakah sesuai dengan kelasnya atau tidak. Proses
terakhir yaitu menghitung nilai akurasi dari data testing.

BAB IV
HASIL DAN PEMBAHASAN
A. Hasil
1. Pengolahan Data
Penelitian ini menggunakan data judul skrpsi prodi informatika fakultas
teknik universitas sulawesi barat mulai dari angkatan 2009-2018 yang diambil
dari situs resmi informatika yaitu sintaks informatika untuk melakukan klasifikasi
atau pengelompokan judul skripsi berdasarkan kategori kelasnya yaitu RPL,
Sistem Cerdas dan Iot Dimana situs ini dijadikan sebagai situs bagi mahasiswa
tingkat akhir yang akan mengajukan judul skripsi sebagai tugas akhir. Data yang
digunakan dalam penelitian ini sebanyak 250 judul yang dibagi kedalam data
training sebanyak 150 judul sedangkan untuk data testing sebanyak 100 judul.
Sebelum data judul skripsi diolah menggunakan algoritma naïve bayes, data akan
diolah terlebih dahulu kedalam text mining yaitu preprocessing yang sudah
dibahas dibab sebelumnya. Tabel dibawah ini berisikan dataset yang digunakan
dan telah diberi kelas kategori atau pelabelan manual, untuk melihat jumlah
keseluruhan data dapat dilihat pada lampiran.
Tabel 4.1 Contoh Data Training
No. Judul Kategori

1 Sistem Informasi Pengolahan Data Simpan Pinjam RPL
Koperasi Pegawai Republik Indonesia Karya Dharma
Kabupaten Majene
2 Implementasi Elimination And Choice Translation Reality Sistem Cerdas
(Electre) Untuk Menentukan Calon Pembimbing Tugas
Akhir Mahasiswa
3 Sistem Otomasi Pada Smart Home Berbasis Internet Of Iot
Things (Iot)
41
42
2. Text Preprocessing
Preproses (Preprocessing) atau tahapan preprocessing merupakan tahapan
yang penting dalam melakukan analisa klasifikasi, bertujuan untuk
membersihkan data-data dari unsur-unsur yang tidak dibutuhkan berguna untuk
mempermudah dalam proses klasifikasi.
a. Tokenisasi
Proses memisahkan teks menjadi kata, dikenal sebagai token yang
bertujuan untuk proses memisahkan atau memecah teks atau kalimat menjadi
sebuah kumpulan kata agar mudah dalam melakukan pembobotan tiap kata
nantinya.
Hasil tokenisasi untuk data training judul skripsi dapat dilihat pada tabel 4.3
Tabel 4.3 Hasil Tokenisasi Judul skirpsi
No. Judul Hasil Case Folding Hasil Tokenisasi Kategori

1 Sistem Informasi sistem informasi sistem
Pengolahan Data pengolahan data informasi
Simpan Pinjam simpan pinjam pengolahan
Koperasi Pegawai koperasi pegawai data
Republik Indonesia republik indonesia simpan
Karya Dharma karya dharma pinjam
Kabupaten Majene kabupaten majene koperasi
pegawai RPL
republik
indonesia
karya
dharma
kabupaten
majene
2 Implementasi implementasi implementasi Sistem
Elimination And elimination and elimination Cerdas
Choice Translation choice translation and
43
No. Judul Hasil Case Folding Hasil Tokenisasi Kategori

Reality (Electre)reality (electre) choice
Untuk Menentukan untuk menentukan reality
Calon Pembimbing calon pembimbing electre
Tugas Akhir tugas akhir untuk
Mahasiswa mahasiswa menentukan
calon
pembimbing
tugas
akhir
mahasiswa
3 Sistem Otomasi sistem otomasi pada sistem
Pada Smart Home smart home otomasi
Berbasis Internet Of berbasis internet of pada
Things (Iot) things (Iot) smart
home Iot
berbasis
intermet
of
things
Iot
b. Case Folding
Proses case folding adalah tahapan penyeragaman bentuk huruf dengan
mengubah semua huruf yang ada menjadi huruf kecil. Tabel 4.2 adalah hasil data
yang telah dilakukan proses case folding:
Tabel 4.2 Hasil Case Folding Judul skirpsi
No. Judul Hasil Case Folding Kategori

1 Sistem Informasi Pengolahan sistem informasi pengolahan RPL
Data Simpan Pinjam Koperasi data simpan pinjam koperasi
Pegawai Republik Indonesia pegawai republik indonesia
Karya Dharma Kabupaten karya dharma kabupaten
Majene majene
2 Implementasi Elimination And implementasi elimination and Sistem
Choice Translation Reality choice translation reality Cerdas
(Electre) Untuk Menentukan (electre) untuk menentukan
44
Calon Pembimbing Tugas calon pembimbing tugas akhir

Akhir Mahasiswa mahasiswa
3 Sistem Otomasi Pada Smart sistem otomasi pada smart Iot
Home Berbasis Internet Of home berbasis internet of
Things (Iot) things (Iot)
c. Filtering/Stopword
Tahap ini membuang atau menyaring kata-kata yang dapat
merepresentasikan isi dari suatu dokumen dengan mengacu pada kamus stopword
yang telah ada untuk kata atau term mana yang seharusnya di hilangkan. Seperti
yang telah dijelaskan dibab sebelumnya. Tabel 4.4 adalah hasil data yang telah
dilakukan proses filtering/Stopword
Tabel 4.4 Hasil Filtering/Stopword data judul Skripsi
No. Judul Hasil Tokenisasi Hasil Filtering Kategori

1 Sistem Informasi Sistem sistem
Pengolahan Data Informasi informasi
Simpan Pinjam Pengolahan pengolahan
Koperasi Pegawai Data data
Republik Indonesia Simpan simpan
Karya Dharma Pinjam pinjam
Kabupaten Majene Koperasi koperasi
Pegawai pegawai RPL
Republik republik
indonesia indonesia
Karya karya
Dharma dharma
kabupaten kabupaten
Majene
2 Implementasi implementasi implementasi
Elimination And elimination elimination
Choice Translation And and
Reality (Electre) Choice choice
Untuk Menentukan Reality reality Sistem Cerdas
Calon Pembimbing Electre electre
Tugas Akhir Untuk
Mahasiswa Menentukan menentukan
45
No. Judul Hasil Tokenisasi Hasil Filtering Kategori

Calon calon
pembimbing pembimbing
Tugas tugas
Akhir akhir
Mahasiswa mahasiswa
3 Sistem Otomasi Sistem sistem
Pada Smart Home Otomasi otomasi
Berbasis Internet Of Pada
Things (Iot) Smart smart
Home home Iot
Berbasis berbasis
Intermet intermet
Of of
Things things
Iot Iot
d. Stemming
Stemming merupakan tahapan proses untuk mengambil suatu kata inti atau
kata dasar dari hasil filtering . pada tahap ini akan dilakukan penghilangan kata
imbuhan awalan dan akhiran sehingga menghasilkan kata dasar dari setiap kata
(token). Tabel 4.5 adalah hasil data yang telah dilakukan proses Stemming.
Tabel 4.5 Hasil Stemming data judul Skripsi
No. Judul Hasil Filtering Hasil Stemming Kategori

1 Sistem Informasi Sistem sistem
Pengolahan Data Informasi informasi
Simpan Pinjam Pengolahan olah
Koperasi Pegawai Data data
Republik Simpan Simpan
Indonesia Karya Pinjam Pinjam
Dharma Koperasi Koperasi
Kabupaten RPL
Pegawai Pegawai
Majene
Republik Republik
Indonesia Indonesia
Karya Karya
Dharma Dharma
kabupaten Kabupaten
46
No. Judul Hasil Filtering Hasil Stemming Kategori
2 Implementasi implementasi implementasi

Elimination And elimination elimination
Choice And and
Translation Choice choice
Reality (Electre) Reality reality
Untuk Electre electre Sistem
Menentukan Cerdas
Calon menentukan tentu
Pembimbing Calon calon
Tugas Akhir pembimbing bimbing
Mahasiswa
Tugas tugas
Akhir akhir
mahasiswa
3 Sistem Otomasi Sistem sistem
Pada Smart Home Otomasi otomasi
Berbasis Internet
Of Things (Iot) Smart smart Iot
Home home
Berbasis basis
Intermet intermet
Of of
Things things
Iot
3. Menentukan Atribut Kata
Target kelas klasifikasi yang dipilih adalah RPL, Sistem Cerdas dan Iot.
Selanjutnya dilakukan penentuan atribut kata (Token). Atribut kata ditentukan
berdasrkan hasil hitung frekunsi kata atau kemunculan kata yang benar-benar
merepresentasikan isi dari suatu judul skripsi tersebut. Karena semakin sering kata
tersebut muncul maka dapat dikatakan bahwa kata tersebut mencirikan suatu kelas
tertentu. 10 kata yang paling banyak muncul akan dipilih sebagai atribut kata.
Atribut kata yang dipilih dapat dilihat pada tabel 4.6 berikut.
47
Tabel 4.6 Atribut Kata
RPL SC Iot
Sistem Implementasi Otomatis
Perancangan Algoritma Iot
Informasi Citra Deteksi
Bangun Diagnosa Microcontroller
Web Site Pakar Arduino
Aplikasi Mining Monitoring
Perangkat Metode Smart
Lunak Klasifikasi Alat
Rancang Prediksi Suhu
Web Perbandingan Kontrol
Sumber : Kaprodi Informatika Unsulbar, 2022
4. Tahap Pembobotan (TF-IDF)
Pembobotan adalah proses mengubah kata menjadi bentuk angka. Dan TF
adalah frekuensi dari kemunculan term dalam dokumen yang bersangkutan.
Semakin besar jumlah atau nilai bobot pada kemunculan suatu term dalam
dokumen, maka akan semakin besar bobotnya atau akan memberikan nilai
kesesuaian yang semakin besar. Sedangkan TF-IDF merupakan metode untuk
menghitung nilai TF dan IDF pada setiap token (kata) di setiap dokumen.
Berdasarkan kemunculan masing-masing kata diberikan probabilitas kapasitasnya
untuk menentukan kelas klasifikasinya.

48
1. Langkah pertama yang dilakukan menghitung TF dengan cara menghitung
bobot tiap term dalam teks. Dengan memberikan bobot nilai 1 dan 0.
Tabel 4.7 Pembobotan TF
TF
Kata (Term)
Data 1 Data 2 Data 3
Sistem 1 1 0
Informasi 1 0 0
Olah 1 0 0
Data 1 0 0
Simpan 1 0 0
Pinjam 1 0 0
Koperasi 1 0 0
pegawai 1 0 0
republik 1 0 0
indonesia 1 0 0
karya 1 0 0
dharma 1 0 0
kabupaten 1 0 0
otomasi 0 1 0
smart 0 1 0
home 0 1 0
bas 0 1 0
internet 0 1 0
of 0 1 0
things 0 1 0
implementasi 0 0 1
elimination 0 0 1
and 0 0 1
choice 0 0 1
translation 0 0 1
reality 0 0 1
electre 0 0 1
tentu 0 0 1
calon 0 0 1
bimbing 0 0 1
tugas 0 0 1
akhir 0 0 1
49
2. Langkah kedua menghitung DF dengan cara menjumlahkan bobot nilai term
dalam dokumen.
Tabel 4.8 Hasil Pembobotan DF
TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF
sistem 1 1 0 2
informasi 1 0 0 1
olah 1 0 0 1
data 1 0 0 1
simpan 1 0 0 1
pinjam 1 0 0 1
koperasi 1 0 0 1
pegawai 1 0 0 1
republik 1 0 0 1
indonesia 1 0 0 1
karya 1 0 0 1
dharma 1 0 0 1
kabupaten 1 0 0 1
otomasi 0 1 0 1
smart 0 1 0 1
home 0 1 0 1
bas 0 1 0 1
internet 0 1 0 1
of 0 1 0 1
things 0 1 0 1
implementasi 0 0 1 1
elimination 0 0 1 1
And 0 0 1 1
choice 0 0 1 1
translation 0 0 1 1
reality 0 0 1 1
electre 0 0 1 1
tentu 0 0 1 1
calon 0 0 1 1
bimbing 0 0 1 1
tugas 0 0 1 1
akhir 0 0 1 1
50
3. Langkah ketiga menghitung IDF dengan menggunakan rumus 2.1 pada bab 2
Term (sistem)
IDF = log 3⁄2 = log 1.5 = 0,176
Term (informasi)
IDF= log 3⁄1 = log 3 = 0,477
Term (olah)
IDF = log 3⁄1 = log 3 = 0,477
Term (data)
IDF = log 3⁄1 = log 3 = 0,477, dan seterusnya sampai pada term ke32
Tabel 4.9 Hasil Pembobotan IDF
TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF log 𝐷⁄𝐷𝐹
sistem 1 1 0 2 0,176
informasi 1 0 0 1 0,477
olah 1 0 0 1 0,477
data 1 0 0 1 0,477
simpan 1 0 0 1 0,477
pinjam 1 0 0 1 0,477
koperasi 1 0 0 1 0,477
pegawai 1 0 0 1 0,477
republik 1 0 0 1 0,477
indonesia 1 0 0 1 0,477
karya 1 0 0 1 0,477
dharma 1 0 0 1 0,477
kabupaten 1 0 0 1 0,477
otomasi 0 1 0 1 0,477
smart 0 1 0 1 0,477
home 0 1 0 1 0,477
bas 0 1 0 1 0,477
51
TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF log 𝐷⁄𝐷𝐹
internet 0 1 0 1 0,477
of 0 1 0 1 0,477
things 0 1 0 1 0,477
implementasi 0 0 1 1 0,477
elimination 0 0 1 1 0,477
and 0 0 1 1 0,477
choice 0 0 1 1 0,477
translation 0 0 1 1 0,477
reality 0 0 1 1 0,477
electre 0 0 1 1 0,477
tentu 0 0 1 1 0,477
calon 0 0 1 1 0,477
bimbing 0 0 1 1 0,477
tugas 0 0 1 1 0,477
akhir 0 0 1 1 0,477
4. Langkah keempat menghitung bobot TF-IDF. Pada tabel 4.9 adalah hasil
pembobotan berdasarkan data judul skripsi di tabel sebelumya. Bobot akhir
suata term adalah mengalikan keduanya yaitu TF x IDF
Tabel 4.10 Hasil Pembobotan TF-IDF
TF IDF
Kata (Term) Data Data Data DF log 𝐷⁄𝐷𝐹 Data 1 Data 2 Data 3
1 2 3
sistem 1 1 0 2 0,176 0,176 0,176 0
informasi 1 0 0 1 0,477 0,477 0 0
olah 1 0 0 1 0,477 0,477 0 0
data 1 0 0 1 0,477 0,477 0 0
simpan 1 0 0 1 0,477 0,477 0 0
pinjam 1 0 0 1 0,477 0,477 0 0
koperasi 1 0 0 1 0,477 0,477 0 0
pegawai 1 0 0 1 0,477 0,477 0 0
republik 1 0 0 1 0,477 0,477 0 0
indonesia 1 0 0 1 0,477 0,477 0 0
karya 1 0 0 1 0,477 0,477 0 0
dharma 1 0 0 1 0,477 0,477 0 0
kabupaten 1 0 0 1 0,477 0,477 0 0
otomasi 0 1 0 1 0,477 0 0,477 0
smart 0 1 0 1 0,477 0 0,477 0
52
TF IDF
Kata (Term) Data Data Data DF log 𝐷⁄𝐷𝐹 Data 1 Data 2 Data 3
1 2 3
home 0 1 0 1 0,477 0 0,477 0
bas 0 1 0 1 0,477 0 0,477 0
internet 0 1 0 1 0,477 0 0,477 0
of 0 1 0 1 0,477 0 0,477 0
things 0 1 0 1 0,477 0 0,477 0
implementasi 0 0 1 1 0,477 0 0 0,477
elimination 0 0 1 1 0,477 0 0 0,477
and 0 0 1 1 0,477 0 0 0,477
choice 0 0 1 1 0,477 0 0 0,477
translation 0 0 1 1 0,477 0 0 0,477
reality 0 0 1 1 0,477 0 0 0,477
electre 0 0 1 1 0,477 0 0 0,477
tentu 0 0 1 1 0,477 0 0 0,477
calon 0 0 1 1 0,477 0 0 0,477
bimbing 0 0 1 1 0,477 0 0 0,477
tugas 0 0 1 1 0,477 0 0 0,477
akhir 0 0 1 1 0,477 0 0 0,477
Berdasarkan hasil perhitungan bobot kata yang diperoleh dari proses
perhitungan kemunculan kata dapat diperoleh bahwa nilai bobot kata yang
memiliki nilai bobot tertinggi maka kata tersebut mencerminkan kategori
tersebut.
5. Perhitungan Menggunakan Naïve Bayes Classifier
Proses klasifikasi Naive Bayes ini, seluruh dataset dibagi menjadi
beberapa tahap data latih dan data uji. Berikut adalah penjelasan langkah-
langkahnya beserta contoh perhitungan:
a. Pertama hitung probabilitas setiap kategori (prioritas). pada penelitian ini
yang menjadi kategori ada tiga yaitu kategori RPL, Sistem Cerdas, dan Iot.
Rpl
D( Sc )
Iot
P (Rpl/Sc/Iot) =
|C|
= 1⁄3 = 0,333
d(Rpl)
P(Rpl) =
|C|
53
= 1⁄3 = 0,333
d(Sc)
P(Sc) = |C|
= 1⁄3 = 0,333
d( Iot)
P(Iot) = |C|
Keterangan :
𝑝 (Rpl/Sc/Iot) = Peluang kemunculan dokumen dari kelas rpl, sc, dan Iot
ⅆ(Rpl/Sc/Iot) = Jumlah seluruh dokumen pada setiap kelas
|𝑐| = Jumlah keselurahan data yang dilatih yaitu Rpl, Sc, dan Iot
b. Setelah melakukan perhitungan probabilitas setiap kategori kemudian selanjutnya
menghitung probabilitas setiap term dari semua dokumen. Banyak term
tergantung pada hasil preproses data. Berikut adalah merupakan perhitungan
probabilitas pada setiap term:
( nk|Rpl|Sc|Iot )+1
P(w |Rpl|Sc|Iot ) =
( n,|Rpl|Sc| Iot ) +|Kosakata|
Keterangan :
𝑝 (𝑤𝑘|Rpl|Sc|Iot) = Peluang kemunculan kata pada kategori

𝑤𝑘 = Kata yang muncul pada sebuah kategori.
(𝑛𝑘,rpl|sc|Iot) + 1 = Jumlah frekuensi kemunculan kata pada kategori.
𝑛𝑘 = Kemunculan setiap kata pada kategori.
|𝑘𝑜𝑠𝑎𝑘𝑎𝑡𝑎| = Jumlah semua kata dari semua kategori.
Contoh perhitungan bobot data training untuk kelas RPL:

0,176+1 1,176
P( sistem | Rpl ) = = = 0,0345
2+32 34
0,477+1 1,477
P(informasi| Rpl ) = = = 0,043
2+32 34
0,477 +1 1,477
P(olah| Rpl ) = = = 0,043
2+32 34
0,477+1 1,477
P(data | Rpl ) = = = 0,043
2+32 34
0,477+1 1,477
P(simpan | Rpl ) = = = 0,043
2+32 34
0,477+1 1,477
P(pinjam | Rpl ) = = = 0,043,
2+32 34
54
0,477+1 1,477
P(koperasi | Rpl ) = = = 0,043,
2+32 34
0,477+1 1,477
P(koperasi | Rpl ) = = = 0,043,
2+32 34
0,477+1 1,477
P(pegawai | Rpl ) = = = 0,043,
2+32 34
0,477+1 1,477
P(republik | Rpl ) = = =0,043,
2+32 34
0,477+1 1,477
P(indonesia | Rpl ) = = =0,043,
2+32 34
0,477+1 1,477
P(karya | Rpl ) = = =0,043,
2+32 34
0,477+1 1,477
P(dharma | Rpl ) = = =0,043,
2+32 34
0,477+1 1,477
P(kabupaten | Rpl ) = = =0,043, dan seterusnya sampai pada term
2+32 34
akhir. Sehingga diperoleh model data training naïve bayes berdasarkan
kategori kelasnya sebagai berikut:
Tabel 4.11 Hasil Model Data Training Naïve Bayes
Kelas
P(𝑋𝑘𝑗 | 𝐶𝑖 ) RPL SC Iot
0,3333 0,3333 0,3333
sistem 0,0345 0,0294 0,0345
informasi 0,0434 0,0294 0,0294
olah 0,0434 0,0294 0,0294
data 0,0434 0,0294 0,0294
simpan 0,0434 0,0294 0,0294
pinjam 0,0434 0,0294 0,0294
koperasi 0,0434 0,0294 0,0294
pegawai 0,0434 0,0294 0,0294
republik 0,0434 0,0294 0,0294
indonesia 0,0434 0,0294 0,0294
karya 0,0434 0,0294 0,0294
dharma 0,0434 0,0294 0,0294
kabupaten 0,0434 0,0294 0,0294
otomasi 0,0294 0,0294 0,0434
smart 0,0294 0,0294 0,0434
home 0,0294 0,0294 0,0434
55
Kelas
P(𝑋𝑘𝑗 | 𝐶𝑖 ) RPL SC Iot
0,3333 0,3333 0,3333
bas 0,0294 0,0294 0,0434
internet 0,0294 0,0294 0,0434
of 0,0294 0,0294 0,0434
things 0,0294 0,0294 0,0434
implementasi 0,0294 0,0434 0,0294
elimination 0,0294 0,0434 0,0294
and 0,0294 0,0434 0,0294
choice 0,0294 0,0434 0,0294
translation 0,0294 0,0434 0,0294
reality 0,0294 0,0434 0,0294
electre 0,0294 0,0434 0,0294
tentu 0,0294 0,0434 0,0294
calon 0,0294 0,0434 0,0294
bimbing 0,0294 0,0434 0,0294
tugas 0,0294 0,0434 0,0294
akhir 0,0294 0,0434 0,0294
Tabel 4.12 Contoh Data testing yang akan diuji
Judul Skripsi Kategori Atribut Kata (Term)

Sistem Informasi Data Medis Ibu dan ? Sistem, informasi
Anak Di Puskesmas Banggae
Impementasi Sistem Pakar Dalam ? Implementasi, sistem
Klasifikasi Kepribadian Menggunakan
Forward Chaining
Penerapan Smart Room Berbasis Internet ? Smart, Internet, Of,
Of Things Pada Program Studi Informatika Things
Universitas Sulawesi Barat
Sumber : Data Uji
Berdasarkan data testing yang akan diuji dengan judul skripsi “Sistem
Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae” dengan status kelas
yang belum diketahui. Tahapan selanjutnya, akan melakukan probabilitas
maisng-masing kata didata uji dengan menggunakan hasil probabilitas term yang
didapat pada data latih. Tabel probabilitas yang sudah terbentuk dengan
menggunakan persamaan (2.7)

56
P(Rpl|Judul) = P(Rpl)x P(sistem |Rpl )x P(informasi |Rpl)x P(data |Rpl)
= 0,333 x 0,0345 x 0,0434 x 0,0434

= 2.1762827070286E-5
P(Sc|Judul) = P(Sc)x P(sistem |Sc)x P(informasi |Sc)x P(data |Sc)
= 0,333 x 0,0294 x 0,0294 x 0,0294
= 8.4809010109234E-6
P(Iot |Judul) = P(Iot)x P(sistem |Iot )x P(informasi |Iot )x P(data |Iot )
=0,333 x 0,0345 x 0,0294 x 0,0294
=9.9743135478635E-6
Dilihat dari nilai peluang paling maksimum, maka kategori judul skripsi
“Sistem Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae”
dikategorikan ke dalam kategori kelas RPL dengan nilai maksimum yang
dihasilkan sebesar 2.1762827070286E-5.
B. Implementasi Sistem
Implementasi sistem adalah penerapan model sistem klasifikasi text mining
untuk mengelompokkan data judul skirpsi berdasarkan kategori kelasnya
menggunakan perhitungan algoritma Naïve Bayes Clasifior.
1. Halaman Login
Gambar 4.1 Halaman Login

57
Tampilan halaman login ini merupakan Langkah awal seorang
Admin/pengguna untuk dapat mengakses atau masuk dalam sistem ini. Pengguna
terlebih dahulu harus memasukkan username dan password yang sudah
disediakan dalam sistem ini.
Gambar 4.2 Username dan Password Salah
Gambar 4.2 diatas menunjukkan Ketika admin memasukkan username
dan password yang tidak sesuai kedalam sistem, maka pengguna ataupun Admin
tidak dapat mengakses atau gagal masuk kedalam sistem akan muncul
pemberitahuan bahwa kombinasi user dan password yang anda masukkan salah,
silahkan coba lagi.
2. Halaman Home
Gambar 4.3 Halaman Home/Beranda

58
Gambar 4.3 menunjukkan setelah admin berhasil masuk kedalam sistem
maka tampilan yang pertama kali muncul adalah menu home. Pada menu ini,
sistem akan menampilkan penjelasan mengenai algoritma naïve bayes serta fitur-
fitur menu yang ada pada sistem ini
3. Halaman Menu Master Data
Halaman ini berfungsi untuk menampung data yang terdapat pada
stopword dengan klasifikasi yang digunakan di antaranya adalah RPL, Sistem
cerdas, dan Iot.
Gambar 4.4 Halaman Stopword
Gambar 4.5 Halaman Klasfikasi
4. Halaman Data Training
Halaman data training ini berfungsi untuk menampilkan semua data judul
skripsi yang digunakan sebagai data training. Pada halaman ini memuat semua
dataset yang berada pada database saat ini. Sistem ini dilengkapi fitur bagi admin
59
dalam mengolah sistem ini diantaranya adalah menambahkan, mengedit, dan
menghapus data yang ada pada menu ini.
Gambar 4.6 Halaman Data Training
5. Halaman Preprocessing untuk Data Traiining dan Data Testing
Gambar 4.7 Halaman Preprocessing Training
Gambar 4.8 Halaman Preprocessing Testing

60
Halaman ini berfungsi untuk mengolah data judul skripsi yang telah di
input kedalam data training, sehingga data ini diolah menggunakan proses text
mining yang dikenal sebagai preprocessing. Tahap preprocessing ini memiliki
beberapa tahap yaitu tokenisasi yang berfungsi membagi data menjadi kata
tunggal yang mewakilinya, case folding berfungsi untuk mengubah data menjadi
huruf kecil, tahap stopword berfungsi untuk menyaring atau menghilangkan kata
yang tidak penting dengan menggunakan kamus dari tala yang telah dibahas bab
sebelumnya sedangkan untuk tahap stemming berfungsi untuk menghilangkan
imbuhan yang terdapat pada data tersebut dan menyisahkan kata dasar dari data
tersebut.
6. Halaman Data Testing
Halaman ini berfungsi untuk menampung data yang dijadikan sebagai data
uji, yang nantinya akan diklasifikasikan berdasarkan kategori kelasnya. Sistem ini
juga dilengkapi fitur bagi admin untuk mengolah data ini diantaranya adalah
menambahkan, mengedit dan menghapus data uji tersebut.
Gambar 4.9 Halaman Data Testing
7. Halaman Klasifikasi NBC
Halaman ini berfungsi untuk melihat nilai akurasi dari data yang sudah
diuji berdasarkan dataset atau data training yang telah diproses sehingga dapat
61
diketahui tingkat keberhasilan dari algoritma naïve bayes apakah dapat
mengelompokan atau mengklasifikasian judul skripsi berdasarkan kelas
kategorinya yaitu RPL, Sistem Cerdas dan Iot.
Gambar 4.10 Halaman Klasifikasi NBC
8. Halaman Hasil Klasifikasi
Halaman ini berfungsi untuk menghitung nilai kemunculan term,
pembobotan term dari hasil stemming dan menghitung nilai probabilitas masing-
masing term sehingga menghasilkan klasifikasi judul skripsi berdasarkan kategori
kelasnya.
Gambar 4.11 Halaman Hasil Klasifikasi

62
9. Halaman Hasil
Gambar 4.12 Halaman Hasil
Halaman ini berfungsi untuk melihat hasil klasifikasi berdasarkan nilai
akurasi dan confusion matriks. Sistem ini akan menampilkan akurasi dari hasil
klasifikasi judul skripsi sehingga dapat diketahui keakuratan dari algoritma yang
digunakan.
C. Hasil Pengujian
1. Pengujian Akurasi
Penelitian ini penulis melakukan pengujian menggunakan data judul
skripsi mahasiswa program studi Informatika Unsulbar yang dipilih secara
random/acak dengan keseluruhan data sebanyak 250 data yang terdiri dari 150
data training dan 100 data testing yang akan dilakukan uji coba untuk mengetahui
hasil akurasi terhadap algoritma klasifikasi yaitu naïve bayes. Data tersebut
digunakan untuk mengelompokan sebuah data baru yang belum diketahui kelas
kategorinya apakah data tersebut masuk dalam kelas RPL, Sistem Cerdas, dan
63
Iot. Jumlah keseluruhan data training dan data testing dapat dilihat pada lampiran
Berdasarkan hasil klasifikasi dari data training dan data testing yang telah
dihitung nilai probabiltas sebelumnya yang telah di testing kedalam program,
sistem menampilkan sebanyak 3 data judul skripsi yang tidak sesuai dengan
kategori kelasnya. Hasil akurasi diketahui dari berapa jumlah data testing sesuai
target kelas yang telah ditentukan dibagi dengan jumlah keseluruhan data testing,
untuk menghitung nilai akurasi dapat menggunakan persamaan matematika 2.8.
sehingga hasil akurasi dari uji coba dapat dilihat pada sebagai berikut:
97
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑥 100 % = 97 %
100
2. Pengujian dengan Confusion Matriks
Berdasarkan hasil pengolahan 150 data training dan 100 data testing
menggunakan naïve bayes menunjukkan bahwa tingkat akurasi yang dihasilkan
sebesar 97 %. Untuk mencari nilai akurasi, precision dan recall dapat digunakan
nilai true positif, false negatif, true negatif, dan false positif. Untuk mengetahui
nilai-nilai tersebut dapat diketahui melalui tabel confusion matriks.
Tabel 4. 13 Model Confusion Matriks untukAlgoritma Naïve bayes
Klasifikasi TP FP TN FN Accuracy Precision Recall

RPL 32 1 66 1 0.98 0.97 0.97
SC 31 1 66 2 0.97 0.969 0.939
Iot 34 1 65 0 0.99 0.971 1
Jumlah 0,98 0,97 0,96
Sumber : Hasil Pengujian Akurasi
Berdasarkan tabel confusion matriks menunjukkan bahwa nilai klasifikasi
pada kelas IoT dan bernilai true positif (TP) adalah sebanyak 32 judul, false positif
(FP) sebanyak 1 judul, true negatif (TN) sebanyak 66 judul, dan false negatif
64
(FN) sebanyak 1 judul, berikutnya untuk nilai klasifikasi pada kelas RPL dan
bernilai true positif sebanyak 31 judul, False Positif sebanyak 1, true negatif
sebanyak 66 judul, dan false negatif sebanyak 2 judul, sedangkan untuk nilai
klasifikasi kelas Sistem Cerdas dan bernilai true positif sebanyak 34 judul, false
positif sebanyak 1 judul, true negatif sebanyak 65 dan false negatif sebanyak 0.
Dalam pengujian ini menggunakan 250 data judul skripsi yang dipilih secara
random/acak yang kemudian dibagi kedalam data training dan data testing.
Dimana sebanyak 150 data training dan sebanyak 100 data yang menjadi data
testing. Untuk mendapatkan nilai masing-masing accuracy, precission dan recall
sebagai berikut:
(TP+TN)
Accuracy = (TP+FP+TN+FN)
( 32+66 )
= (32+1+66+1 )
98
= = 0,98
100
(TP)
Precission=
(TP+FP)
( 32 )
= (32+1 )
32
= = 0,97
33
(TP)
Recall =
(TP+FN)
( 32 )
= (32+1 )
32
= 33 = 0,97
Pengujian akurasi klasifikasi judul skripsi berdasarkan kategori untuk
mengetahui tingkat akurasi klasifikasi secara manual dengan klasifikasi yang

65
dilakukan dengan sistem menggunakan algoritma naïve bayes. Pengujian ini
dilakukan dengan menggunakan confusion matrix yaitu dengan sebuah matrik dari
prediksi yang akan dibandingkan dengan atribut asli dari data inputan. Pengujian
ini dilakukan dengan menggunakan 100 data testing, data testing tersebut akan
dibandingkan hasil klasifikasi yang dilakukan oleh sistem. Hasil pengujian akurasi
klasifikasi judul skripsi berdasarkan kategori dapat dilihat pada tabel 4.13
Berikut ini adalah tabel dari confusion matrix:
Tabel 4.14 Confusion Matrix
Predicted Class
Actual
RPL SC Iot
RPL 32 1 0
SC 1 31 1
Iot 0 0 34
Sumber : Pengujian
Setelah sistem melakukan klasifikasi, lalu hitung nilai accuracy dan error
rate dengan rumus untuk menghitung accuracy dan rumus untuk menghitung
error rate.
32+31+34
Accuracy = 32+0+2+1+33+1+0+0+31 x 100%
97
= 100
x 100%=97 %
1+0+0+0+1+1
Error Rate = 32+0+2+1+31+1+0+0+34 x 100%
3
= x 100%=0,03 % atau 3 %
100
3. Pengujian Terhadap Data Testing
K-fold adalah salah satu metode Cross Validation yang populer dengan
melipat data sebanyak k dan mengulangi (iterasi) eksperimennya sebanyak k

66
juga. Pada pengujian ini data yang akan digunakan adalah 100 judul skripsi
termasuk data uji yang nantinya akan dibagi menjadi 10 bagian atau k=10
sehingga data yang diperoleh adalah 100 data dibagi menjadi 10 lipatan dengan
masing-masing isinya adalah 10 data judul. Selain itu akan ditentukan mana yang
termasuk data training dan mana yang termasuk data testing dengan
perbandingan 1-10, sehingga didapatkan 90 data sebagai data training dan 10
sisanya sebagai data training.
Berdasarkan 10 lipatan yang sudah ditentukan maka akan ada 9 lipatan
dikalikan 10 = 90 data training dan sisanya 1 lipatan dikalikan 10 = 10 data
Testing. Pengujian menggunakan data yang sudah dipartisi akan diulang
sebanyak 10 kali (k=10) dengan posisi data tes berbeda disetiap iterasinya.
Misalkan iterasi pertama data tes pada posisi awal, iterasi kedua data tes di posisi
kedua begitu seterusnya. Hingga iterasi kesepuluh Gambaran iterasi k-fold dapat
dilihat pada Gambar 5.
Pengujian hasil terhadap model klasifikasi naive bayes dilakukan dengan
menggunakan K- Fold Cross validation untuk mengetahui tingkat akurasi dari
metode naïve bayes. Skema pengujian dalam penelitian ini dilakukan dengan
membagi data training dengan ukuran yang berbeda-beda, hal ini dilakukan
untuk melihat bagimana hasil pengujian program terhadap nilai-nilai tersebut.
Penelitian ini pengujian dilakukan sebanyak 10 (sepuluh) kali dengan
membagi jumlah fold pada masing-masing data training dan data testing yang
berbeda, agar dapat mengetahui pengaruh data training terhadap hasil klasifikasi.
Pada tabel hasil pengujian terdapat beberapa field antara lain, Data training dan
67
Data testing yang akan diuji kebenaran kelasnya. data failed yang artinya data
yang gagal memprediksi kebenaran kelasanya dan data testing benar artinya data
sesuai dengan kelas yang telah ditentukan. Berikut adalah urutan pengujian yang
telah dilakukan. Untuk pengujian pertama hingga pengujian terakhir data
training yang digunakan berturut-turut sebanyak 1-10, 11-20, 21-30, 31-40, 41-
50, 51-60, 61-70, 71-80, 81-90, 91-100.
a. Pengujian 1
Pengujian pertama dilakukan menggunakan data training sebanyak 10
judul skripsi. Dimana terdapat 3 kelas katgeori yaitu RPL, SC, dan IOT. Untuk
pengujian fold ke-1 jumlah data Testing sebanyak 10 data. Dari hasil pengujian
yang dilakukan semua data berhasil diklasifikasikan sesuai dengan target
kelasnya. Maksudnya dari 10 data judul yang di proses menggunakan model
klasifikasi Naive Bayes berhasil mengidentifikasi data tersebut ke dalam kelas
yang benar, sesuai dengan target kelas yang telah ditentukan. Hasil data testing
pengujian fold 1 dapat dilihat pada tabel 4.14 berikut.
Tabel 4.15 Pengujian K-Fold Crosss Validation 1-10
Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Alat Pendeteksi Suhu Tubuh Berbasis Iot Iot ✔
Mikrokontroler Arduino Uno
2 Perancangan Website Pada Puskesmas RPL RPL ✔
Pambusuang
3 Sistem Informasi Aplikasi Rekam Mudik Pada RPL RPL ✔
Rumah sakit Umum Daerah Kabupaten
Majene
4 Pemetaan Daerah Prioritas Penanganan Sistem Sistem ✔
Stunting Pada Ibu Hamil Menggunakan Cerdas Cerdas
Metode TOPSIS (Studi Kasus:Kabupaten
68
Klasifikasi
Majene)
5 Uji Plagiarism Pada Tugas Mahasiswa Sistem Sistem ✔
Menggunakan Algoritma Winnowing Cerdas Cerdas
6 Implementasi Metode Ahp Dan Topsis Pada Sistem Sistem ✔
Sistem Pendukung Keputusan Calon Penerima Cerdas Cerdas
Bedah Rumah (Studi Kasus : Desa Bonde
Utara)
7 Sistem Informasi Data Medis Ibu dan Anak Di RPL RPL ✔
Puskesmas Banggae
8 Sistem Keamanan Rumah Walet berdasarkan Iot Iot ✔
getaran dan Inframerah berbasis Internet Of
Things (IOT)
9 Rancang Bangun Sistem Informasi Monitoring RPL RPL ✔
Absensi Perkuliahan Mahasiswa Via SMS
Gafe
10 Implementasi data mining persediaan obat Sistem Sistem ✔
pada Puskesmas Banggae II menggunakan Cerdas Cerdas
Algoritma Apriori
Data pengujian Fold 1
Tabel 4.16 Confusion Matrix Fold 1
Predicted Class
Actual
RPL SC Iot
RPL 4 1 0
SC 0 3 1
Iot 1 0 2
Sumber : Pengujian
Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.15 diperoleh
hasil testing diantaranya, terdapat 4 judul sesuai dengan target kelas klasifikasi
RPL, 1 judul RPL dikategorikan ke dalam kelas sistem Cerdas, dan 3 judul SC
sesuai dengan target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 2 judul
Iot sesuai dengan target kelas klasifikasi Iot.

69
b. Pengujian 2 K-Fold Cross Validation 11-20
Tabel 4.17 Pengujian K-Fold Crosss Validation
Klasifikasi
1 Analisis Dan Pengajuan Tranmisi Data Dengan RPL Sistem Failed
Modern GSM 20Menggunakan Axence Nettols Cerdas
2 Prototype Monitoring Penyiraman dan Iot Iot ✔
Pemupukan Otomatis Pada Tanaman Bawang
Mandar Berbasis IoT (Internet Of Things)
3 Aplikasi Perpustakaan Di SDN 1 Saleppa RPL RPL ✔
Berbasis Website
4 Rancang Bangun Tempat Sampah Pintar IOT RPL Failed
Pemilah Sampah Organik Dan Anorganik
Berbasis Mikrocontroller Arduino
5 Sistem Kontrol Ph Air Dan Monitoring Nutrisi Iot Iot ✔
Pada Tanaman Hidroponik Dengan Internet Of
Things
6 Implementasi algortima forecasting Sistem Sistem ✔
menggunakan metode triple exponential Cerdas Cerdas
smooting pada persediaan obat studi kasus
apotek anita farma
7 Rancang Bangun Website Hotel Villa Bogor RPL RPL ✔
Kabupaten Majene
8 Prototype Sistem Monitoring Penggunaan Daya Iot Iot ✔
Listrik Dan Pengontrolan Penggunaan Air
Menggunakan Mikrokontroler
9 Sistem Pendukung Keputusan Kelayakan Sistem Sistem ✔
Pendonor Darah Menggunakan Metode Topsis Cerdas Cerdas
Berbasis Web
10 Sistem Otomasi Pada Smart Home Berbasis Iot Iot ✔
Internet Of Things (Iot)
70
Predicted Class
Actual
RPL SC Iot
RPL 2 1 0
SC 0 2 1
Iot 1 0 4
RPL, 1 judul RPL dikategorikan ke dalam kelas sistem Cerdas, dan 2 judul SC
sesuai dengan target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 4 judul
Iot sesuai dengan target kelas klasifikasi Iot, 1 judul Iot dikategirikan kedalam
kelas RPL.
c. Pengujian 3 K-Fold Cross Validation 21-30
Klasifikasi
1 Prototype Alat Penyortir dan Penghitung Telur Iot Iot ✔
Otomatis Berbasis Internet of Things
2 Prototype Alat Stabilisasi Suhu Kandang Ayam Iot Iot ✔
Berbasis Mikrokontroller
3 Aplikasi Pelayanan Berkas Persyaratan Nikah RPL RPL ✔
Di Kua Kecamatan Banggae Timur
4 Perancangan Alat Internet Of Things (Iot) Iot Iot ✔
Untuk Monitoring Serta Mengendalikan Suhu
Dan Kelembapan Pada Budidaya Jamur
5 Pendeteksi Kesegaran Ikan Menggunakan Iot Iot ✔
Sensor Mq-135
6 Penentuan Dosen Teladan Berdasarkan Penilaian Sistem Sistem ✔
Kinerja Menggunakan Metode Simple Additive Cerdas Cerdas
Weighting (Studi Kasus Dosen Unsulbar)
7 Perancangan Perangkat Lunak Metode Pencairan RPL RPL ✔

Data Pelanggang
8 Sistem pengontrolan ketersediaan lahan parkir Iot Iot ✔
berbasis iot
71
Klasifikasi
9 Perancangan Sistem Informasi Simpan Deposito RPL RPL ✔
Koperasi Citra Sejahtera Kabupaten Majene
10 Sistem Monitoring dan kontrol cairan infus pasien Iot Iot ✔
berbasis Internet Of Things (IoT)
Predicted Class
Actual
RPL SC Iot
RPL 3 0 0
SC 0 1 1
Iot 0 0 6
Sumber : Pengujian
RPL, dan 1 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.
Selanjutnya terdapat 6 judul Iot sesuai dengan target kelas klasifikasi Iot.
d. Pengujian 4 K-Fold Cross Validation 31-40
Klasifikasi
1 Monitoring Suhu Dan Kelembapan Rumah Walet Iot Iot ✔
Berbbasis Lora (Long Range)
2 Perancangan Website Museum Daerah Mandar RPL RPL ✔
Kabupaten Majene
3 Penerapan Algoritma Naive Bayes Dalam Sistem Sistem ✔
Menentukan Kelayakan Nasabah Pada Koperasi Cerdas Cerdas
Simpan Pinjam
4 Penerapan Logika Fuzzy Alat Penyangrai Biji Iot Iot ✔
Kopi Otomatis Menggunakan Arduino Uno
5 Sistem Informasi Pengolahan Data Simpan RPL RPL ✔
Pinjam Koperasi Pegawai Republik Indonesia
Karya Dharma Kabupaten Majene
6 Perancangan sistem Menggunakan Manajemen RPL RPL ✔
72
Klasifikasi
Adminitrasi SDN 008 Camba - Camba Kec.
Limboro
7 Implementasi Elimination And Choice Sistem Sistem ✔
Translation Reality (Electre) Untuk Menentukan Cerdas Cerdas
Calon Pembimbing Tugas Akhir Mahasiswa
8 Implementasi Algoritma Levensthein String Studi Sistem Sistem ✔
Kasus Arsip Data Pasien Rumah Sakit Umum Cerdas Cerdas
Daerah Kabupaten Majene
9 Diagnosis Penyakit Stunting Pada Balita Melalui Sistem Sistem ✔
Penerapan Sistem Pakar Menggunakan Metode Cerdas Cerdas
Certainty Factor
10 Perancangan early warning system pada smart Iot Iot ✔
home berbasis internet of things (IOT
Sumber : Hasil Pengujian
Predicted Class
Actual
RPL SC Iot
RPL 3 1 0
SC 0 4 0
Iot 0 0 3
Sumber : Pengujian
e. Pengujian 5 K-Fold Cross Validation
Klasifikasi
1 Sistem Kontrol Dan Monitoring Pemberi Pakan Ikan Iot Iot ✔
Otomatis Berbasis Iot
2 Prototype Smart Green House Kelompok Tani Di Iot Iot ✔
Mamasa Menggunakan Wemos
73
Klasifikasi
3 Sistem Pakar Identifikasi Hama Tanaman Cabai Sistem Sistem ✔
Menggunakan Metode Iterative Dichotomizer Tree Cerdas Cerdas
(Id3)
4 Sistem Pendukung Keputusan Penentuan Sistem Sistem ✔
Masyarakat Miskin Dengan Metode Weighted Cerdas Cerdas
product di Desa Bukit Samang
5 alat pemantau penggunaan daya listrik pada indekos Iot Iot ✔
berbasis IOT
6 Identifikasi Hama Dan Penyakit Pada Tanaman Sistem Sistem ✔
Kacang Tanah Menggunakan Case Based Cerdas Cerdas
Reasoning Dan Algoritma K-Nearest Neighbor
7 Perancangan Aplikasi Propil layanan Kantor Urusan RPL RPL ✔
Agama Kecamatan Campalagian Dengan
Pemdekatan Prototype
8 System Monitoring Suhu Panas Pada Empang Iot Iot ✔
Menggunakan Mikrokontroler Berbasis Internet Of
Things
9 Perancangan Aplikasi Registrasi Pendaftaran KK RPL RPL ✔
dan Tanda Penduduk Dinas Kependudukan dan
Catatan Sipil Kabupaten Polewali Mandar
10 Prototype Food Feeding System Pada Ayam Broiler Iot Iot ✔
Berbasis Internet Of Things
Predicted Class
Actual
RPL SC Iot
RPL 2 0 0
SC 0 3 0
Iot 0 0 5
Sumber : Pengujian
74
f. Pengujian 6 K-Fold Cross Validation 41-50
Klasifikasi
1 Implementasi Algoritma Genetika untuk Sistem Sistem ✔
Menyelesaikan Course Scheduling Problem Cerdas Cerdas
Menggunakan Random Pair Mutation Gen
2 Aplikasi Penjualan Berbasis Client Server Pada RPL RPL ✔
Toko UD. Setia
3 Sistem Pakar Diagnosa Penyakit pada Tanaman Sistem Sistem ✔
Kakao menggunakan Metode Certainty Factor Studi Cerdas Cerdas
Kasus Kab. Mamuju
4 Penerapan Data Mining Menggunakan Algoritma Sistem Sistem ✔
K-Means Untuk Mendukung Strategi Promosi Cerdas Cerdas
Universitas Sulawesi Barat Berbasis Web
5 Sistem Monitoring Pembayaran dan Remainder Iot Iot ✔
Penyewaan Kamar Indekos Berbasis IoT
6 Sistem Pendukung Keputusan Pemilihan Tempat Sistem Sistem ✔
Kos Mahasiswa Universitas Sulawesi Barat Dengan Cerdas Cerdas
Menggunakan Metode Saw (Simple Additive
Weighting) Dan Metode Fuzzy Multi-Attribute
Decision Making
7 Monitoring Gudang Farmasi Menggunakan Web Iot Iot ✔
Server Streaming Video Dengan Pembacaan Sensor
8 Perancangan Apiikasi Koperasi Simpan Pinjam RPL RPL ✔
Kantor Kementerian Agama Kabupaten Majene
9 Perancangan early warning pada system Iot Iot ✔
kebencanaan berbasis Internet Of Things (IOT)
10 Perancangan Aplikasi Sistem Informasi Adminitrasi RPL RPL ✔
Siswa SMP Neg. 5. Polman
Predicted Class
Actual
RPL SC Iot
RPL 3 0 0
SC 0 4 0
Iot 0 0 3
Sumber : Pengujian
75
g. Pengujian 7 K-Fold Cross Validation 51-60
Klasifikasi
1 Implementasi Algoritma Knn Untuk Memprediksi Sistem Sistem ✔
Kelulusan Mahasiswa Teknik Informatika Cerdas Cerdas
Universitas Sulawesi Barat
2 Implementasi Sistem Pendukung Keputusan (SPK) Sistem Sistem ✔
untuk Pemilihan Konsentrasi Studi Mahasiswa Cerdas Cerdas
menggunakan AHP dan TOPSIS
3 Clustering Wilayah Berdasarkan Data Kesehatan Sistem Sistem ✔
Lingkungan Menggunakan Fuzzy C-Means Cerdas Cerdas
4 Sistem pakar diagnosa penyakit ayam petelur Sistem Sistem ✔
dengan metode Dempster Shafer Cerdas Cerdas
5 Perancangan Sistem Panduan Tempat Wisata RPL RPL ✔
Berbasis Web Di Kabupaten Majene Sulawes Barat
6 aplikasi metode e learning sdn no copala RPL RPL ✔
7 Aplikasi Metode E - Learning Pada SDN No. 16 RPL RPL ✔
Copala
8 Sistem Pakar Mendiagnosis Penyakit Dan Hama Sistem Sistem ✔
Pada Tanaman Padi Cerdas Cerdas
9 Perbandingan Algoritma Naive Bayes Dan C45 Sistem Sistem ✔
Dalam Mengidentifikasi Penyakit Diabetes Di Cerdas Cerdas
Puskesmas Lembang Majene
10 Implementasi algortima forecasting menggunakan RPL RPL ✔
metode triple exponential smooting pada persediaan
obat studi kasus apotek anita farma
Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 6 0
Iot 0 0 0
Sumber : Pengujian
76
h. Pengujian 8 K-Fold Cross Validation
Klasifikasi
1 Perancangan Website Museum Daerah Mandar RPL RPL ✔
Kabupaten Majene
2 Sistem Informasi Perincian Gaji Pegawai Negeri Di RPL RPL ✔
Kantor Kelurahan Baruga Kabupaten Majene
3 Implementasi algoritma Levenshtein distance dalam Sistem Sistem ✔
perbaikan pencarian kata kunci pada koleksi Cerdas Cerdas
Museum Kebudayaan Mandar Majene berbasis
Digital.
4 Sistem Pengolahan Data Surat Masuk Dan Surat RPL RPL ✔
Keluar Di Kantor Notaris Nurhidayah Kab. Majene
5 Rancang Bangun Alat Fermentasi Tempe Iot Iot ✔
Menggunakan Arduino Uno
6 Penentuan Lokasi Strategis Pusat Oleh – Oleh Khas Sistem Sistem ✔
Majene Menggunakan Metode Topsis Cerdas Cerdas
7 Pemberian Pakan Ikan Otomatis Untuk Iot Iot ✔
Pengembangan Fishery Manajemen Sistem
8 Implementasi Sistem Penyiraman Otomatis Berbasis Iot Iot ✔
Mikrontroler Pada Tanaman Bawang Merah
9 Rancang Bangun Sistem Informasi Akademik Di RPL RPL ✔
SDN Inpres No. 26 Pakkola
10 Implementasi Sistem Pendukung Keputusan (SPK) Sistem Sistem ✔
untuk Pemilihan Konsentrasi Studi Mahasiswa Cerdas Cerdas
menggunakan AHP dan TOPSIS
77
Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 3 0
Iot 0 0 3
Sumber : Pengujian
i. Pengujian 9 K-Fold Cross Validation 81-90
Klasifikasi
1 Perancangan Website Pada Puskesmas Pambusuang RPL RPL ✔
2 Perbandingan Metode K-NN dan Naïve Bayes Sistem Sistem ✔
dalam Klasifikasi Penentuan Calon Pendonor Darah Cerdas Cerdas
(Studi Kasus UTD RSUD Majene)
3 Prediksi Produktivitas Kakao Dengan Algoritma K - Sistem Sistem ✔
Nearest Neighbor Untuk Mendukung Kebijakan Cerdas Cerdas
Dinas Pertanian Kabupaten Mamuju
4 Sistem Monitoring Infus Secara Otomatis Iot Iot ✔
Menggunakan Nodemcu
5 Sistem Monitoring Tangki Air Berbasis Internet Of Iot Iot ✔
Things Menggunakan Nodemcu Esp8266 Dan
Sensor Ultrasonik Di Kampus Teknik Parang-
Parang
6 Sistem Monitoring Air Layak Komsumsi Berbasis Iot Iot ✔
Mikrokontroller
7 ancang aplikasi data base terima raskin lurah RPL RPL ✔
baruga dhua
8 Perancangan Aplikasi Data Base Penerima Raskin RPL RPL ✔
Di Kelurahan Baruga Dhua
9 Penerapan Teknologi IoT pada Hidroponik Iot Iot ✔
78
Klasifikasi
menggunakan Arduino
10 Perancangan Sistem Informasi Penerimaan Bansos RPL RPL ✔
Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 3 0
Iot 0 0 4
Sumber : Pengujian
j. Pengujian 10 K-Fold Cross Validation 91-100
Klasifikasi
1 Monitoring Produksi Ayam Petelur Menggunakan Iot Iot ✔
Internet Of Things
2 Penerapan Clustering K-Means Dalam Pemetaan Sistem Sistem ✔
Kunjungan Wisata Di Kabupaten Majene Cerdas Cerdas
3 Smart Aquaponic System Menggunakan Internet Of Iot Iot ✔
Things
4 Sistem Antrian Berbasis Komputer Pada Puskesmas RPL RPL ✔
Tutallu Kecapatan Alu Kebupaten Polewali Mandar
5 Implementasi Metode K-Means Dalam Pemetaan Sistem Sistem ✔
Sebaran Alumni Cerdas Cerdas
6 Pemetaan Pusat Kesehatan Berbasis GIS Sistem Sistem ✔
menggunakan Algoritma Djisktra (Studi Kasus Cerdas Cerdas
Kabupaten Polman)
79
Klasifikasi
7 Membangun Perangkat Lunak Sebagai Alat Bantu RPL Iot Failed
Penagajar Berbasis Multimedia Tentang Benda -
Benda Langit ( Tata Surya )
8 sistem pakar diagnosa penyakit diare pada balita Sistem Sistem ✔
dengan metode forward chaining Cerdas Cerdas
9 Sistem Pakar Diagnosis Kerusakan Komputer Sistem Sistem ✔
Menggunakan Algoritma C4.5 Cerdas Cerdas
10 Rancang Bangun Aplikasi Reservasi Hotel Online RPL RPL ✔
Pada Hotel Pasifik Wonomulyo Berbasis Web
Sumber : Pengujian
Data Pengujian Fold 10
Predicted Class
Actual
RPL SC Iot
RPL 2 0 1
SC 0 5 0
Iot 0 0 2
Sumber : Pengujian
RPL, 1 judul RPL dikategorikan sebagai kelas Iot dan 5 judul SC sesuai dengan
target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 2 judul Iot sesuai
dengan target kelas klasifikasi Iot.
4. Analisis Hasil Pengujian
Hasil akurasi pengujian diketahui dari berapa jumlah data testing yang
sesuai target kelas yang telah ditentukan dibagi dengan jumlah keseluruhan data
testing yang berhasil diklasifikasikan.

80
Penelitian ini penulis melakukan pengujian dengan menggunakan jumlah
data training yang berbeda yaitu membagi jumlah training pada penelitian ini
pengujian dilakukan sebanyak 10 (sepuluh) kali dengan membagi jumlah fold
pada masing-masing data training dan data testing yang berbeda, agar dapat
mengetahui pengaruh data training terhadap hasil klasifikasi. Pada tabel hasil
pengujian terdapat beberapa field antara lain, Data training dan data testing yang
akan diuji kebenaran kelasnya. Hasil akurasi dari keseluruhan pengujian dapat
dilihat pada tabel 4.35 berikut.
Tabel 4.35 Hasil Keseluruhan Pengujian Akurasi
Data Testing
No. Fold Data Testing benar Akurasi
salah
1 1-10 0 10 100%
2 11-20 2 8 80%
3 21-30 0 10 100%
4 31-40 0 10 100%
5 41-50 0 10 100%
6 51-60 0 10 100%
7 61-70 0 10 100%
8 71-80 0 10 100%
9 81-90 0 10 100%
10 91-100 1 9 90%
81
Hasil akurasi dari keseluruhan pengujian dapat digambarkan kedalam
grafik seperti pada gambar 4.10 berikut.
Hasil Akurasi
12
10
8
Akurasi
6
4
2
0
Fold
Fold Fold Fold Fold Fold Fold Fold Fold Fold
91-
1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90
100
Data Salah 0 2 0 0 0 0 0 0 0 1
Data Benar 10 8 10 10 10 10 10 10 10 9
Akurasi 100% 80% 100% 100% 100% 100% 100% 100% 100% 90%
Gambar 4.13 Grafik Hasil Pengujian Akurasi.

BAB V
KESIMPULAN DAN SARAN
A. KESIMPULAN
Berdasarkan penelitian yang dilakukan sebelumnya dapat diambil
kesimpulan bahwa klasifikasi judul skripsi menggunakan algoritma naive bayes
dapat dilakukan dalam mengelompokkan judul skripsi sesuai kelas topiknya. Dari
hasil pengujian akurasi yang dilakukan terhadap 150 data training dan 100 data
testing yang digunakan diperoleh tingkat akurasi sebesar 97 %. Adapun pengujian
presisi didapatkan nilai sebesar 0,97 %, Recall mendapat nilai sebesar 0,96 % dan
nilai laju error sebesar 0,03 %. Berdasarkan hasil pengujian dapat diketahui
bahwa implementasi metode naive bayes dalam melakukan pengklasifikasian
judul skripsi kedalam kategori kelas sudah baik, dapat dilihat dari tingkat akurasi
yang diperoleh terhadap 100 data testing dan 150 data training.
B. SARAN
Penulis menyadari bahwa dalam penelitian ini masih banyak terdapat
kekurangan, sehingga penulis mengusulkan untuk kelanjutan penelitian
kedepannya yaitu dibutuhkan penggunaan algoritma klasifikasi yang lain atau
melakukan kombinasi algoritma yang lain sehingga diperoleh tingkat akurasi yang
lebih baik lagi. Sehingga, dapat dilakukan perbandingan untuk memperoleh
metode yang paling cocok dengan melihat nilai akurasi dari metode yang
digunakan.
82
83
Adapun penelitian kedepannya juga diharapkan dapat meningkatkan
jumlah data training dan data uji yang digunakan untuk meningkatkan keakuratan
klasifikasi judul skripsi kedepannya.

DAFTAR PUSTAKA
Aris J. Ordoñez, R. E. J. P. R. N. N., 2018. SMS Classification Method for

Disaster Response. [Online] Available at:
https://ieeexplore.ieee.org/document/8644872 (Diakses 12 Agustus 2022).
Agusta, L. (2009). Perbandingan algoritma stemming Porter dengan algoritma
Nazief & Adriani untuk stemming dokumen teks bahasa
indonesia. Konferensi Nasional Sistem dan Informatika, 2009, 196-201.
Barnawi. (2015). Teknik Penulisan Karya Ilmiah. Ar-Ruzz Media
Banjarsari, M. A., Budiman, I., & Farmadi, A. (2016). Penerapan K-Optimal Pada
Algoritma Knn Untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program
Studi Ilmu Komputer Fmipa Unlam Berdasarkan Ip Sampai Dengan
Semester 4. Klik-Kumpulan Jurnal Ilmu Komputer, 2(2), 159-173.
Baharuddin, M. M., Azis, H., & Hasanuddin, T. (2019). Analisis Performa
Metode K-Nearest Neighbor Untuk Identifikasi Jenis Kaca. ILKOM Jurnal
Ilmiah, 11(3), 269-274.
Dragut, E., Fang, F., Sistla, P., Yu, C., & Meng, W. (2009). Stop word and related
problems in web interface integration. Proceedings of the VLDB
Endowment, 2(1), 349-360.
Evan, F. H., WP, Y. S. P., & Pranowo, P. (2014). Pembangunan perangkat lunak
peringkas dokumen dari banyak sumber menggunakan sentence scoring
dengan metode TF-IDF. In Seminar Nasional Aplikasi Teknologi Informasi
(SNATI).
Fathan Hidayatullah, A., Rifqi Ma, M., & Program Studi Manajemen Informatika
STMIK Jenderal Achmad Yani Yogyakarta Jl Ringroad Barat, arif. (2016).
Penerapan Text Mining dalam Klasifikasi Judul Skripsi. Seminar Nasional
Aplikasi Teknologi Informasi (SNATi) Agustus, 1907–5022
Gupta, N (2012). Text mining for information retrieval
(Hidayat et al., 2020)Bharata, H. K. (2016). Noptimasi Skripsi Mahasiswa Teknik
Informatika Menggunakan Klasifikasi Algoritma Naive Bayes Dan Support
Vector Machine.
Hidayat, M. S., Puspaningrum, E. Y., Hanindia, M., & Swari, P. (2020).
Penerapan Case Based Reasoning Pada Sistem Rekomendasi Topik Skripsi
Program Studi Infor Matika Upn “ Veteran ” Jawa Timur. 1(2), 272–281.
Kurniawan, Dedik. The Master of 3. Elex Media Komputindo. Jakarta, 2009
Khalida, R., & Bharata, H. K. (2020). Analisa Komparasi Tiga Metode Data
Mining dalam Prediksi Impor Komoditas Tanaman Biofarmaka. Jurnal
Ilmiah KOMPUTASI, 19(2), 145-154
84
80
Mandias, G. F. (2015). Penerapan data mining untuk evaluasi kinerja akademik

mahasiswa di Universitas Klabat dengan metode klasifikasi. Proceedings
Konferensi Nasional Sistem dan Informatika (KNS&I).
Marlinda, L., & Rianto, H. (2013). Pembelajaran Bahasa Indonesia Berbasis Web
Menggunakan Metode Maximum Marginal Relevance. SESINDO 2013.
Machmud, “Tuntunan Penulisan Tugas Akhir Berdasarkan Prinsip Dasar.
Penelitian Ilmiah”, Cet. 1 (Malang: Penerbit Selaras, 2016)
Muttaqin, M. R., & Defriani, M. (2020). Algoritma K-Means untuk
Pengelompokan Topik Skripsi Mahasiswa. ILKOM Jurnal Ilmiah, 12(2),
121–129. https://doi.org/10.33096/ilkom.v12i2.542.121-129
Peraturan Menteri Riset, Teknologi, dan Pendidikan Tinggi Nomor 44 Tahun
2015 tentang Standar Nasional Pendidikan Tinggi (Lembaran Negara
Republik Indonesia Tahun 2015 Nomor 1952)
Pradikdo, A. C., & Ristyawan, A. (2018). Model Klasifikasi Abstrak Skripsi
Menggunakan Text Mining Untuk Pengkategorian Skripsi Sesuai Bidang
Kajian. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 9(2),
1091–1098. https://doi.org/10.24176/simet.v9i2.2513
Pandie, Emerensye S. Y. 2012. Implementasi Algoritma Data mining K-Nearest
Neighbour (KNN) Dalam Pengambilan Keputusan Pengajuan Kredit.
Jurusan Ilmu Komputer, Fakultas Sains dan Teknik, Universitas Nusa
Cendana : Kupang
Pujianto, U., Widiyaningtyas, T., Prasetya, D. D., & Romadhon, B. (2019).
Penerapan algoritma naïve bayes classifier untuk klasifikasi judul skripsi
dan tugas akhir berdasarkan Kelompok Bidang Keahlian. Tekno, 27(1), 79.
https://doi.org/10.17977/um034v27i1p79-92
Putro, M. F., Prayitno, E., Siregar, J., & Muharrom, M. (2021). Penerapan Data Mining
Dengan Naïve Bayes Untuk Klasifikasi Siswa Sekolah Menengah Atas Dalam
Penentuan Perguruan Tinggi. Jurnal AKRAB JUARA, 6(2), 306–312. Rif qo, M.
H., & Wijaya, A. (2017). Implementasi Algoritma Naive Bayes Dalam Penentuan
Pemberian Kredit. Pseudocode, 4(2), 120–128.
https://doi.org/10.33369/pseudocode.4.2.120-128
Rachman, D. A. C., Goejantoro, R., & Amijaya, F. D. T. (2021). Implementasi
text mining pengelompokkan dokumen skripsi menggunakan metode k-
means clustering. EKSPONENSIAL, 11(2), 167-174.
Rasjid, N., Arifin, N., & Cahya, N. (2021). KLASIFIKASI NASABAH BANK LAYAK
KREDIT MENGGUNAKAN METODE NAIVE BAYES: CLASSIFICATION
OF CUSTOMERS OF CREDIT-WORTH BANKS USING NAIVE BAYES
METHOD. Jurnal ilmiah Sistem Informasi dan Ilmu Komputer, 1(1), 01-10.
Suyanto, 2018. Machine Learning Tingkat Dasar dan Lanjut. Bandung:
Informatika Bandung.
81
Solichin, A. (2016). Pemrograman web dengan PHP dan MySQL. Penerbit Budi
Luhur.
Sani, R. R., Zeniarza, J., & Luthfiarta, A. (2016). Pengembangan Aplikasi
Penentuan Tema Tugas Akhir Berdasarkan Data Abstrak Menggunakan
Algoritma K-nearest Neighbor. Unisbank Semarang, 207, 103–111.
Sanjaya, S., & Absar, E. A. (2015). Pengelompokan Dokumen Menggunakan
Winnowing Fingerprint dengan Metode K-Nearest Neighbour. Jurnal
CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi
Informasi, 1(2), 50-56.
Syahdrajat, T. (2015). Panduan menulis tugas akhir kedokteran & kesehatan.
Kencana.
Sukamto, R. A., & Shalahuddin, M. (2013). Rekayasa Perangkat Lunak Terstruktur dan
Berorientasi Objek. Bandung: Informatika.
Riyanto, Slamet. 2014. Adobe Photoshop to CSS3. Jakarta:PT Elex Media
Komputindo
Raschka, S. 2015.Naive Bayes and Text Classification I Introduction And Theory.
New York: Cornell University Library, (Online),
(https://arxiv.org/pdf/1410.5329v3.pdf), diakses pada 15 November 2022)
Soyomukti, N. 2015. Teori-Teori Pendidikan: Dari Tradisional, (Neo) Liberal,
Marxis-Sosialis, Hingga Postmodern. Yogyakarta: Ar-Ruzz Media.
Somantri, O., Wiyono, S., & Dairoh, D. (2016). Metode K-Means untuk Optimasi
Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector
Machine (SVM). Scientific Journal of Informatics, 3(1), 34–45.
https://doi.org/10.15294/sji.v3i1.5845
Wurdianarto, S. R., Novianti, S., dan Rosyidah, U. (2014). “Perbandingan
Euclidean Distane Dengan Canberra Distance”. Face Recognition
TECHNO.COM, 13 (1), 31-37
Yusra, Olivita, D., & Vitriani, Y. (2016). Perbandingan Klasifikasi Tugas Akhir
Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes
Classifier dan K-Nearest Neighbor. Jurnal Sains, Teknologi Dan Industri,
14(1), 79–85.
82
LAMPIRAN
83
LAMPIRAN DATA TRAINING

No Data Asli Label
1 Sistem Informasi Pengolahan Data Simpan Pinjam Koperasi Pegawai Republik RPL
Indonesia Karya Dharma Kabupaten Majene
2 Perancangan Sistem Informasi Penerimaan Bansos RPL
3 Perancangan Website Museum Daerah Mandar Kabupaten Majene RPL
4 Rancang Bangun Sistem Informasi Akademik Di SDN Inpres No. 26 Pakkola RPL
5 Sistem Informasi Gaji Pegawai Negeri Sipil Di Kantor Kelurahan Baruga RPL
6 Perancangan sistem Informasi Penjualan RPL
7 Sistem Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae RPL
8 Perancangan Website Pada Puskesmas Pambusuang RPL
9 Sistem Informasi Akademik Universitas Sulawesi Barat Prodi Teknik Informatika RPL
10 Perancangan Website Pada Puskesmas Pambusuang RPL
11 Perancangan Aplikasi Rental Mobil Pada Usaha Rental Amanah RPL
12 Perancangan Aplikasi Pemimjaman Dan Pengembalian Buku Pada Kantor RPL

Perpustakaan Arsip Dan Dokumentasi Daerah Kabupaten Majene
13 Aplikasi Metode E - Learning Pada SDN No. 16 Copala RPL
14 Aplikasi Penjualan Berbasis Client Server Pada Toko UD. Setia RPL
15 Perancangan Apiikasi Koperasi Simpan Pinjam Kantor Kementerian Agama RPL

Kabupaten Majene
16 Perancangan Aplikasi Data Base Penduduk Kantor Desa Pesuloang RPL
17 Perancangan Aplikasi Data Base Penerima Raskin Di Kelurahan Baruga Dhua RPL
18 Analisis Dan Pengajuan Tranmisi Data Dengan Modern GSM 20Menggunakan RPL
Axence Nettols
19 Membangun Perangkat Lunak Sebagai Alat Bantu Penagajar Berbasis Multimedia RPL
Tentang Benda - Benda Langit ( Tata Surya )
20 Perancangan Aplikasi Katalog Buku Berbasis Client Sever Pada Kantor Perpustakaan RPL
Umum Kab. Majene
21 Perancangan Sistem Pengelolaan Adminitrasi Uang Makan dan Uang Lembur Pada RPL
Bagian Keuangan Kantor Kab. Majene
84
No Data Asli Label
22 Pengendalian Perangkat Listrik Melalui Fasilitas SMS Gateway RPL
23 Aplikasi Perpustakaan Di SDN 1 Saleppa Berbasis Website RPL
24 Aplikasi Pelayanan Berkas Persyaratan Nikah Di Kua Kecamatan Banggae Timur RPL
25 Perancangan Aplikasi Sistem Informasi Pengelolaan Surat Masuk dan Surat Keluar RPL
Pada SMK Neg. 2 Majene
26 Sistem Informasi Pengelolaan Surat Masuk Dan Surat Keluar Pada Dinas Satuan RPL
Polisi Pamong Praja Dan Perlindungan Masyarakat
27 Rancang Bangun Web Server Menggunakan Debian Linux RPL
28 Rancang Bangun E - Learning SMP Neg. 2 Majene RPL
29 Rancang Bangun Sistem Informasi Monitoring Absensi Perkuliahan Mahasiswa Via RPL
SMS Gafe
30 Perancangan Sistem Pengolahan Data Inventaris Oba t Pada Apotik Citra Farmasiando RPL
Majene
31 Sistem Pengolahan Data Surat Masuk Dan Surat Keluar Di Kantor Notaris RPL
Nurhidayah Kab. Majene
32 Rancang Bangun Aplikasi Reservasi Hotel Online Pada Hotel Pasifik Wonomulyo RPL
Berbasis Web
33 Perancangan Aplikasi Registrasi Pendaftaran KK dan Tanda Penduduk Dinas RPL

Kependudukan dan Catatan Sipil Kabupaten Polewali Mandar
34 Perancangan Aplikasi Profil Siswa dan Calon Siswa Baru Di SMP Neg. 1 RPL
Campalagian
35 Rancang Bangun Website Hotel Villa Bogor Kabupaten Majene RPL
36 Perancangan Kamus istilah Komputer Android RPL
37 Sistem Antrian Berbasis Komputer Pada Puskesmas Tutallu Kecapatan Alu RPL
Kebupaten Polewali Mandar
38 Perancangan sistem Menggunakan Manajemen Adminitrasi SDN 008 Camba - RPL

Camba Kec. Limboro
39 Perancangan Aplikasi Data Pegawai Kantor Badan Lingkungan Hidup Dan Pertanian RPL
Kabupaten Majene
40 Sistem Informasi Aplikasi Rekam Mudik Pada Rumah sakit Umum Daerah RPL
Kabupaten Majene
85
No Data Asli Label
41 Perancangan Sistem Pengolahan Data Pernikahan Pada Kantor Urusan Agama ( KUA RPL
) Kecamatan Tammerodo Sendana
42 Sistem Informasi Perincian Gaji Pegawai Negeri Di Kantor Kelurahan Baruga RPL
Kabupaten Majene
43 Perancangan Game Sandeq Race Berbasis Android RPL
44 Apliksi SistemData Base Perkiraan Cuaca BMKG Majene RPL
45 Perancangan Sistem Panduan Tempat Wisata Berbasis Web Di Kabupaten Majene RPL
Sulawes Barat
46 Perancangan Perangkat Lunak Metode Pencairan Data Pelanggang RPL
47 Perancangan Aplikasi Sistem Informasi Adminitrasi Siswa SMP Neg. 5. Polman RPL
48 Perancangan Aplikasi Propil layanan Kantor Urusan Agama Kecamatan Campalagian RPL
Dengan Pemdekatan Prototype
49 Perancangan Sistem Informasi Simpan Deposito Koperasi Citra Sejahtera Kabupaten RPL
Majene
50 SISTEM PAKAR IDENTIFIKASI HAMA TANAMAN CABAI MENGGUNAKAN Sistem

METODE ITERATIVE DICHOTOMIZER TREE (ID3) Cerdas
51 Clustering Wilayah Berdasarkan Data Kesehatan Lingkungan Menggunakan Fuzzy Sistem

C-Means Cerdas
52 Pemetaan Daerah Prioritas Penanganan Stunting Pada Ibu Hamil Menggunakan Sistem
Metode TOPSIS (Studi Kasus:Kabupaten Majene) Cerdas
53 IMPLEMENTASI Elimination and Choice Translation Reality (ELECTRE) UNTUK Sistem

MENENTUKAN CALON PEMBIMBING TUGAS AKHIR MAHASISWA Cerdas
54 Perbandingan Algoritma AHP dan SAW Untuk Sistem Penunjang Keputusan Sistem
Pemilihan Bibit Jagung Cerdas
55 Implementasi Sistem Pendukung Keputusan (SPK) untuk Pemilihan Konsentrasi Sistem

Studi Mahasiswa menggunakan AHP dan TOPSIS Cerdas
56 IMPLEMENTASI PENJADWALAN MATA PELAJARAN MENGGUNAKAN Sistem

METODE ALGORITMA GENETIKA (STUDI KASUS DI MTs DDI MAJENE) Cerdas
57 SISTEM PENDUKUNG KEPUTUSAN PEMBERIAN BEASISWA Sistem

MENGGUNAKAN METODE FUZZY MULTIPLE ATRIBUTE DECISION Cerdas
MAKING (FMADM) DAN ALGORITMA WEIGHTED PRODUCT (WP)
58 IMPLEMENTASI METODE AHP DAN TOPSIS PADA SISTEM PENDUKUNG Sistem

KEPUTUSAN CALON PENERIMA BEDAH RUMAH (STUDI KASUS : DESA Cerdas
86
No Data Asli Label
BONDE UTARA)
59 SISTEM PEMILIHAN JURUSAN DI PERGURUAN TINGGI BAGI SISWA SMA Sistem

MENGGUNAKAN LOGIKA FUZZY DAN SIMPLE ADDITIVE WEIGHTING Cerdas
(SAW)
60 Sistem Pendukung Keputusan Penentuan Masyarakat Miskin Dengan Metode Sistem

Weighted product di Desa Bukit Samang Cerdas
61 Implementasi Algoritma Analytical Hierarchy Process (AHP) Dalam Sistem Sistem

Pengambilan Keputusan Sebagai Rekomendasi Pembimbing Tugas Akhir Cerdas
62 Kombinasi Algoritma Certainty factor dan Forward Chaining Untuk Mengidentifikasi Sistem
Penyakit Ayam Petelur Cerdas
63 Implementasi algoritma Naive bayes dalam menentukan Penerima PKH Sistem

Cerdas
64 PREDIKSI PRODUKTIVITAS KAKAO DENGAN ALGORITMA K-NEAREST Sistem

NEIGHBOR UNTUK MENDUKUNG KEBIJAKAN DINAS PERTANIAN Cerdas
KABUPATEN MAMUJU
65 PENERAPAN CLUSTERING K-MEANS DALAM PEMETAAN KUNJUNGAN Sistem

WISATA DI KABUPATEN MAJENE Cerdas
66 IMPELEMENTASI METODE FUZZY MULTIPLE DECISION MAKING Sistem

(FMADM) dan SIMPLE ADDITIVE WEIGHTING (SAW) PADA SISTEM Cerdas
PENDUKUNG KEPUTUSAN PENERIMAAN BEASISWA BANK INDONESIA
(Studi Kasus : Uiversitas Sulawesi Barat)
67 IMPLEMENTASI ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI Sistem

PENYAKIT DEMAM BERDARAH (DBD) (STUDI KASUS RUMAH SAKIT Cerdas
MAJENE)
68 Analisis Pengguna Algoritma Apriori Untuk Rekomendasi Penempatan B uku Sistem

Berdasarkan Data Peminjaman Pada Dinas Perpustakaan Dan Kearsipan Kabupaten Cerdas
Majene
69 SISTEM PAKAR MENDIAGNOSIS PENYAKIT DAN HAMA PADA TANAMAN Sistem

PADI Cerdas
70 PENENTUAN LOKASI STRATEGIS PUSAT OLEH – OLEH KHAS MAJENE Sistem

MENGGUNAKAN METODE TOPSIS Cerdas
71 IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI Sistem

UNTUK MENENTUKAN POLA PEMBELIAN OBAT DI RUMAH SAKIT Cerdas
72 Perbandingan Metode K-NN dan Naïve Bayes dalam Klasifikasi Penentuan Calon Sistem
Pendonor Darah (Studi Kasus UTD RSUD Majene) Cerdas
73 PENERAPAN ALGORITMA NAIVE BAYES DALAM MENENTUKAN Sistem

87
No Data Asli Label
KELAYAKAN NASABAH PADA KOPERASI SIMPAN PINJAM Cerdas
74 PENENTUAN DOSEN TELADAN BERDASARKAN PENILAIAN KINERJA Sistem

MENGGUNAKAN METODE SIMPLE ADDITIVE WEIGHTING (STUDI KASUS Cerdas
DOSEN UNSULBAR)
75 IMPLEMENTASI METODE K-MEANS DALAM PEMETAAN SEBARAN Sistem

ALUMNI Cerdas
76 Implementasi data mining persediaan obat pada Puskesmas Banggae II menggunakan Sistem
Algoritma Apriori Cerdas
77 PERBANDINGAN ALGORITMA NAIVE BAYES DAN C45 DALAM Sistem

MENGIDENTIFIKASI PENYAKIT DIABETES DI PUSKESMAS LEMBANG Cerdas
MAJENE
78 Diagnosis Penyakit Stunting Pada Balita Melalui Penerapan Sistem Pakar Sistem
Menggunakan Metode Certainty Factor Cerdas
79 IMPLEMENTASI ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI Sistem

PENYAKIT TUBERCOLOSIS (TBC) Cerdas
80 MODEL PENENTUAN RUTE TERPENDEK PENJEMPUTAN SAMPAH Sistem

MENGGUNAKAN TRAVELING SALESMAN PROBLEM DAN ALGORITMA Cerdas
GENETIKA
81 SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN TEMPAT KOS Sistem

MAHASISWA UNIVERSITAS SULAWESI BARAT DENGAN Cerdas
MENGGUNAKAN METODE SAW (SIMPLE ADDITIVE WEIGHTING) DAN
METODE FUZZY MULTI-ATTRIBUTE DECISION MAKING
82 UJI PLAGIARISM PADA TUGAS MAHASISWA MENGGUNAKAN Sistem

ALGORITMA WINNOWING Cerdas
83 Sistem Pendeteksi Ikan Tidak Segar Menggunakan pengolahan Citra Berbasis Sistem
Android Dengan Metode K-NEAREST NEIGHBOR Cerdas
84 SISTEM PENDUKUNG KEPUTUSAN KELAYAKAN PENDONOR DARAH Sistem

MENGGUNAKAN METODE TOPSIS BERBASIS WEB Cerdas
85 Implementasi Algoritma Genetika untuk Menyelesaikan Course Scheduling Problem Sistem

Menggunakan Random Pair Mutation Gen Cerdas
86 Pemetaan Pusat Kesehatan Berbasis GIS menggunakan Algoritma Djisktra (Studi Sistem
Kasus Kabupaten Polman) Cerdas
87 Implementasi algortima forecasting menggunakan metode triple exponential smooting Sistem

pada persediaan obat studi kasus apotek anita farma Cerdas
88 PENERAPAN METODE SAW DALAM SISTEM PENENTUAN KELULUSAN Sistem

CALON MAHASISWA BARU JALUR MANDIRI Cerdas
88
No Data Asli Label
89 IMPLEMENTASI ALGORITMA KNN UNTUK MEMPREDIKSI KELULUSAN Sistem

MAHASISWA TEKNIK INFORMATIKA UNIVERSITAS SULAWESI BARAT Cerdas
90 Penerapan Algoritma FSA (Finite State Automaton) pada aplikasi penerjemah bahasa Sistem
indonesia -mandar Cerdas
91 Sistem pakar diagnosa penyakit ayam petelur dengan metode Dempster Shafer Sistem
Cerdas
92 sistem pakar diagnosa penyakit diare pada balita dengan metode forward chaining Sistem
Cerdas
93 SISTEM PAKAR DIAGNOSIS KERUSAKAN KOMPUTER MENGGUNAKAN Sistem

ALGORITMA C4.5 Cerdas
94 IMPLEMENTASI ALGORITMA LEVENSTHEIN STRING STUDI KASUS ARSIP Sistem

DATA PASIEN RUMAH SAKIT UMUM DAERAH KABUPATEN MAJENE Cerdas
95 Implementasi algoritma Levenshtein distance dalam perbaikan pencarian kata kunci Sistem
pada koleksi Museum Kebudayaan Mandar Majene berbasis Digital. Cerdas
96 IDENTIFIKASI HAMA DAN PENYAKIT PADA TANAMAN KACANG TANAH Sistem

MENGGUNAKAN CASE BASED REASONING DAN ALGORITMA K- Cerdas
NEAREST NEIGHBOR
97 PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS Sistem

UNTUK MENDUKUNG STRATEGI PROMOSI UNIVERSITAS SULAWESI Cerdas
BARAT BERBASIS WEB
98 Sistem Pakar Diagnosa Penyakit pada Tanaman Kakao menggunakan Metode Sistem
Certainty Factor Studi Kasus Kab. Mamuju Cerdas
99 Sistem pendukung keputusan pemilihan skincare sesuai dengan kebutuhan kulit Sistem
wajah menggunakan metode SMARTER Cerdas
100 Rancang Bangun Sistem Pendeteksi Gempa Bumi Berbasis Internet Of Things IOT
101 SISTEM OTOMASI PADA SMART HOME BERBASIS INTERNET OF THINGS IOT
(IoT)
102 IMPLEMENTASI SISTEM PENYIRAMAN OTOMATIS BERBASIS IOT

MIKRONTROLER PADA TANAMAN BAWANG MERAH
103 Perancangan prototype pulse sensor monitoring Berbasis IoT (Internet of Things) IOT
104 ALAT PENDETEKSI SUHU TUBUH BERBASIS MIKROKONTROLER IOT

ARDUINO UNO
105 PENGEMBANGAN FISH FEEDING SYSTEM BERBASIS IoT IOT

89
No Data Asli Label
106 Sistem Monitoring Tangki Air Berbasis Internet Of Things Menggunakan Nodemcu IOT
Esp8266 Dan Sensor Ultrasonik Di Kampus Teknik Parang-Parang
107 Sistem pengontrolan ketersediaan lahan parkir berbasis iot IOT
108 SISTEM MONITORING INFUS SECARA OTOMATIS MENGGUNAKAN IOT

NODEMCU
109 Prototype Alat Stabilisasi Suhu Kandang Ayam Berbasis Mikrokontroller IOT
110 PENERAPAN LOGIKA FUZZY ALAT PENYANGRAI BIJI KOPI OTOMATIS IOT
MENGGUNAKAN ARDUINO UNO
111 FISH FARM MONITORING BERBASIS INTERNET OF THINGS IOT
112 Smart Aquaponic System Menggunakan Internet Of Things IOT
113 Prototype Monitoring Penyiraman dan Pemupukan Otomatis Pada Tanaman Bawang IOT
Mandar Berbasis IoT (Internet Of Things)
114 Implementasi Modul RFID Internet of Things untuk Smart Door IOT
115 RANCANG BANGUN TEMPAT SAMPAH PINTAR PEMILAH SAMPAH IOT

ORGANIK DAN ANORGANIK BERBASIS MIKROCONTROLLER ARDUINO
116 RANCANG BANGUN ALAT FERMENTASI TEMPE MENGGUNAKAN IOT

ARDUINO UNO
117 SISTEM MONITORING AIR LAYAK KOMSUMSI BERBASIS IOT

MIKROKONTROLLER
118 PROTOTYPE SISTEM PENGERINGAN IKAN ASIN MENGGUNAKAN IOT

MIKROKONTROLER ARDUINO
119 System Monitoring Suhu Panas Pada Empang Menggunakan Mikrokontroler Berbasis IOT
Internet Of Things
120 SISTEM KONTROL PH AIR DAN MONITORING NUTRISI PADA TANAMAN IOT
HIDROPONIK DENGAN INTERNET OF THINGS
121 KONTROL NUTRISI AIR PADA TANAMAN HIDROPONIK BERBASIS IOT

MICROCONTROLLER
122 Prototype food feeding system pada ayam broiler berbasis internet of things IOT
123 SMART FEEDING BERBASIS IOT MENGGUNAKAN ARDUINO NODEMCU IOT

ANDROID MQTT
124 PROTOTYPE SISTEM MONITORING PENGGUNAAN DAYA LISTRIK DAN IOT

PENGONTROLAN PENGGUNAAN AIR MENGGUNAKAN
90
No Data Asli Label
MIKROKONTROLER
125 PERANCANGAN ALAT INTERNET OF THINGS (IOT) UNTUK MONITORING IOT

SERTA MENGENDALIKAN SUHU DAN KELEMBAPAN PADA BUDIDAYA
JAMUR
126 alat pemantau penggunaan daya listrik pada indekos berbasis IOT IOT
127 Pengembangan Sistem Monitoring Kumbung Jamur Menggunakan Mikrokontroller IOT
128 Perancangan early warning system pada smart home berbasis internet of things (IOT IOT
129 Perancangan early warning pada system kebencanaan berbasis Internet Of Things IOT
(IOT)
130 Perancangan early warning pada system kebencanaan berbasis Internet Of Things IOT
(IOT)
131 Real time notification pada sistem deteksi kebakaran berbasis Internet of Things (IoT) IOT
132 Sistem Keamanan Rumah Walet berdasarkan getaran dan Inframerah berbasis IOT
Internet Of Things (IOT)
133 Monitoring Produksi Ayam Petelur Menggunakan Internet Of Things IOT
134 Sistem monitoring pembudidayaan pada tanaman cabai berbasis iot(internet of things) IOT
135 Pemberian Pakan Ikan Otomatis Untuk Pengembangan Fishery Manajemen Sistem IOT
136 SISTEM PEMANTAUAN KUALITAS AIR PADA PEMBUDIDAYAAN IKAN IOT

AIR TAWAR BERBASIS MICROCONTROLLER
137 Prototype Alat Penyortir dan Penghitung Telur Otomatis Berbasis Internet of Things IOT
138 PROTOTYPE SMART GREEN HOUSE KELOMPOK TANI DI MAMASA IOT

MENGGUNAKAN WeMos
139 MONITORING GUDANG FARMASI MENGGUNAKAN WEB SERVER IOT

STREAMING VIDEO DENGAN PEMBACAAN SENSOR
140 SISTEM KONTROL DAN MONITORING PEMBERI PAKAN IKAN OTOMATIS IOT
BERBASIS IOT
141 PENDETEKSI KESEGARAN IKAN MENGGUNAKAN SENSOR MQ-135 IOT
142 Penerapan Teknologi IoT pada Hidroponik menggunakan Arduino IOT
143 Sistem Monitoring dan kontrol cairan infus pasien berbasis Internet Of Things (IoT) IOT
144 Prototipe Sistem Monitoring Ketinggian Air Pada Bendungan Berbasis Internet Of IOT
91
No Data Asli Label
Things
145 MONITORING SUHU DAN KELEMBAPAN RUMAH WALET BERBBASIS IOT

LORA (LONG RANGE)
146 Sistem Monitoring Pembayaran dan Remainder Penyewaan Kamar Indekos Berbasis IOT
IoT
147 Sistem Pengukur Tekanan Darah dan Denyut Nadi Berbasis Internet Of Things IOT
148 RANCANG BANGUN SISTEM PENGAMAN PINTU BERBASIS IoT IOT
149 PROTOPTYPE PENGAIRAN SAWAH DAN MONITORING KUALITAS PH IOT

TANAH BERBASIS IOT
150 Perancangan Aplikasi Penggajian Pegawai Pada Dinas Pendidikan Pemuda Dan RPL
Olahraga Kab. Majene
LAMPIRAN DATA TESTING

No Data Asli
1 Perancangan Sistem Informasi Berbasis web SMP negeri 2 Campalagian Menggunakan Metode
WISDM
2 Sistem Infromasi Pengarsipan Surat Masuk Dan Surat Keluar Berbasis web Pada Kantor Camat
Banggae Timur Kab. Majene Prototype
3 Sistem Informasi Persuratan Masuk dan Keluar di Instansi Dinas Pendidikan Kab. Majene
4 Rancang Bangun Website Stikmar Majene Berdasarkan Metode WSDM
5 Sistem Informasi Singkronisasi Data Musrembang Pada Kantor Camat Matakali
6 Sistem Informasi Pengelolaan Data Penjual Laptop dan Aksesoris Komputer Pada Komputer
Berbasis Web
7 Perencanaan Sistem Informasi Pariwisata Daerah Polewali Mandar Dengan Menggunakan Metode
BUMN
8 Perancangan Sistem Informasi Pengelolaan Industri Tradisional Sarung Sutra Dengan Pemodelan
BDMN Studi Kasus KSU Mitra Mandiri Sejahtera Desa Renggean
9 Perancangan Model Proses Bisnis Pengelolaan Pengarsipan Dokemen Di Dinas Keuangan Kab.
Majene Berdasarkan Bussines Process Modelling Notation ( BPMN )
10 Pembuatan Wajan Bolic Sebagai Antena Sektoral Di Desa Lemba Sumara Kecamatan Soyojaya
Provinsi Sulawesi Tengah
92
No Data Asli
11 Sistem Informasi Data Penduduk Pada Kantor Desa Laliko Kecamatan Campalagian Kabupaten
Polewali Mandar
12 Perancangan Sistem Informasi Monitorin Aktivitas Desa Berbasis Web Dengan Metode BPMM
13 Perancangan Sistem Informasi Pengelolaan Persalinan Di Puskesmas Wonomulyo Kabupaten

Polewali Mandar Berdasarkan Business Process Modeling Notation (BPMN)
14 Sistem Pengarsipan Pembayaran SPP/UKT Universitas Sulawesi Barat Berbasis Web
15 Sistem Informasi Data Rekapitulasi Absensi Pegawai Pada Instansi Dinas Pekerjaan Umum
Kabupaten Majene
16 Rancangan Aplikasi Pengarsipan Buku Tanah Pada Kantor Badan Pertanahan Nasional (BPN)
Kabupaten Polewali Mandar Berdasarkan Metode Prototype
17 Aplikasi Jadwal Penggunaan Laboratorium Teknologi Informasi Universitas Sulawesi Barat
18 Rancang Bangun Penyusun Kebutuhan Sistem Pada Proses pengarsipan Dokumen Berbasis Web
Di Dinas Keuangan Dengan Pengelolaan Agile Model Driven
19 Aplikasi Sistem E-Commerce Dengan Pendekatan Agile Model Driven Studi Kasus Toko Fara
Hijab
20 Perancangan Sistem Informasi Persediaan Obat Pada Puskesmas Tinambung Berbasis Web
Menggunakan Metode Agile
21 Rancang Bangun Model Bisnis Web E-Commerce Toko UD Perkasa Berdasarkan Business
Process Modeling Notation (BPMN)
22 Pengembangan Media Pembelajaran Berbasis Makro Media Plus Pada SMK Negeri 2 Majene
23 Sistem Informasi Penerimaan Mahasiswa Baru Berbasis Web Dengan Metode Prototype
24 Aplikasi Ujian Online Di Stikmar Majene Dengan Metode Prototype
25 Aplikasi Website Sistem Informasi Dinas Lingkungan Hidup Dan Kebersihan Kabupaten Majene
26 Aplikasi Penjadwalan Aktivitas Pimpinan Pemerintah Kabupaten Polewali Mandar Dengan

Pendekatan Agile Driven
27 Pemodelan Sistem Informasi Tracer Studi Berdasarkan Metode Agile Studi Kasus Program Studi
Teknik Informatika Unsulbar
28 Sistem Informasi layanan Rumah Sewa di kabupaten majene Berbasis Waeb Dengan Pendekatan
Prototype
29 Sistem Informasi Pengelolaan Surat Masuk dan Surat Keluar pada Dinas Satuan Polisi Pamong
Praja dan Perhubungan Masyarakat
93
No Data Asli
30 Penerapan Metode Prototype Untuk Pengembangan Sistem Informasi Penjadwalan Kuliah Dan
Nilai Pada Program Studi Informatika Di Universitas Sulawesi Barat
31 Implementasi Ensiklopedia Mandar Berbasis Website Menggunakan Algoritma Levenshtein

Distance
32 SISTEM PAKAR DIAGNOSA PENYAKIT GIGI PADA MANUSIA MENGGUNAKAN

METODE LOGIKA FUZZY
33 PENERAPAN ALGORITMA C45 UNTUK MENENTUKAN KETERSEDIAAN BARANG (

STUDI KASUS TOKO ATK)
34 PENERAPAN CLUSTERING K-MEANS DALAM PEMETAAN KUNJUNGAN WISATA DI

KABUPATEN MAJENE
35 IMPLEMENTASI METODE FUZZY MULTI CRITERIA DECISION MAKING SEBAGAI

KLASIFIKASI KELUARGA MISKIN (STUDI KASUS : DESA TOTOLISI SENDANA)
36 Implementasi Data Mining Menggunakan Algoritma Apriori Untuk Mengetahui Pola Pembelian
Konsumen Obat Pada Data Transaksi Penjualan Di Apotek Rahma
37 IMPLEMENTASI DATA MINING UNTUK MENENTUKAN PENJUALAN MOTOR

DENGAN METODE K-MEANS CLUSTERING
38 Perbandingan Algoritma Genetika dan Ant Colony Optimization pada Penyelesaian Travelling
Salesman Problem
39 perhitungan bibit ikan bandeng berdasarkan citra biner berbasis android di kel. baurung kab.
majene
40 Rekomendasi makanan pendamping ASI untuk bayi menggunakan algoritma naive bayes
berdasarkan kebutuhan kalori
41 IMPLEMENTASI GEOGRAPHIC INFORMATION SYSTEM (GIS) DALAM PENENTUAN

LOKASI DAN FASILITAS PERUMAHAN DI WILAYAH KABUPATEN MAJENE
MENGGUNAKAN MODEL WATERFALL DAN ALGORITMA AHP
42 IMPLEMENTASI METODE TEMPLATE MATCHING DALAM MENDETEKSI WAJAH

MENGGUNAKAN MASKER
43 Klasifikasi Kualitas Gula Aren dengan Citra Digital Menggunakan K-Nearest Neighbor (K-NN)
44 PERBANDINGAN KINERJA ALGORITMA SPIDER MONKEY OPTIMIZATION DAN

GENETIKA UNTUK MENYELESAIKAN TRAVELLING SALESMAN PROBLEM
45 Implementasi Algoritma Naive Bayes Untuk Mengukur Tingkat Keefektifan Dan Kepuasan Publik
Sistem Belajar Daring Di Masa Pandemi Covid-19
46 SISTEM PENDUKUNG KEPUTUSAN PREDIKSI KELULUSAN MAHASISWA

MENGGUNAKAN METODE NAIVE BAYES
94
No Data Asli
47 DIAGNOSA HAMA DAN PENYAKIT PADA TANAMAN PADI MENGGUNAKAN

METODE CERTAINTY FACTOR BERBASIS ANDROID
48 IMPLEMENTASI ALGORITMA FP-GROWTH DAN ASSOCIATION RULE UNTUK

MEMPREDIKSI KETERSEDIAAN PANGAN
49 Penerapan Algoritma Naive Bayes Dalam Memprediksi Persediaan Bahan Baku Mebel
50 IMPLEMENTASI ALGORITMA BOYER-MOORE PADA PERANCANGAN KAMUS

BAHASA KHAS DAERAH MAMASA
51 OPTIMASI JUDUL PENELITIAN MENGGUNAKAN KLASIFIKASI ALGORITMA NAIVE

BAYES BAGI MAHASISWA TEKNIK INFORMATIKA
52 Sistem Diagnosa Penyakit Diabetes Mellitus Menggunakan Metode Certainty Factor Dan Fuzzy
Logic Berbasis Web
53 Sistem pendukung keputusan penerima bantuan bencana alam menggunakan metode topsis
54 Sistem Pendukung Keputusan Pencarian Kos-Kosan Untuk Mahasiswa di Majene Menggunakan

Metode Analityc Network Process(ANP
55 IMPEMENTASI SISTEM PAKAR DALAM KLASIFIKASI KEPRIBADIAN

MENGGUNAKAN FORWARD CHAINING
56 Sistem Pendukung Keputusan Pendistribusian Logistic Secara Merata Pasca Bencana Alam
Menggunakan Metode Weighted Product (WP)
57 Sistem Pakar Diagnosa Penyakit Hepatitis Menggunakan Metode Certainty Factor Berbasis Web
58 MONITORING SLOT PARKIRAN SECARA REALTIME MENGGUNAKAN METODE

STRUCTURAL SIMILARITY INDEX (SSIM) SECARA REALTIME
59 ANALISIS KEAMANAN JARINGAN DENGAN FIREWALL FILTER BERBASIS MIKROTIK

DI SEKOLAH MENEGENGAH KEJURUAN NEGERI LABUANG
60 Rancangan Otomatis Splinker Pada Tanaman Jagung Menggunakan Teknik PWM Berbasis
Arduino
61 Sistem Pemantau Kondisi Air Sungai Berbasis IoT
62 Pengembangan Sistem Alat Pendeteksi Kebocora n Pipa Tanaman Hidroponik Menggunakan

Sensor Water Flow
63 Desain dan Pengembangan Sistem Otomasi Vertical Hydroponic Berbasis IoT
64 Sistem Deteksi Kebakaran Berbasis IOT Menggunakan Aplikasi Telegram
65 Perancangan sistem keamanan Smarthome Berbasis IoT Menggunakan Google Assistant

95
No Data Asli
66 PROTOPTYPE PENGAIRAN SAWAH DAN MONITORING KUALITAS PH TANAH

BERBASIS IOT
67 Perancangan Sistem Keuangan Sekolah Berbasis Web pada SMP Negeri 4 Malunda
68 SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT LAMBUNG MENGGUNAKAN

METODE DAMPSTER SHATER
69 Budidaya Kangkung Menggunakan Sistem Aeroponik Berbasis Arduino
70 Perancangan sistem monitoring penggunaan air perusahaan daerah air minum berbasis website
menggunakan Arduino Uno dan komunikasi lora
71 Penerapan Fitur Koreksi Kesalahan Ejaan Bahasa Indonesia Pada Media Tulis Artikel Muslimah
Malaqbiq Community Menggunakan Metode Smoothing Jelinek -Mercer
72 IMPLEMENTASI CONVOLUTIONAL NEURAL NETWORK (CNN) UNTUK

PENGHITUNGAN JUMLAH BENIH IKAN MAS
73 Perancangan Program Penghitung Kendaraan Dan Sistem Kendali Otomatis Lampu Lalu Lintas
Menggunakan Metode Multiple Object Tracking
74 Sistem Pendeteksi Dan Pengusir Hama Pada Buah Kakao Menggunakan Mikrokontroler Arduino
Uno Berbasis Web
75 Penerapan Sistem Monitoring Perkuliahan Mahasiswa Menggunakan Fingerprint Solution X105

(Studi Kasus: Program Studi Teknik Informatika Universitas Sulawesi Barat)
76 Prototype Alat Pendeteksi Hama Pada Tanaman Jagung Menggunakan Mp3 DFPlayer Dan
Mikrokontroler
77 PERBANDINGAN CASE BASED REASONING DAN RULE BASED REASONING UNTUK

PENGEMBANGAN RECOMENDER SYSTEM KELAYAKAN PEMBERIAN PINJAMAN
KOPERASI
78 MULTIPLE OBJECTIVE OPTIMIZATION DALAM SOFTWARE PROJECT SCHEDULING

PROBLEM (SPSP) MENGGUNAKAN EVOLUTIONARY ALGORITHM
79 PEMODELAN RANCANGAN SISTEM INFORMASI TRACER STUDI BERDASARKAN

METODE AGILE STUDI KASUS: PROGRAM STUDI TEKNIK INFORMATIKA
80 Deteksi Wajah Dengan Metode Local binary pattern histogram Pada OpenCV Menggunakan
Pemrograman Python
81 Aplikasi Pembelajaran Sistem Operasi Dasar Berbasis Multimedia
82 Analisis Elektabilitas Tokoh Publik Majene Pada Berita Online Menggunakan Text Mining
83 Sistem Informasi Layanan Rumah Sewa di Majene Berbasis Web dengan Pendekatan Metode
96
No Data Asli
Prototype
84 Sistem Monitoring Denyut Nadi Pada Pasien Di Puskesmas Banggae Majene Menggunakan Pulse
Sensor
85 PERANCANGAN SISTEM PENDETEKSIAN WAJAH DENGAN MEMAKAI MASKER DAN

TIDAK MEMAKAI MASKER MENGGUNAKAN METODE EIGENFACE
86 Sistem komunikasi wireless jarak jauh dan berdaya rendah menggunakan modul komunikasi LoRa
dstudi kasus rompon nelayan di kab majene
87 pengembangan website layanan algoritma data mining yang terintegrasi dengan aplikasi mobile
menggunakan metode REST API
88 SISTEM PEMBAGIAN WARISAN ISLAM DENGAN METODE FORWARD CHAINING
89 Analisis sentimen kelangkaan minyak goreng pada media Instagram
90 Implementasi metode forward chaining dalam sistem pakar untuk mendiagnosa penyakit
kandungan
91 Pengolahan citra pemilihan size udang vaname mengguna kan algoritma naive bayes
92 Penerapan Sistem Informasi Geografis Untuk Pemetaan Golongan Darah Pendonor Menggunakan
Metode K-Means Clustering Studi Kasus : UTD Kabupaten Polewali Mandar
93 SISTEM PENDUKUNG KEPUTUSAN PENENTUAN JENIS TANAH TERBAIK BAGI

TANAMAN PORANG MENGGUNAKAN METODE ANALYTICAL HIERARCHY PROCESS
(AHP)
94 KLASIFIKASI CITRA TINGKAT KEMATANGAN BIJI KOPI SANGRAI MENGGUNAKAN

LINEAR DISCRIMINANT ANALYSIS ( LDA )
95 SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT LAMBUNG MENGGUNAKAN

METODE DAMPSTER SHATER
96 IMPLEMENTASI ALGORITMA DJISKTRA DI E-WARUNG DALAM PENENTUAN JALUR

TERPENDEK PENGANTARAN MAKANAN
97 PERANCANGAN SISTEM PAKAR BERBASIS WEB UNTUK MENDIAGNOSA PENYAKIT

MENULAR DENGAN METODE BACKWARD DAN FORWARD CHAINING
98 PENERAPAN SMART ROOM BERBASIS INTERNET OF THINGS PADA PROGRAM

STUDI INFORMATIKA UNIVERSITAS SULAWESI BARAT
99 PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN KENAIKAN PANGKAT

MENGGUNAKAN METODE FUZZY MULTI-CRITERIA DECISION DI UNIVERSITAS
SULAWESI BARAT
100 sistem pendukung keputusan pemilihan skincare menggunakan algoritma smart

97

Seminar Tutup Kartika Sari

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Seminar Tutup Kartika Sari

Diunggah oleh

Hak Cipta:

Format Tersedia

SKRIPSI

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA

GROUPING OF STUDENT RESEARCH TITLES USING THE

PROGRAM STUDI TEKNIK INFORMATIKA

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA

GROUPING OF STUDENT RESEARCH TITLES USING THE

Diajukan Sebagai Salah Satu Syarat Dalam Memperoleh Gelar

PROGRAM STUDI TEKNIK INFORMATIKA

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA

Nurdina Rasyid, S.Pd., M.Pd Nahya Nur,ST., M.Kom

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA

Telah dipertahankan di depan Tim Penguji

Susunan Tim Penguji

Pembimbing I/Penguji Penguji I

Nurdina Rasyid, S. Pd., M.Pd Ir. Sugiarto Cokrowibowo, S.Si., MT

Pembimbing II/Penguji Penguji II

Nahya Nur, ST., M.Kom Ismail, S.Pd., M.Pd

Farid Wajidi, S.Kom., MT

Dengan ini saya menyatakan bahwa Skripsi yang berjudul “

Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma

karya yang pernah diajukan untuk memperoleh gelar kesarjanaan disuatu

Majene, 17 November 2022

sahabatnya. Sehingga peneliti dapat menyelesaikan skripsi dengan judul

“Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma

syarat untuk menyelesaian Program Sarjana (S1) Program Studi Teknik

Informatika, Fakultas Teknik, Universitas Sulawesi Barat.

yang tidak bosan-bosannya memberikan dukungan dan motivasi kepada

penulis selama dalam proses penyelesaian skripsi ini.

Informatika, Fakultas Teknik, Universitas Sulawesi Barat.

banyak meluangkan waktu dan tenaga serta perhatiannya guna memberikan

bimbingan demi terselesaikannya tugas akhir ini.

telaten membimbing serta membagikan ilmu dan waktunya kepada peneliti.

serta saran perbaikan terhadap tugas akhir ini.

semester pertama sampai dengan penyusunan skripsi.

7. Seluruh staf Fakultas Teknik Universitas Sulawesi Barat.

8. Rekan-rekan mahasiswa jurusan Teknik Informatika 2016, teristimewa untuk

teman-teman seperjuangan kelas D yang telah banyak memberikan bantuan

dan dukungan kepada peneliti selama perkuliahan sampai pada penyusunan

Oleh karenanya, peneliti mengharapkan kritik dan saran demi kesempurnaan

kedepannya sehingga dapat memberikan manfaat bagi masyarakat pada dunia

Majene, 24 Agustus 2022

Kata Kunci : Naïve Bayes, Data Mining, Klasifikasi Judul.

Keywords: Naïve Bayes, Data Mining, Title Classification.

Tabel 2.1 State Of The Art .............................................................................. 20

Gambar 2.1 Skema 10 Fold Cross Validation.................................................. 18

Perkembangan teknologi saat ini sudah berkembang begitu pesat.

Perkembangan teknologi ini menyebabkan terjadinya ledakan jumlah dokumen

elektronik yang tersimpan di dalam sebuah repository perpustakaan Universitas.

digital. Umumnya dokumen-dokumen elektronik tersebut tidak disertai dengan

jumlah informasi atau pengetahuan yang dapat disarikan sehingga menimbulkan

penumpukan dokumen dan akan menyita resource atau memori untuk

menyimpan data tersebut (Gupta, 2012).

Tujuan pendidikan mengarah pada membentuk manusia terdidik yang

secara substansi manusia terdidik terbatas pada pengembangan kemampuan-

kemampuan tertentu, mempersiapkan peserta didik untuk dapat hidup di

memiliki kecerdasan intelektual dan kecerdasan emosional. Sehingga dalam

tataran praktikal, usaha untuk memanusiakan manusia dan membentuk manusia

terdidik. Artinya, semua orang, semua lembaga, sejatinya saling melengkapi

dalam upaya mencapai tujuan pendidikan (Soyomukti dkk 2015).

untuk menyelesaikan Pendidikan di suatu perguruan tinggi. Begitu pun dengan

program studi informatika Fakultas Teknik Universitas Sulawesi Barat

(UNSULBAR) mewajibkan setiap mahasiswa tanpa terkecuali melakukan sebuah

yang dilakukan mahasiswa bertujuan untuk agar mahasiswa mampu menyusun