Anda di halaman 1dari 115

SKRIPSI

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA


MENGGUNAKAN ALGORITMA NAIVE BAYES PADA
PROGRAM STUDI TEKNIK INFORMATIKA

GROUPING OF STUDENT RESEARCH TITLES USING THE


NAIVE BAYES ALGORITHM IN THE INFORMATICS
ENGINEERING STUDY PROGRAM

KARTIKA SARI
D02 16 368

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS SULAWESI BARAT
MAJENE
2022
q

SKRIPSI

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA


MENGGUNAKAN ALGORITMA NAIVE BAYES PADA
PROGRAM STUDI TEKNIK INFORMATIKA

GROUPING OF STUDENT RESEARCH TITLES USING THE


NAIVE BAYES ALGORITHM IN THE INFORMATICS
ENGINEERING STUDY PROGRAM

Diajukan Sebagai Salah Satu Syarat Dalam Memperoleh Gelar


Sarjana Bidang Ilmu Teknik Informatika

KARTIKA SARI
D02 16 368

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS SULAWESI BARAT
MAJENE
2022

ii
HALAMAN PERSETUJUAN
PENELITIAN S1

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA


MENGGUNAKAN ALGORITMA NAIVE BAYES PADA
PROGRAM STUDI TEKNIK INFORMATIKA

Diusulkan Oleh

KARTIKA SARI
D02 16 368

Telah disetujui
Pada tanggal 14 Maret 2021

Pembimbing
Pembimbing I Pembimbing II

Nurdina Rasyid, S.Pd., M.Pd Nahya Nur,ST., M.Kom


NIDN. 0003028703 NIP. 19911105 201903 2 024

iii
SKRIPSI

PENGELOMPOKAN JUDUL PENELITIAN MAHASISWA


MENGGUNAKAN ALGORITMA NAIVE BAYES PADA
PROGRAM STUDI TEKNIK INFORMATIKA
Telah dipersiapkan dan disusun oleh

KARTIKA SARI
D02 16 368

Telah dipertahankan di depan Tim Penguji

Pada Tanggal

Susunan Tim Penguji

Pembimbing I/Penguji Penguji I

Nurdina Rasyid, S. Pd., M.Pd Ir. Sugiarto Cokrowibowo, S.Si., MT


NIDN. 0003028703 NIP. 19860524 201504 1 004

Pembimbing II/Penguji Penguji II

Nahya Nur, ST., M.Kom Ismail, S.Pd., M.Pd


NIP. 19911105 201903 2 024 NIDN. 0911128203

Penguji III

Farid Wajidi, S.Kom., MT


NIP.19890418 201903 1 018

iv
PERNYATAAN

Dengan ini saya menyatakan bahwa Skripsi yang berjudul “

Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma

Naive Bayes pada Program Studi Teknik Informatika” ini tidak terdapat

karya yang pernah diajukan untuk memperoleh gelar kesarjanaan disuatu

Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya

atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali

yang secara tertulis terdapat di dalam naskah ini dan disebutkan dalam daftar

pustaka.

Majene, 17 November 2022

KARTIKA SARI
D02 16 368

v
KATA PENGANTAR

Assalamualaikum wr.wb.
Segala Puji dan syukur kami panjatkan kehadirat Allah SWT yang telah

melimpahkan rahmat dan hidayahnya. Sholawat serta salam tak lupa peneliti

tuturkan kepada Nabi Muhammad SAW, serta kepada keluarga dan para

sahabatnya. Sehingga peneliti dapat menyelesaikan skripsi dengan judul

“Pengelompokan Judul Penelitian Mahasiswa Menggunakan Algoritma

Naive Bayes Pada Program Studi Teknik Informatika“. Sebagai salah satu

syarat untuk menyelesaian Program Sarjana (S1) Program Studi Teknik

Informatika, Fakultas Teknik, Universitas Sulawesi Barat.

Terselesaikannya tugas akhir ini tidak terlepas dari bantuan berbagai pihak,

oleh sebab itu penulis mengucapkan rasa terima kasih yang besar kepada :

1. Keluarga Penulis : Budiman dan Mahdalena selaku kedua orang tua penulis

yang tidak bosan-bosannya memberikan dukungan dan motivasi kepada

penulis selama dalam proses penyelesaian skripsi ini.

2. Bapak Muh. Fahmi Rustam, S.Kom., M.T selaku Ketua Prodi Teknik

Informatika, Fakultas Teknik, Universitas Sulawesi Barat.

3. Ibu Nurdina Rasyid, S.Pd., M.Pd selaku pembimbing pertama yang telah

banyak meluangkan waktu dan tenaga serta perhatiannya guna memberikan

bimbingan demi terselesaikannya tugas akhir ini.

4. Ibu Nahya Nur, ST., M.Kom selaku pembimbing kedua yang telah sabar dan

telaten membimbing serta membagikan ilmu dan waktunya kepada peneliti.

vi
5. Bapak Ir. Sugiarto Cokrowibowo, S.Si., MT, Bapak Ismail, S.Pd., M.Pd, dan

Bapak Farid Wajidi, S.Kom., MT, selaku penguji yang memberikan koreksi

serta saran perbaikan terhadap tugas akhir ini.

6. Seluruh Bapak dan Ibu dosen Program Studi Teknik Informatika, Fakultas

Teknik yang telah memberikan ilmu dan motivasi kepada peneliti mulai dari

semester pertama sampai dengan penyusunan skripsi.

7. Seluruh staf Fakultas Teknik Universitas Sulawesi Barat.

8. Rekan-rekan mahasiswa jurusan Teknik Informatika 2016, teristimewa untuk

teman-teman seperjuangan kelas D yang telah banyak memberikan bantuan

dan dukungan kepada peneliti selama perkuliahan sampai pada penyusunan

skripsi ini.

Peneliti menyadari bahwa skripsi ini tidak luput dari berbagai kekurangan.

Oleh karenanya, peneliti mengharapkan kritik dan saran demi kesempurnaan

kedepannya sehingga dapat memberikan manfaat bagi masyarakat pada dunia

pendidikan. Aamiin.

Majene, 24 Agustus 2022

KARTIKA SARI
D02 16 368

vii
ABSTRAK

Judul skripsi yang sudah dibuat mahasiswa khususnya pada program studi
Teknik Informatika Unsulbar, Terdapat tiga konsentrasi yaitu Sistem cerdas
(Smart System), Rekayasa Perangkat Lunak (Software Engineering) dan Jaringan
Komputer (Internet Of Thingts). Namun pengelompokan judul tugas akhir
mahasiswa di UNSULBAR khususnya prodi informatika belum terklasifikasi
secara maksimal, sesuai dengan peminatan dan pengembangan ilmu informatika
yang terus berubah mengikuti perkembangan zaman. Hal tersebut diharapkan
dapat membantu dalam memberikan gambaran kepada mahasiswa untuk mencari
judul yang relevan dengan bidang konsentrasi mahasiswa tersebut. Untuk
melakukan klasifikasi atau pengelompokan topik skripsi mahasiswa yang ada
dijurusan teknik informatika. Pengelompokan skripsi dilakukan dengan melihat
judul dari setiap skripsi yang telah dibuat oleh mahasiswa. Terdapat banyak teknik
klasifikasi yang dikenal. Teks mining salah satu teknik yang digunakan untuk
melakukan klasifikasi dokumen dimana teks mining merupakan variasi data
mining yang berusaha menetukan pola menarik dari sekumpulan data tekstual
yang berjumlah besar. Hasil penerapan algoritma naïve bayes telah berhasil dalam
melakukan klasifikasi judul skripsi menggunakan algoritma naive bayes dapat
dilakukan dalam mengelompokan judul skripsi sesuai kelas topiknya. Dari hasil
pengujian akurasi yang dilakukan terhadap 150 data training dan 100 data testing
yang digunakan diperoleh tingkat akurasi sebesar 97 %. Adapun pengujian presisi
didapatkan nilai sebesar 0,97 %, Recall mendapat nilai sebesar 0,96 % dan nilai
laju error sebesar 0,03 %. Berdasarkan hasil pengujian dapat diketahui bahwa
implementasi metode naive bayes dalam melakukan pengklasifikasian judul
skripsi kedalam kategori kelas sudah baik, dapat dilihat dari tingkat akurasi yang
diperoleh terhadap 100 data testing dan 150 data training.

Kata Kunci : Naïve Bayes, Data Mining, Klasifikasi Judul.

viii
ABSTRACT

The title of the thesis that has been made by students, especially in the
Unsulbar Informatics Engineering study program, has three concentrations,
namely Smart Systems, Software Engineering and Computer Networks (Internet
Of Things). However, the grouping of students' final assignments at UNSULBAR,
especially the informatics study program, has not been maximally classified, in
accordance with the interest and development of informatics science which
continues to change following the times. This is expected to help in providing an
overview for students to find titles that are relevant to the student's field of
concentration. To classify or group thesis topics for students in the department of
informatics engineering. The thesis grouping is done by looking at the title of each
thesis that has been made by students. There are many known classification
techniques. Text mining is one of the techniques used to classify documents where
text mining is a variation of data mining that seeks to determine interesting
patterns from a large set of textual data. The results of the application of the
Naive Bayes algorithm have succeeded in classifying thesis titles using the Naive
Bayes algorithm, which can be done in grouping thesis titles according to the
topic class. From the results of the accuracy tests carried out on 150 training data
and 100 testing data used, an accuracy rate of 97% was obtained. The precision
test got a value of 0.97%, Recall got a value of 0.96% and an error rate value of
0.03%. Based on the test results, it can be seen that the implementation of the
Naive Bayes method in classifying thesis titles into class categories is good, it can
be seen from the level of accuracy obtained for 100 testing data and 150 training
data.

Keywords: Naïve Bayes, Data Mining, Title Classification.

ix
DAFTAR ISI

SAMPUL....................................................................................................... i
HALAMAN JUDUL .................................................................................... ii
HALAMAN PERSETUJUAN .................................................................... iii
HALAMAN PENGESAHAN ..................................................................... iv
PERNYATAAN ........................................................................................... v
KATA PENGANTAR ................................................................................. vi
ABSTRAK .................................................................................................... viii
DAFTAR ISI................................................................................................. x
DAFTAR TABEL ........................................................................................ xi
DAFTAR GAMBAR ................................................................................... xii
BAB I PENDAHULUAN ............................................................................ 1
A. Latar Belakang ................................................................................... 1
B. Rumusan Masalah............................................................................... 3
C. Tujuan Penelitian ................................................................................ 4
D. Manfaat Penelitian .............................................................................. 4
E. Batasan Masalah ................................................................................. 4
BAB II TINJAUAN PUSTAKA ................................................................. 5
A. Tugas Akhir ........................................................................................ 5
B. Data Mining ........................................................................................ 6
C. Klasifikasi .......................................................................................... 7
D. Text Preprocessing ............................................................................. 7
E. Term Weighting .................................................................................. 9
F. Algoritma Naive Bayes....................................................................... 11
G. PHP .................................................................................................... 14
H. MySQL............................................................................................... 14
I. XAMPP............................................................................................... 15
J. Confusion Matriks .............................................................................. 16
K. Accuracy ............................................................................................. 16
L. Perhitungan Presisi ............................................................................. 17
M. Recall .................................................................................................. 17
N. Cross Validation ................................................................................. 17
O. Penelitian Terkait................................................................................ 20
BAB III METODE PENELITIAN............................................................. 26
A. Jenis Penelitian ................................................................................... 26
B. Metode Pengembangan Sistem .......................................................... 27
C. Tahapan Penelitian ............................................................................. 29
D. Lokasi Waktu Penelitian..................................................................... 35
E. Gambaran Umum Sistem ................................................................... 35
F. Perancangan Data Flow Diagram ....................................................... 36
G. Teknik Pengumpulan Data ................................................................. 38
H. Teknik Analisis Data.......................................................................... 39
I. Teknik Pengujian ................................................................................ 39
BAB IV HASIL DAN PEMBAHASAN ..................................................... 41

x
A. Hasil.................................................................................................... 41
B. Implementasi Sistem .......................................................................... 56
C. Hasil Pegujian..................................................................................... 62
BAB V KESIMPULAN DAN SARAN ...................................................... 80
A. Kesimpulan ......................................................................................... 80
B. Saran ................................................................................................... 80
DAFTAR PUSTAKA .................................................................................. 82

xi
DAFTAR TABEL

Tabel 2.1 State Of The Art .............................................................................. 20


Tabel 4.1 Contoh Data Training..................................................................... 35
Tabel 4.2 Hasil Case Folding Judul Skripsi ................................................... 36
Tabel 4.3 Hasil Tokenisasi Judul Skripsi........................................................ 37
Tabel 4.4 Hasil Filtering/Stopword Data Judul Skripsi ................................. 38
Tabel 4.5 Hasil Stemming Data Judul Skripsi ................................................ 39
Tabel 4.6 Atribut Kata ................................................................................... 41
Tabel 4.7 Pembobotan TF .............................................................................. 42
Tabel 4.8 Hasil Pembobotan TF ..................................................................... 43
Tabel 4.9 Hasil Pembobotan IDF................................................................... 44
Tabel 4.10 Hasil Pembobotan TF-IDF ........................................................... 45
Tabel 4.11 Hasil Model Data Training Naïve Bayes ..................................... 48
Tabel 4.12 Contoh Data Testing yang akan Diuji .......................................... 49
Tabel 4.13 Model Confusion Matriks untuk Algoritma Naïve Bayes ............ 57
Tabel 4.14 Confusion Matriks ........................................................................ 59
Tabel 4.15 Pengujian K-Fold Cross Validation 1-10..................................... 61
Tabel 4.16 Confusion Matriks Fold 1 ............................................................ 62
Tabel 4.17 Pengujian K-Fold Cross Validation 11-20................................... 62
Tabel 4.18 Confusion Matriks Fold 2 ............................................................ 63
Tabel 4.19 Pengujian K-Fold Cross Validation 21-30................................... 64
Tabel 4.20 Confusion Matriks Fold 3 ............................................................ 64
Tabel 4.21 Pengujian K-Fold Cross Validation 31-40................................... 65
Tabel 4.22 Confusion Matriks Fold 4 ............................................................ 65
Tabel 4.23 Pengujian K-Fold Cross Validation 41-50................................... 66
Tabel 4.24 Confusion Matriks Fold 5 ............................................................ 66
Tabel 4.25 Pengujian K-Fold Cross Validation 51-60................................... 67
Tabel 4.26 Confusion Matriks Fold 6 ............................................................ 67
Tabel 4.27 Pengujian K-Fold Cross Validation 61-70................................... 68
Tabel 4.28 Confusion Matriks Fold 7 ............................................................ 68
Tabel 4.29 Pengujian K-Fold Cross Validation 71-80................................... 69
Tabel 4.30 Confusion Matriks Fold 8 ............................................................ 69
Tabel 4.31 Pengujian K-Fold Cross Validation 81-90................................... 70
Tabel 4.32 Confusion Matriks Fold 9 ............................................................ 70
Tabel 4.33 Pengujian K-Fold Cross Validation 91-100................................. 71
Tabel 4.34 Confusion Matriks Fold 10 .......................................................... 72
Tabel 4.35 Hasil Keselurahan Pengujian........................................................ 73

xii
DAFTAR GAMBAR

Gambar 2.1 Skema 10 Fold Cross Validation.................................................. 18


Gambar 3.1 Model Pengembangan Eksperimen .............................................. 26
Gambar 3.2 Metode Waterfall .......................................................................... 27
Gambar 3.3 Alur Proses Proprocessing ........................................................... 28
Gambar 3.4 Diagram Alur Pembobotan TF-IDF ............................................. 30
Gambar 3.5 Alur Sistem Secara Umum ........................................................... 32
Gambar 3.6 Context Diagram ........................................................................... 33
Gambar 3.7 Diagram Level 0 ........................................................................... 33
Gambar 3.8 Diagram Level 1 ........................................................................... 34
Gambar 4.1 Halaman Login ............................................................................. 49
Gambar 4.2 Username dan Password Salah .................................................... 50
Gambar 4.3 Halaman Home/Beranda .............................................................. 50
Gambar 4.4 Halaman Stemming ....................................................................... 51
Gambar 4.5 Halaman Klasifikasi...................................................................... 51
Gambar 4.6 Halaman Data Testing .................................................................. 52
Gambar 4.7 Halaman Preprocessing Data Training ........................................ 52
Gambar 4.8 Halaman Preprocessing Data Testing .......................................... 52
Gambar 4.9 Halaman Data Testing .................................................................. 53
Gambar 4.10 Klasifikasi NBC.......................................................................... 53
Gambar 4.11 Halaman Hasil Klasifikasi .......................................................... 54
Gambar 4.12 Halaman Hasil Pengujian ........................................................... 54
Gambar 4.13 Grafik Hasil Pengujian Akurasi.................................................. 72

xiii
BAB I

PENDAHULUAN

A. Latar Belakang

Perkembangan teknologi saat ini sudah berkembang begitu pesat.

Perkembangan teknologi ini menyebabkan terjadinya ledakan jumlah dokumen

elektronik yang tersimpan di dalam sebuah repository perpustakaan Universitas.

Berbagai karya ilmiah dari sivitas akademika mulai dari skripsi, laporan

penelitian, laporan kerja praktik dan lain sebagainya telah tersedia dalam versi

digital. Umumnya dokumen-dokumen elektronik tersebut tidak disertai dengan

jumlah informasi atau pengetahuan yang dapat disarikan sehingga menimbulkan

penumpukan dokumen dan akan menyita resource atau memori untuk

menyimpan data tersebut (Gupta, 2012).

Tujuan pendidikan mengarah pada membentuk manusia terdidik yang

secara substansi manusia terdidik terbatas pada pengembangan kemampuan-

kemampuan tertentu, mempersiapkan peserta didik untuk dapat hidup di

masyarakat dan ditentukan oleh pihak luar individu adalah manusia yang

memiliki kecerdasan intelektual dan kecerdasan emosional. Sehingga dalam

tataran praktikal, usaha untuk memanusiakan manusia dan membentuk manusia

terdidik. Artinya, semua orang, semua lembaga, sejatinya saling melengkapi

dalam upaya mencapai tujuan pendidikan (Soyomukti dkk 2015).

1
2

Skripsi merupakan salah satu syarat yang harus dipenuhi oleh mahasiwa

untuk menyelesaikan Pendidikan di suatu perguruan tinggi. Begitu pun dengan

program studi informatika Fakultas Teknik Universitas Sulawesi Barat

(UNSULBAR) mewajibkan setiap mahasiswa tanpa terkecuali melakukan sebuah

penelitian yang dikemas dalam skripsi dan menjadi tugas akhir. Pembuatan skripsi

yang dilakukan mahasiswa bertujuan untuk agar mahasiswa mampu menyusun

dan menulis suatu karya ilmiah, sesuai dengan bidang ilmunya. Skripsi

merupakan tugas wajib yang dilakukan oleh mahasiswa sebagai syarat untuk

memperoleh gelar sarjana, skripsi adalah karya ilmiah yang diwajibkan sebagai

bagian dari persyaratan akademis diperguruan tinggi. Semua mahasiswa wajib

mengambil mata kuliah skripsi karena skripsi digunakan sebagai salah satu

prasyarat bagi mahasiswa untuk memperoleh gelar sarjana.

Pengambilan topik skripsi, pada program studi teknik informatika

memberikan beberapa pilihan topik atau peminatan yang dapat dipilih oleh

mahasiswa. (Muhammad Rafi Muttaqin dkk, 2020). Hal tersebut bertujuan agar

konsentrasi lebih spesifik dan terarah dalam satu bidang.

Judul skripsi yang sudah dibuat mahasiswa khususnya pada program studi

Teknik Informatika Unsulbar, Terdapat tiga konsentrasi yaitu Sistem cerdas

(Smart System), Rekayasa Perangkat Lunak (Software Engineering) dan Jaringan

Komputer (Internet Of Thing). Namun pengelompokan judul tugas akhir

mahasiswa di UNSULBAR khususnya prodi Informatika belum terklasifikasi

secara maksimal, sesuai dengan peminatan dan pengembangan ilmu informatika


3

yang terus berubah mengikuti perkembangan zaman. Hal tersebut diharapkan

dapat membantu dalam meberikan gambaran kepada mahasiswa untuk mencari

judul yang relevan dengan bidang konsentrasi mahasiswa tersebut. Untuk itu

dalam penelitian ini bertujuan untuk melakukan klasifikasi atau pengelompokan

topik skripsi mahasiswa yang ada dijurusan teknik informatika. Pengelompokan

skripsi dilakukan dengan melihat judul dari setiap skripsi yang telah dibuat oleh

mahasiswa. Judul ini dipilih karna dapat mendefenisikan istilah secara lebih

ringkas dan jelas pada setiap bidang penelitian skripsi, sehingga dapat digunakan

untuk mengklasifikasi topik skripsi mahasiswa diprodi teknik informatika.

Terdapat banyak teknik klasifikasi yang dikenal. Teks mining salah satu teknik

yang digunakan untuk melakukan klasifikasi dokumen dimana teks mining

merupakan variasi data mining yang berusaha menetukan pola menarik dari

sekumpulan data tekstual yang berjumlah besar (Khalida dan Bharata, 2020).

Berdasarkan uraian permasalahan diatas maka penulis mengangkat sebuah

penelitian sebagai tugas akhir dengan judul “Pengelompokan Judul Penelitian

Mahasiswa Menggunakan Algoritma Naive Bayes Pada Program Studi

Teknik Informatika”.

B. Rumusan Masalah

Berdasarkan latar belakang masalah diatas maka diperoleh rumusan

masalah yaitu bagaimana hasil implementasi sistem pengelompokan judul

penelitian mahasiswa menggunakan algoritma Naive Bayes pada program studi

teknik informatika?
4

C. Tujuan Penelitian

Adapun tujuan dari penelitian ini yaitu untuk mengetahui hasil

implementasi sistem pengelompokan judul penelitian mahasiswa menggunakan

algoritma Naive Bayes pada program studi teknik informatika.

D. Manfaat Penelitian

Adapun manfaat yang ingin diperoleh kategori judul penelitian yang

diajukan sekaligus melakukan klasifikasinya.

1. Bagi penulis dapat mengetahui bagaimana cara menerapkan ilmu-ilmu yang

sudah dipelajari selama perkuliahan terutama yang terkait text mining.

2. Bagi pihak instansi khususnya perpustakaan yang menjadi objek penelitian

dapat menerapkan pengelompokan dokumen skripsi ini untuk memudahkan

dalam hal penyusunan dokumen-dokumen skripsi yang baru.

3. Dapat dijadikan acuan untuk melihat kedekatan topik yang hampir sama antar

skripsi yang ada. Sehingga dapat digunakan sebagai referensi agar penelitian

skripsi yang baru bisa lebih variatif dari penelitian skripsi yang sudah pernah

dilakukan sebelumnya.

E. Batasan Masalah

Adapun batasan masalah dari penelitian ini yaitu :

1. Algoritma yang digunakan dalam mengklasifikasikan judul penelitian

mahasiswa prodi teknik informatika yaitu Naive Bayes.

2. Data yang diambil hanya dari mahasiswa prodi Teknik Informatika

Universitas Sulawesi Barat periode


BAB II

TINJAUAN PUSTAKA

A. Tugas Akhir

Skripsi menjadi syarat bagi mahasiswa untuk meraih gelar akademiknya

sekaligus menjadi tolak ukur untuk melihat sejauh mana pemahaman mahasiswa

terhadap ilmu yang telah dipelajarinya melalui penelitian yang dilakukan

berdasarkan fenomena atau permasalahan yang terjadi. Menurut Barnawi (2015).

Tugas akhir adalah suatukarya tulis ilmiah hasil penelitian pustaka atau lapangan

yang harus dipertahankan dihadapan penguji sebagai salah satu syarat

memperoleh gelar Sarjana (Strata-1).

Skripsi dibuat berdasarkan penugasan akademik dari institusi pendidikan

kepada mahasiswa program Sarjana di tingkat akhir. Menurut Machmud (2016)

tugas akhir merupakan salah satu jenis karya ilmiah yang disusun oleh mahasiswa

dibawah bimbingan dosen pembimbing sehingga memenuhi kaidah dan standar

kualitas sesuai dengan keilmuannya. Penulisan laporan tugas akhir harus

mengikuti kaidah dan petunjuk teknis penulisan, baik yang diterbitkan oleh

program studi masing-masing ataupun literatur yang membahas tentang penulisan

karya ilmiah (tugas akhir).

Menurut Syahdrajat (2015) tugas akhir merupakan dokumentasi berharga

diperguruan tinggi yang dapat dijadikan sebagai sumber informasi dan sumber

pembelajaran bagi segenap civitas akademik. Tugas akhir berguna dalam hal

berbagai pengetahuan dengan sejawat dan rekan-rekan untuk memberikan

5
6

sumbangan pada pendidikan, bermanfaat bagi pembaca ataupun adik-adik kelas

diperguruan tinggi dan generasi-generasi mahasiswa dimasa yang akan datang.

Berdasarkan pengertian dan uraian diatas, dapat disimpulkan bahwa tugas

akhir merupakan karya tulis ilmiah yang disusun untuk merefleksi atau

mengaplikasikan pengetahuan dan keterampilan yang sudah dimiliki sekaligus

untuk memenuhi syarat guna memperoleh gelar sarjana penuh pada tingkat

pendidikan strata satu.

B. Data Mining

Data mining adalah proses yang mempekerjakan satu atau lebih teknik

pembelajaran computer (machine learning) untuk menganalisis dan mengekstraksi

pengetahuan (knowledge) secara otomatis. Data mining berisi pencarian trend atau

pola yang diinginkan dalam database besar untuk membantu pengambilan

keputusan di waktu yang akan dating. Pola-pola ini dikenali oleh perangkat

tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan

yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja

menggunakan perangkat pendukung keputusan lainnya (Mandias, 2015).

C. Klasifikasi

Klasifikasi merupakan bagian dari algoritma data mining, klasifikasi ini adalah

algoritma yang menggunakan data dengan target (class/label) yang berupa nilai

kategorikal/nominal (Rifqo & Wijaya, 2017). Sedangkan data mining merupakan proses

ataupun kegiatan untuk mengumpulkan data yang berukuran besar kemudian

mengekstraksi data tersebut menjadi informasi informasi yang nantinya dapat digunakan

(Putro et al, 2021).


7

Proses ini akan digunakan data training set atau data sampel yang telah

diketahui label – label atau atribut dari data sampel tersebut untuk membangun

model.

1. Proses Testing

Pada proses Testing ini dilakukan untuk mengetahui keakuratan model yang

telah dibuat pada proses training maka dibangun data yang disebut dengan data

testing untuk mengklasifikasi label – labelnya.

D. Text Preprocessing

Text preprocessing adalah proses awal dalam text mining. Preprocessing

dilakukan untuk menghilangkan bagian teks yang tidak diperlukan sehingga

mendapatkan data yang berkualitas untuk dieksekusi (Sanjaya, S., & Absar, E. A.,

2015). Adapun tahapan preprocessing berdasarkan proses yaitu:

1. Tokenizing

Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata

yang menyusunnya. Dan spasi digunakan untuk memisahkan antar kata yang

disebutkan pada prinsipnya ini adalah memisahkan setiap kata yang menyusun

suatu dokumen (Asian, 2007). Proses ini juga dilakukan penghilangan angka,

tanda baca, dan karakter lain selain huruf alphabet. Hal ini dikarenakan karakter-

karakter tersebut dianggap sebagai pemisah kata (delimiter) dan tidak memiliki

pengaruh terhadap pemrosesan teks.

2. Case Folding

Case folding tahap mengubah semua huruf dalam dokumen menjadi huruf

kecil. Hanya huruf “a” sampai dengan “z” yang diterima. Karakter selain huruf
8

dihilangkan dan dianggap delimiter (pembatas).

3. Filtering/Stopword

Filtering adalah tahap mengambil kata-kata penting dari hasil tokenizing.

Proses filtering dapat menggunakan algoritma stoplist (membuang kata yang

kurang penting) atau wordlist (menyimpan kata penting). Stoplist/ stopworld

adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-

of-words. Pada penelitian ini akan digunakan database stopword removal. Jadi

apabila ada kata yang berada dalam kamus database akan segera dihapus. Untuk

kamus stopword digunakan kamus dari tala.

Filtering adalah tahap pemilihan kata-kata penting dari hasil token, yaitu

kata-kata yang bisa digunakan untuk mewakili isi dari sebuah dokumen. Tahapan

ini adalah dengan melakukan penghilangan stopword dan juga mengubah kata-

kata ke dalam bentuk dasar terhadap kata yang berimbuhan. Stopword merupakan

kosa kata yang bukan merupakan kata unik atau ciri pada suatu dokumen atau

tidak menyampaikan pesan apapun secara signifikan pada teks atau kalimat

(Dragut et al, 2009).

4. Stemming

Stemming merupakan proses yang digunakan untuk menemukan kata dasar

dari sebuah kata dengan menghilangkan semua imbuhan (affixes) baik yang

merupakan awalan (prefixes), sisipan (infixex), akhiran (suffixes), dan kombinasi

dari awalan serta akhiran (confixes) pada kata turunan.

Stemming adalah proses pengubahan bentuk kata menjadi kata dasar atau

tahap root kata dari setiap kata hasil filtering. Stemming yang digunakan yaitu
9

stemming Nazief dan Adriani karena algoritma ini memiliki akurasi lebih besar

dibandingkan dengan algoritma Porter (Agusta, L. 2009).

E. Term Weighting

Term Weighting Menurut Asian (2007), term weighting adalah suatu

pembobotan kata dalam suatu dokumen. Perhitungan bobot tiap term dicari pada

setiap dokumen bertujuan untuk dapat mengetahui ketersediaan dan kemiripan

suatu term di dalam dokumen.

1. Term Frequency

Menurut Wurdianarto, Novianti dan Rosyidah (2014), term frequency

adalah algoritma pembobotan heuristik yang menentukan bobot dokumen

berdasarkan kemunculan term. TF adalah frekuensi kemunculan sebuah term

(kata/frasa) dalam dokumen yang bersangkutan. Semakin besar jumlah

kemunculan suatu term dalam dokumen, maka semakin besar pula bobotnya.

Untuk mendapatkan nilai TF dapat digunakan persamaan :

tft,x = ft,x (2.1)

Dimana :
x = dokumen ke-x
t = term atau kata ke-t
tft,x = banyaknya kemunculan term ke-t pada dokumen ke-x
ft,x = Frekuensi kemunculan term t dalam seluruh dokumen

2. Inverse Document Frequency (IDF)

Inverse Document Frequency (IDF) merupakan sebuah perhitungan dari

bagaimana term didistribusikan secara luas pada koleksi dokumen yang

bersangkutan. Sebelum menentukan IDF, diperlukan untuk mencari Document

Frequency (DF) yaitu banyaknya dokumen yang mengandung term atau token
10

kata ke- .Untuk mendapatkan nilai IDF dapat digunakan persamaan:


N
idft = log d⁄ (2.2)
t

Dimana :

𝑖𝑑𝑓𝑡 = inverse jumlah dokumen yang mengandung term ke-t


N = banyaknya seluruh dokumen
𝑑𝑓𝑡 = banyaknya dokumen yang mengandung term ke-t

3. Term Frequency Inverse Document Frequency (TF-IDF)

TF-IDF adalah sebuah metode yang biasanya digunakan untuk

menetapkan nilai frekuensi di setiap kata dalam dokumen atau artikel. Dalam

perhitungan setiap kata seberapa relevan kata tersebut dalam sebuah dokumen.

(Evan dan Pranowo, 2014)

TF-IDF merupakan algoritma yang pada umumnya digunakan dalam

pengolahan data yang besar, algoritma ini untuk pembobotan dalam setiap kata

dan kategori untuk mencari kesamaan kata kunci pada katagori yang ada.

Sebelum proses pembobotan kata akan dilakukan tahapan-tahapan text Pre-

processing berikut :

1. tokenizing
2. case folding
3. filtering
4. stemming
Kemudian selanjutnya adalah proses penghitungan bobot TF-IDF, bobot

query relevance dan bobot similarity. (Marlinda dam Rianto, 2013) Untuk

menghitung nilai TF-IDF yaitu:

wt,x = tft,x x idft (2.3)


11

Keterangan :

𝑤𝑡,𝑥 = bobot term terhadap dokumen


𝑡𝑓𝑡 ,𝑥 = Jumlah kemunculan term dalam dokumen
𝑖𝑑𝑓𝑡 = inverse jumlah dokumen yang mengandung term ke-t

F. Algoritma Naive Bayes

Algoritma Naive Bayes termasuk kategori klasik dengan konsep probabilitas

yang simpel. Meski demikian, algoritma ini memberikan performansi cukup baik

untuk banyak kasus modern dengan data yang besar. Algoritma Naive Bayes

menggunakan sebuah teorema kuno warisan abad ke18, yang ditemukan oleh

Thomas Bayes. Dalam Teorema Bayes, suatu probabilitas bersyarat dinyatakan

sebagai berikut.

𝑃( 𝐻 |𝑋 ) 𝑃( 𝐻)
𝑃(𝐻|𝑋 ) = (2.4)
𝑃(𝑋)

Dimana X adalah bukti, H adalah hipotesis, P(H |X) adalah probabilitas

bahwa hipotesis H benar untuk bukti X atau dengan kata lain P(H|X) merupakan

probabilitas posterior H dengan syarat X. P(X | H) adalah probabilitas bahwa

bukti X benar untuk hipotesis H atau probabilitas posterior X dengan syarat H,

P(H) adalah probabilitas prior hipotesis H, dan P(X) adalah probabilitas prior

bukti X.

Dalam bidang machine learning, X adalah sebuah tuple atau objek data, H

adalah hipotesis atau dugaan bahwa tuple X adalah kelas C. Secara spesifik dalam

masalah klasifikasi P (H | X) sebagai probabilitas bahwa hipotesis H benar untuk

tuple X atau dengan kata lain P (H | X) adalah probabilitas bahwa tuple X berada

dalam kelas C. Sementara itu, P(H) adalah probabilitas prior bahwa hipotesis H
12

benar untuk setiap tuple tidak peduli nilai-nilai atributnya sedangkan P(X) adalah

probabilitas prior dari tuple X.

Proses penggunaan model Naive Bayes classifier himpunan data training set

dimisalkan sebagai D, yang berisi sejumlah tuple X. Kelasnya dimisalkan sebagai

m, yaitu (𝐶1 , 𝐶2 , … 𝐶𝑚) adalah data bertipe kategorial untuk sebuah tuple masukan

X, setiap tuple adalah berdimensi n yang dinyatakan sebagai 𝐴1 , 𝐴2 , … 𝐴𝑛.

Probabilitas prior masing – masing kelas dihitung sehingga dihasilkan sebuah

tabel kelas, dimana P(𝐶 𝑖) = jumlah tuple dikelas 𝐶𝑖 dibagi total semua tuple dalam

himpunan data latih D.

Hitung probabilitas setiap nilai pada semua n atribut (𝐴1 , 𝐴2 , … 𝐴𝑛) untuk

seluruh m kelas (𝐶1 , 𝐶2 , … 𝐶𝑚) sehingga dihasilkan sejumlah n tabel probabilitas,

jika ada probabilitas bernilai 0, maka dilakukan Laplacian correction. Laplacian

correction atau additive smoothing adalah suatu cara untuk menangani nilai

probabilitas 0 (nol). Dari sekian banyak data di training set, pada setiap

perhitungan datanya ditambah 1 (satu) dan tidak akan membuat perbedaan yang

berarti pada estimasi probabilitas sehingga bisa menghindari kasus nilai

probabilitas 0 (nol). Sehingga dihasilkan sebanyak (n + 1) tabel, yaitu : satu tabel

probabilitas kelas dan n tabel berisi probabilitas setiap nilai pada semua atribut

yang ada. Persamaan Laplacian correction dapat dilihat pada persamaan (2.2)

berikut.

P(𝑋𝑘𝑗 | 𝐶𝑖 ) = 𝑓(𝑋𝑘𝑗 | 𝐶 𝑖 ) +1 (2.5)


f (𝐶𝑖)+ | W |
13

Dimana,
P(𝑋𝑘𝑗 | 𝐶𝑖 ) adalah peluang kata 𝑋𝑘𝑗 pada kategori 𝐶𝑖,
𝑓 (𝑋𝑘𝑗| 𝐶𝑖 ) adalah nilai frekuensi kemunculan kata 𝑋𝑘𝑗 pada kategori 𝐶𝑖,
𝑓 (𝐶 𝑖) adalah jumlah frekuensi kemunculan kata pada kategori 𝐶 𝑖,
|W| adalah jumlah keseluruhan atribut kata (token) yang digunakan.

Untuk memprediksi label kelas dari tuple X, maka harus dihitung probabilitas

P(X | 𝐶𝑖) P(𝐶𝑖) untuk setiap kelas 𝐶𝑖. Selanjutnya mencari kelas 𝐶𝑖 yang

menghasilkan probabilitas P(X | 𝐶 𝑖) P(𝐶𝑖) maksimum sebagai kelas keputusan.

Persamaan berikut dapat digunakan untuk mengklasifikasikan sebuah tuple

masukan dengan mencari probabilitas maksimum dari semua kelas yang ada

(Suyanto, 2018).

P(X|𝐶𝑖) P(𝐶 𝑖) = (∏𝑛𝑘=1 P(𝑋𝑘|𝐶𝑖) x P(𝐶𝑖 )=(P(𝑋1 |𝐶𝑖 )x … x P(𝑋𝑛|𝐶𝑖 )) x P(𝐶𝑖) (2.6)

Jika dan hanya jika.

P(X | 𝐶 𝑖 ) P(𝐶𝑖 ) > P(X | 𝐶 𝑗 ) P(𝐶𝑗 ) untuk 1 ≤ 𝑗 ≤ 𝑚, 𝑗 ≠ 𝑖 Dapat

disederhanakan ke dalam persamaan berikut.

P(𝐶𝑖) = P(𝐶𝑖 )∏𝑛𝑘=1 P(𝑋𝑘|𝐶𝑖 ) (2.7)

Naive Bayes adalah metode yang dapat melakukan pekerjaan dengan

efisien. Jika input dianggap seperangkat atribut, seperti kata-kata, kita bisa

menghitung probabilitas apakah halaman web milik kelas tertentu atau tidak.

Proses ini terdiri dari dua fase: fase training dan fase klasifikasi. Pada fase

training, filternya akan dilatih menggunakan kumpulan kata yang dikenal untuk

diklasifikasikan ke dalam halaman web. Berdasarkan kemunculannya masing-

masing kata diberikan probabilitas untuk kapasitasnya untuk menentukan kelas

klasifikasinya. Kemudian, gunakan koleksi kata filter untuk mengklasifikasikan

setiap halaman web di fase klasifikasi (Aris J. Ordoñez, 2018).


14

G. PHP

Menurut MADCOMS php adalah salah satu bahasa pemograman yang

berjalan dalam sebuah web server dan berfungsi sebagai pengolah data pada

sebuah server. Dengan menggunakan program PHP, sebuah website akan lebih

interaktif dan dinamis. PHP adalah sebuah bahasa program yang berbasis on the

fly creation, yang mengerjakan perintahnya ketika ada permintaan PHP

melakukan intrepretasi/peterjemahan skripnya pada waktu berada di server dan

yang akan diberikan kepada peminta adalah sebuah HTML murni, tanpa terdapat

skrip PHP satupun. Hal ini berbeda dengan skrip-skrip lain yang bekerja pada

client seperti java script atau Vbscript yang mengintrepretasikan skripnya pada

browser. PHP merupakan bahasa yang hanya dapat berjalan pada server yang

hasilnya dapat ditampilkan pada client, interpreter PHP dalam mengeksekusi

kode PHP pada sisi server (disebut Server-side) berbeda dengan mesin maya java

yang mengeksekusi program pada sisi client (client side ) (Solichin, A. 2016)

H. MySQL

MySQL adalah sebuah database yang didukung oleh PHP untuk

mendapatkan koneksi dan Query pada database tersebut. PHP memang

mendukung banyak database tetapi kita mengambil yang umum yaitu MySQL

dapat menyimpan semua data website seperti berita, artikel, counter dan

sebagainya dengan mudah dan terstruktur dan dapat membuka kembali dengan

mudah dan cepat.


15

Berikut merupakan beberapa fitur atau karakteristik dari MySQL yaitu :

1. Fungsi-fungsi SQL diimplementasikan kedalam class library, dan cepat dalam

melakukan Query dan biasanya tidak ada alokasi memori setelah inisialisasi

query.

2. Hak istimewa yang sangat fleksibel pada sistem password yang sangat aman

karena semua jalur password di enkripsi ketika melakukan koneksi keserver.

3. Dapat melakukan penyempurnaan pada line database pada query yang sama.

4. Mendukung ODBC(Open Database Conectivity) untuk win 32 Windows.

5. Mampu menangani database hingga 50.000.000 record dan 60.000 tabel.

6. Semua kolom mempunyai nilai default.

7. Ditulis dalam bahasa C dan C++ dan telah diuji oleh berbagai compiler. Tidak

ada kebocoran memori dan telah teruji dengan pendeteksian komersial

(Solichin, 2016).

I. XAMPP

Xampp merupakan paket web server berbasis open source yang dapat

dipasang pada beberapa sistem operasi yang ada (Windows, Linux, dan Mac

OS) (Riyanto dan Slamet, 2014). Menurut Kurniawan (2009), XAMPP

merupakan tool yang menyediakan paket perangkat lunak ke dalam satu buah

paket. Dengan menginstal XAMPP maka tidak perlu lagi melakukan instalasi

dan konfigurasi web server apache, PHP, dan MySQL secara manual. XAMPP

akan menginstalasi dan mengkonfigurasikan secara otomatis.


16

J. Confusion Matrix

Metode ini menggunakan tabel matriks seperti pada tabel dibawah, dimana

jika data set hanya terdiri dari dua kelas, kelas yang satu dianggap sebagai positif

dan yang lainnya negatif (Baharuddin, 2019).

Tabel 2.1 Confusion Matrix

Klasifikasi Data Diklasifikasikan Sebagai


Benar + (0) - (1)
+ (0) True Positive False Negative
-(1) False Positive True Negative
Dimana:
True Positive (TP) : Merupakan data positif yang diprediksi benar
True Negative (TN) : Merupakan data negatif yang diprediksi benar.
False Postive (FP) : Merupakan data negatif namun diprediksi sebagai data
positif.
False Negative (FN) : Merupakan data positif namun diprediksi sebagai data
negative.

K. Accuracy

Accuracy adalah suatu metode yang digunakan untuk melakukan

perhitungan tingkat akurasi data dengan hasil yang diperoleh pada pengujian.

Proses perhitngan nilai Accuracy disini merupakan rasio prediksi Benar (positif

dan negatif) dengan keseluruhan data. Pada penelitian menggunakan rumus

akurasi yaitu (Baharuddin dan Hasanuddin, 2019).

Accuracy = (TP + TN) / (TP+FP+FN+TN) (2.8)

Dimana :
True Positive (TP) : Merupakan data positif yang diprediksi benar
True Negative (TN) : Merupakan data negatif yang diprediksi benar.
False Postive (FP) : Merupakan data negatif namun diprediksi sebagai data
positif.
False Negative (FN) : Merupakan data positif namun diprediksi sebagai data
negative.
17

L. Perhitungan Presisi

Presisi atau precission Merupakan rasio prediksi benar positif dibandingkan

dengan keseluruhan hasil yang diprediksi positf. Precission digunakan untuk

menjawab pertanyaan “Berapa persen judul skripsi yang hasil prediksi dengan

benar berdasarkan kategori dari keseluruhan mahasiswa yang diprediksi benar”

(Baharuddin, M. M., Azis, H., & Hasanuddin, T. 2019).

Precission : (TP) / (TP + FP) (2.9)

Dimana :

True Positive (TP) : Merupakan data positif yang diprediksi benar.


False Postive (FP) : Merupakan data negatif namun diprediksi sebagai data
positif.
False Negative (FN) : Merupakan data positif namun diprediksi sebagai data
negative.

M. Recall

Recall merupakan rasio prediksi benar positif dibandingkan dengan

keseluruhan data yang benar positif (Baharuddin dan Hasanuddin, 2019).

Recall = (TP) / (TP + FN) (2.10)

True Positive (TP) : Merupakan data positif yang diprediksi benar.


False Negative (FN) : Merupakan data positif namun diprediksi sebagai data
negative.

N. K-Fold Cross Validation

Menurut Pandie (2012) k-fold cross validation merupakan salah satu

metode yang diigunakan untuk mengetahui rata-rata keberhasilan dari suatu

sistem dengan cara melakukan perulangan dengan mengacak atribut masukan

sehingga sistem tersebut teruji untuk beberapa atribut input yang acak. K-Fold

cross validation diawali dengan membagi data sejumlah fold yang diinginkan.
18

Dalam proses cross validation data akan dibagi dalam n bauh partisi dengan

ukuran yang sama D1, D2, D3. Dn selanjutnya proses testing dan training

dilakukan sebanyak n kali. Dalam iterasi ke -I partisi akan menjadi data testing

dan sisanya akan menjadi data training. k=5 atau k=10 dapat digunakan untuk

memperkirakan tingkat kesalahan yang terjadi, sebab data training pada setiap

fold cukup berbeda dengan data training yang asli. Secara keseluruhan, 5 atau 10

fold cross validation sama-sama merekomendasikan dan disepakati bersama.

Menghitung nilai akurasinya dapat dilakukan dengan menggunakan persamaan :


𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑥 100% (2.11)
𝐽𝑢𝑛𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑢𝑗𝑖

Langkah pertama untuk mendapatkan k-optimal dengan pengulangan 10

kali percobaan adalah membagi data training sebanyak 10 bagian atau kelompok

data yang sama seperti gambar 2.2

1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10

Testing Training

Gambar 2.1 Skema 10 Fold Cross Validation

Berdasarkan gambar diatas, pada bagian blok 1 terdiri dari data yang akan

berperan sebagai data testing dan blok lainnya berperan sebagai data training.

Setiap data testing dilakukan prediksi menggunakan algoritma naive bayes . hasil
19

klasifikasi prediksi naive bayes dibandingkan dengan klasifikasi data real dan

dihitung jumlah prediksi yang cocok dengan data asli. Tingkat akurasi yang tinggi

itulah yang terpilih menjadi nilai k terbaik (Banjarsari, 2015).


20

O. Penelitian Terkait

Tabel 2.2 State Of The Art

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
1 Ramadhan Pengembangan penelitian ini menghasilkan Pelitian tersebut Perbedaan dengan
Rakhmat Sani, aplikasi penentuan sebuah aplikasi yang sudah memiliki persamaan penelitian penulis adalah
Junta Zeniarza, tema tugas akhir mampu melakukan proses yang sama tentang algoritma yag digunakan
Ardytha Luthfiarta berdasarkan data klasifikasi data abstrak tugas penetuan tema tugas berbeda dimana penulis
(Tahun 2016) abstrak akhir untuk menentukan akhir berdasrkan data mengguanakan algoritma
menggunakan kelasnya dengan baik. abstrak. Naive Bayes sedangkan
algoritma K-Nearest Aplikasi yang dikembangkan jurnal rujukan
Neighbor untuk penentuan tema tugas menggunkan algoritma
akhir pada perpustakaan dapat K-Nearest Neighbor.
menjadi solusi bagi operator
pada perpustakaan dalam
pendataan.
2 Ahmad Fathan Penerapan text Perhitungan precision, recall, Menggunakan Perbedaan dengan
Hidayatullah dan mining dalam dan f-score diketahui bahwa metode yang sama penelitian penulis adalah
Muhammad Rifqi klasifikasi judul hasil perhitungan ketiganya Naive Bayes penelitian tersebut
Ma’arif (Tahun skripsi memiliki pola yang sama membahas tentang
2016) dengan perhitungan akurasi. pengelompokan judul
Secara keseluruhan, hasil penelitian sedangkan
perolehan f-score dengan jurnal rujukan membahas
algoritma Naive Bayes tentang penerapan text
memberikan hasil yang lebih mining dalam klasifikasi
tinggi dibandingkan dengan judul skripsi.
algoritma SVM. Model
21

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
klasifikasi yang dibangun
dengan Naïve Bayes memiliki
nilai tertinggi ketika
menggunakan fitur trigram,
sementara model klasifikasi
yang dibangun dengan SVM
memiliki nilai tertinggi ketika
menggunakan fitur unigram.
3 Oman Somantri, Metode K-Means Model SVM dan K-Means Pelitian tersebut Perbedaan dengan
Slamet Wiyono, untuk optimalisasi dapat digunakan oleh para memiliki persamaan penelitian penulis adalah
Dairoh (Tahun klasifikasi tema pengambil kebijakan dalam yang sama tentang penelitian ini
2016) tugas akhir menglasifikasikan kategori mengkalasifikasi menggunakan algoritma
mahasiswa tugas akhir sebagai pendukung tugas akhir Naive Bayes sedangkan
menggunakan keputusan dalam penentuan mahasiswa. jurnal rujukan
support vector tema tersebut. K-Means menggunakan algoritma
machine (SVM) menjadi model untuk K-Means dan support
optimalisasi untuk dapat vector machine (SVM).
meningkatkan tingkat akurasi
model SVM dalam
mengklasifikasikan kategori
tema tugas akhir.
4 Utomo Pujianto, Penerapan algoritma Sistem klasifikasi yang Penelitian tersebut Perbedaan dengan
Triyanna naïve bayes classifier dikembangkan telah berhasil memiliki persamaan penelitian penulis adalah
Widiyaningtyas, untuk klasifikasi mengelompokan judul skripsi yang sama tentang penelitian tersebut
Didik Dwi judul skripsi dan dan tugas akhir berdasarkan mengklasifikasi tugas membahas tentang
Prasetya, Bintang tugas akhir Kelompok Bidang Keahlian akhir mahasiswa pengelompokan judul
Romadhon (Tahun berdasarkan (KBK) di Jurusan Teknik berdasarkan penelitian sedangkan
22

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
2017) kelompok bidang Elektro FT UM. Pengujian kelompok bidang jurnal rujukan membahas
keahlian performa penerapan algoritma keahlian. tentang penerapan
Naïve Bayes Classifiers algoritma Naive Bayes
menggunakan teknik K-Fold classifier untuk
Cross Validation, dengan klasifikasi judul skripsi.
jumlah tahap pengujian
sebanyak 10 kali, terhadap
1103 judul skripsi dan tugas
akhir, didapatkan hasil rata-
rata akurasi 94%, presisi 80%,
dan recall 69%.

5 Angga Cahyo Model klasifikasi Hasil penelitian menggunakan Menggunakan Perbedaan dengan
Pradikdo dan abstrak skripsi teknik penelitian action metode yang sama penelitian penulis adalah
Aidina Ristyawan menggunakan text research dengan Naive Bayes. penelitian tersebut untuk
(Tahun 2018) mining untuk menggunakan 9 siklus mengetahui hasil dari
pengkategorian pengujian dan metode text klasifikasi judul
skripsi sesuai bidang mining dengan algoritma penelitian sedangkan
kajian Naive Bayes mendapatkan jurnal rujukan untuk
pengetahuan bahwa siklus ke menghitung nilai
1 merupakan siklus terbaik probabilitas tertinggi dan
dengan akurasi 82,76% dan dapat membantu
juga pada siklus ke 1 jarak memudahkan mahasiswa
antara data testing dan Jumlah untuk mencari referensi.
klasifikasi benar tidak terlalu
jauh.
23

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
6 Muhammad Rafi Algoritma K-Means Hasil pengelompokan Penelitian tersebut Perbedaan dengan
Muttaqin dan untuk dianalisis dengan melihat memiliki penelitian penulis adalah
Meriska Defriani pengelompokan jumlah mata kuliah pada persamaanyang sama penelitian ini
(Tahun 2020) topik skripsi setiap kelompok bidang tentang menggunakan algoritma
mahasiswa keahlian. Jumlah mata kuliah pengelompokan judul Naive Bayes sedangkan
yang paling banyak pada suatu penelitian. jurnal rujukan
kelompok bidang keahlian menggunakan algoritma
menandakan bahwa K-Means.
mahasiswa memiliki
kemampuan lebih baik pada
bidang tersebut sehingga
direkomendasikan topik
skripsi yang sesuai dengan
kelompok bidang keahlian
tersebut. Dengan pengambilan
topik skripsi yang sesuai
dengan bidang keahlian,
harapannya mahasiswa dapat
menyelesaikan skripsinya
dengan lebih baik dan tepat
waktunya.
7 Muhammad Syafril Penerapan case Untuk rekomendasi topik Penelitian tersebut Perbedaan dengan
Hidayat, Eva Yulia based reasoning skripsi terbaik dengan memiliki persamaan penelitian penulis adalah
Puspaningrum, pada sistem menerapkan pemilihan salah yang sama tentang penelitian tersebut
Made Hanindia rekomendasi topik satu dari rekomendasi tiga mengkalsifikasi tugas membahas tentang
Prami Swari skripsi program studi similaritas tertinggi untuk akhir mahasiswa. pengelompokan judul
(Tahun 2020) informatika UPN hasil rekomendasi bidang penelitian sedangkan
24

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
“VETERAN” Jawa keahlian yang jurnal rujukan membahas
Timur direkomendasikan kepada tentang penentuan topik
mahasiswa yang skripsi terbaik dengan
menggunakan perhitungan menerapkan pemilihan
similaritas manhattan distance salah satu dari
dengan hasil akurasi sistem rekomendasi tiga
sebesar 87.5% dan validasi similaritas tertinggi.
menggunakan k-fold cross
validation memiliki akurasi
sebesar 79%. Nilai threshold
similaritas yang digunakan
pada fase revise adalah 50%.
8 Dezty Adhe Implementasi Text Hasil pengelompokkan yang Penelitian tersebut Perbedaan dengan
Chajannah Mining terbentuk dari dokumen memiliki penelitian penulis adalah
Rachman, dkk Pengelompokkan skripsi menggunakan metode persamaanyang sama penelitian ini
(2021) Dokumen Skripsi K-Means Clustering adalah tentang menggunakan algoritma
Menggunakan sebanyak 2 kelompok dengan pengelompokan judul Naive Bayes sedangkan
Metode K-Means anggota cluster ke-1 sebanyak penelitian. jurnal rujukan
Clustering 85 dokumen dan anggota menggunakan algoritma
cluster ke 2 sebanyak 34 K-Means.
dokumen. Dokumen-dokumen
skripsi yang masuk ke cluster
1 didominasi penelitian
dengan metode data mining
terutama tentang klasifikasi,
analisis runtun waktu, analisis
regresi, analisis data uji hidup,
25

No Nama Peneliti Judul Penelitian Hasil Penelitian Persamaan Penelitian Perbedaan Penelitian
analisis spasial dan operasi
riset. Sedangkan dokumen-
dokumen skripsi yang masuk
ke cluster 2 didominasi
penelitian dengan metode
analisis multivariat,
pengendalian mutu dan
matematika
9. Nurdina, dkk Klasifikasi Nasabah Metode Naive Bayes Persamaan pada Perbedaan pada
(2021) Bank Layak Kredit menunjukkan bahwa kinerja penelitian ini dengan penelitian ini dengan
Menggunakan naive bayes berjalan dengan yang dilakukan oleh yang dilakukan oleh
Metode Naive Bayes baik dan layak untuk di peneliti adalah peneliti adalah
implementasikan atau menggunakan permasalahan yang
digunakan untuk membantu metode yang sama diangkat berbeda karena
pihak dalam memilih calon yaitu naïve bayes peneliti mengangkat
nasabah. Pemilihan kriteria di sebagai klasifikasi. permasalahan tentang
dasarkan pada kriteria yang klasifikasi judul skripsi
diberikan oleh bank BRI
Kabupaten Majene
BAB III

METODE PENELITIAN

A. Jenis Penelitian

Penelitian ini menggunakan metode eksperimen, artinya bahwa penelitian

yang dilakukan untuk melakukan uji coba terhadap permasalahan tertentu dengan

penggunaan teori tertentu sehingga didapatkan hasil pengujian yang tepat antara

permasalahan yang diambil dengan teori yang digunakan. Data yang sudah

didapatkan akan diolah sesuai dengan tujuan dari penelitian ini yaitu

pengelompokan dokumen skripsi dengan menggunakan text mining dan naïve

bayes. Penelitian ini dilaksanakan secara bertahap dengan urutan sebagai berikut;

pertama pengambilan/pengumpulan data; kedua, preprocessing diantaranya

adalah proses case folding, tokenisasi, filtering/stopword, dan stemming; ketiga,

menentukan atribut kata; keempat, klasifikasi terdiri dari training data dan

pengujian terhadap data Testing menggunakan naïve bayes.

Pengumpulan Data

Preprocessing

Pembobotan

Training Data

Data Testing

Klasifikasi Naïve Bayes

Gambar 3.1 Model Pengembangan Eksperim

26
27

B. Metode Pengembangan Sistem

Dalam menunjang penyusunan penelitian ini, maka peneliti menggunakan

metode pengembangan perangkat lunak dan pengumpulan data-data yang

dibutuhkan. Metode yang digunakan pada pengembangan perangkat lunak

perancangan sistem informasi ujian berbasis web menggunakan model waterfall,

alasan menggunakan metode waterfall adalah Karena Metode ini tahapan dan juga

urutan dari metode yang dilakukan berurutan dan berkelanjutan, seperti layaknya

sebuah air terjun. Tahapan - tahapan model waterfall (Sukamto & Shalahuddin,

2013).

Gambar 3.2 Metode Waterfall

1. Defenisi Kebutuhan Perangkat Lunak

Berdasarkan wawancara yang telah dilakukan pada pihak prodi dan

perpustakaan, dapat diketahui bahwa data berupa judul skipsi yang ada, belum

dikelompokkan berdasarkann tema penelitinnya. Maka disimpulkan bahwa perlu

adanya sistem pengkategorian pada judul skripsi berdasarkan tema penelitiannya.

Diharapkan dengan adanya klasifikasi judul, dapat memudahkan mahasiswa

dalam mencari referensi judul skripsi atau tugas akhir berdasarkan tema yang
28

diinginkan. Pengembangan ini berfokus pada penerapan metode naïve bayes

untuk mengelompokkan judul skripsi/tugas akhir pada prodi informatika. Judul

akan dikelompokkan kedalam 3 kategori berdasarkan tema penelitian atau

konsentrasi jurusan yang dipilih. Dalam tahapan data mining ysng akan

dilakukan, dibutuhkan data training untuk pembentukan klasifikasi. Data training

diambil dari data skripsi/ tugas akhir milik jurusan prodi informatika terdahulu.

Jumlah data training tiap kelas/kategori adalah sekitar 50 judul. Pelabelan judul

yang dijadikan data training ditentukan berdasarkan deskripsi tema penelitian atau

atribut kata yang mencirikan kategori tersebut. Penentuan atribut kata dilakukan

dengan wawancara dan divalidasi oleh Kaprodi Informatika.

2. Desain Sistem dan perangkat Lunak

Desain sistem pada penelitian ini, terdiri dari pembuatan flowchart (alur

proses), data flow diagram (DFD). Tahapan judul skripsi pada sistem

digambarkan pada gambar 3.4 tahap training judul skripsi dikelompokkan

kedalam 3 kategori yang telah ditentukan, kemudian dianalisis guna membentuk

aturan klasifikasi. Pada tahap klasifikasi, sebuah dokumen baru yang belum

dikenali dikelompokkan kedalam kategori tertentu menggunakan metode naïve

bayes. DFD dari sistem klasifikasi judul skiripsi ditampilkan pada gambar 3.5,

3,7 dan 3.8

3. Implementasi

Pada tahap ini, dilakukan pembangunan sistem berdasarkan defenisi

kebutuhan dan rancangan sistem. Sistem ini dibangun dengan berbasis web,

menggunakan bahasa pemrograman PHP, pada isi tampilan menggunakan HTML


29

dan CSS. Pada sisi penyimpanan menggunakan MySQL. Sistem yang dibangun

kemudian diuji menggunakan akurasi.

4. Integrasi dan Pengujian Sistem

Pada tahap ini, satuan unit program diintegrasikan, kemudian diuji sebagai

satu sistem yang utuh. Pengujian bertujuan untuk memastikan bahwa sistem telah

memenuhi kebutuhan dan melihat kinerja dari penerapan algoritma klasifikasi.

Teknik pengujian ini dipilih untuk mengukur performa tingkat keakuratan dari

penerapan naïve bayes teknik pengujian K-Fold Cross Validation pada pengujian

K-Fold Cross Validation data training dibagi kedalam lipatan sebanyak k secara

acak tanpa penggantian, dimana lipatan dengan jumlah k-1 digunakan sebagai

model training adalah Apakah dapat mengatasi permasalahan tentang klasifikasi

judul skripsi sedangkan 1 lipatan yang tersisa digunakan untuk pengujian.

Prosedur ini diulang sebanyak k sehingga nantinya akan dapat nodel dan

perhitungan performa sebanyak k (Raschka, 2015). Tahapan pengujian K-Fold

Cross dilakukan sebanyak 10 kali pengujian.

5. Penggunaan dan Pemeliharaan

Pada tahap ini, sistem yang dibuat telah diimplementasikan atau

dioperasikan nyata oleh pengguna. Pemeliharaan sistem dilakukan jika ditemui

error yang belum ditemui pada tahap pengujian sistem sebelumnya.

C. Tahapan Penelitian

Adapun tahapan penelitian yang diperlukan sebagai berikut:

1. Pengambilan data

Pengambilan data dilakukan dengan meminta dokumen judul skripsi


30

kepada pihak Fakultas khususnya program studi Informatika Unsulbar. Data

penting yang dimaksud berupa file judul skripsi yang nantinya akan dijadikan

sebagai data uji coba terhadap keberhasilan sistem mengelompokan dokumen

skripsi yang ada. Data skripsi yang digunakan dalam penelitian ini mulai

angkatan 2009-2018.

2. Preprocessing

Preprocessing bertujuan untuk menyiapkan data agar mudah dianalisis.

Preprocessing terbagi menjadi beberapa proses yang terdiri dari case folding,

tokenizing, dan filtering. Case folding mengubah semua karakter huruf teks

menjadi huruf kecil. Karakter yang diterima hanya ‘a’ hingga ‘z’. Tokenizing

adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.

Filtering adalah proses yang dilakukan dengan mengambil kata-kata penting dari

hasil token dan menghapus stop words. Stop words adalah kata-kata yang tidak

deskriptif sehingga dapat dibuang atau dihilangkan dan tidak berpengaruh ke

dalam proses. Dalam bahasa Indonesia, contoh stop words seperti “yang”, “dan”,

“dari”, “di”, “seperti” dan lainnya.

Tahap ini merupakan tahap awal pengolahan data. Data yang digunakan

merupakan file judul skripsi, maka tahap ini sangat dibutuhkan untuk proses

pengolahan data selanjutnya. Seperti yang telah dijelaskan dibab 2, pada tahapan

preprocessing ada beberapa sub prosess yang akan dilakukan yaitu case folding,

tokenisasi, filtering/stopword dan stemming. Dimana pada tahap ini judul skripsi

ini akan diproses menggunakan text mining yaitu preprocessing.


31

Mulai

Judul Skripsi

Tokenisasi

Case Folding

Filtering/Stopword

Stemming

Kumpulan Kata Dasar

Selesai

Gambar 3.3 Alur Proses Preprocessing

a. Tokenisasi

Tahap tokenisasi adalah sebuah proses yang dilakukan untuk

menghilangkan tanda baca, angka dan semua karakter selain alphabet. Setelah itu

semua karakter selain alphabet dihilangkan, maka langkah selanjutnya yaitu

melakukan perubahan semua huruf kapital menjadi huruf kecil atau yang biasa

disebut case folding. Selanjutnya yaitu menyimpan setiap kata dari dokumen yang

telah di dapat sebelumnya menjadi kata tunggal (token).


32

b. Case Folding

maka langkah selanjutnya yaitu melakukan perubahan semua huruf kapital

menjadi huruf kecil atau yang biasa disebut case folding

c. Filtering/Stopword

Tahap selanjutnya yaitu filtering/Stopword. Pada tahap ini yaitu

membuang atau menyaring kata-kata yang dapat merepresentasikan isi dari suatu

dokumen dengan mengacu pada kamus stopword yang telah ada untuk

menentukan kata atau term mana yang seharusnya dihilangkan dan tidak

berpengaruh ke dalam proses. Dalam bahasa Indonesia, contoh stop words seperti

“yang”, “dan”, “dari”, “di”, “seperti” dan lainnya.

d. Stemming

Stemming merupakan tahapan proses untuk mengambil suatu kata inti atau

kata dasar dari hasil filtering . pada tahap ini akan dilakukan penghilangan kata

imbuhan awalan dan akhiran sehingga menghasilkan kata dasar dari setiap kata

(token).

3. Pembobotan Kata

Pembobotan adalah proses mengubah kata menjadi bentuk angka atau

vektor. TF adalah frekuensi dari kemunculan term dalam dokumen yang

bersangkutan. Semakin besar jumlah kemunculan suatu term dalam dokumen,

maka akan semakin besar bobotnya atau akan memberikan nilai kesesuaian yang

semakin besar. Sedangkan TF-IDF merupakan metode untuk menghitung nilai TF

dan IDF pada setiap token (kata) disetiap dokumen. Berikut proses pembobotan

TF-IDF yang terdapat pada gambar 3.4 dibawah ini:


33

Mulai

Preprocessing

Hasil Preprocessing

Pembobotan TF

Pembobotan DF

Pembobotan IDF

Pembobotan TF- IDF

Gambar 3.3 Diagram Alur Pembobotan TF-IDF

Penjelasan gambar 3.4 adalah setelah proses hasil preprocessing

didapatkan selanjutnya akan diproses ketahap pembobotan kata atau term.

Pembobotan ini dilakukan untuk mengetahui nilai dari setiap term yang mewakili

isi dokumen. Untuk alur proses dari pembobotan kata ditunjukkan pada gambar

3.4 diatas.

4. Klasifikasi

Proses klasifikasi halaman web menggunakan metode naive bayes

memiliki dua tahap penting yaitu training data dan testing data atau pengujian

terhadap data testing.


34

a. Tahap Training
Pada tahap ini, setiap kata yang telah diketahui nilai bobot TF-IDF nya

akan dijadikan sebagai acuan untuk mencari nilai probabilitas kategori dan

probabilitas masing-masing kata pada setiap term untuk setiap kelas dari data

latih. Pada fase training data, filternya dilatih menggunakan atribut kata yang

dikenal untuk diklasifikasikan ke dalam kategori judul menggunakan metode

naive bayes. Berdasarkan kemunculan masing-masing kata diberikan probabilitas

kapasitasnya untuk menentukan kelas klasifikasinya. Kemudian, menggunakan

koleksi kata filter untuk mengklasifikasikan setiap judul skripsi difase

klasifikasi.

b. Tahap Testing

Setelah melakukan training data yang dilakukan sebelumnya, selanjutnya

adalah melakukan pengujian terhadap model naive bayes dengan menggunakan

data testing atau judul skripsi baru yang telah diketahui kelasnya, ini dilakukan

untuk menguji kebenaran sistem klasifikasi naive bayes. Proses klasifikasi

ditentukan dengan mempelajari jejak atribut yang telah di training sebelumnya.

Tahap ini merupakan tahapan setelah proses training yang telah dilakukan diatas.

Pada tahapan ini dilakukan pengujian dengan cara menggunakan data uji kedalam

model yang telah dibentuk pada tahapan training diatas.

6. Menentukan Atribut Kata

Atribut kata (token) ditentukan berdasrkan dari hasil hitung frekuensi kata

atau kemunculan kata yang benar-benar merepresentasikan isi dari suatu judul

skripsi tersebut. Karena semakin sering kata tersebut muncul, maka dapat
35

dikatakan bahwa kata tersebut mencirikan suatu kelas tertentu. 10 kata yang

paling banyak muncul dan relefan dipilih sebagai atribut kata.

D. Lokasi dan Waktu Penelitian

Penelitian ini dilakukan di Program Studi Informatika Unsulbar, Untuk

melakukan analisis dan mendapatkan data berdasarkan latar belakang masalah

yang telah dipaparkan. Penelitian ini berlangsung dari bulan juli sampai dengan

bulan Agustus 2022. Pengumpulan data diperoleh dari studi literatur serta

wawancara dengan ketua Prodi Informatika Unsulbar.

E. Gambaran Umum Sistem

Gambaran umum ini menjelaskan tahapan yang akan digunakan untuk

memberi gambaran alur dari tiap proses. Berdasarkan permasalahn tersebut maka

diperoleh proses dimana sistem ini diawali dengan memasukkan data latih dengan

kata lain judul skripsi yang sudah diketahui kategori kelasnya yaitu RPL, Sistem

Cerdas, dan Iot. Kemudian diproses menggunakan text mining yaitu tahapan

preprocessing yang sudah dijelaskan sebelumnya. Setelah proses preprocessing

maka dilanjutkan proses selanjuntya menghitung pembobotan kata yang sudah

dijelaskan diatas. Setelah proses pembobotan kata dan sudah diketahui hasilnya

maka akan dilanjutkan pada proses perhitungan bobot probabilitas kemunculan

setiap term pada judul skripsi. menggunakan naïve bayes sehingga menghasilkan

hasil kalsifikasi judul berdasarkan kategori kelasnya. Alur sistem secara umum

dapat dilihat pada gambar 3.5


36

Mulai

Masukkan Data
Latih

Presprocessing

Data Testing

Pembobotan Kata/TF

Klasifikasi NBC

Hasil Klasifikasi

Gambar 3.5 Alur Sistem Secara Umum

F. Perancangan Data Flow Diagram

Data Flow Diagram (DFD) menggambarkan proses apa saja yang akan

berjalan pada sistem klasifikasi ini. Fase ini diawali dengan pembentukan

diagram konteks yang menggambarkan keseluruhan dari suatu sistem. Diagram

konteks dari sistem klasifikasi ini dapat dilihat pada gambar dibawah ini.

1. Context Diagram

Perancangan awal ini menggunakan diagram context yang merupakan

diagram level tertinggi. Pada diagram ini terdapat beberapa komponen yaitu

aktor, proses dan alur data. Aktor pada diagram ini yaitu admin, alur data yaitu

data training, data testing, presprocessing, klasifikasi NBC. Prosesnya yaitu

Hasil klasifikasi pengelompokan judul skripsi berdasarkan kategori. Context

diagram pada sistem ini dapat dilihat pada gambar 3.6


37

Gambar 3.6 Context Diagram

Admin menjadi sumber yang akan mengolah data judul skripsi yang ada

pada sistem ini. Data tersebut berupa judul skripsi yang diperoleh dari prodi

informatika. Admin disini dapat mengolah data judul skripsi melalui beberapa

tahap yaitu penginputan data training, data testing, preprocessing, klasifikasi

NBC dan hasil klasifikasi sehingga akan didapatkan hasil klasifikasi judul

berdasarkan kategorinya. Sistem klasifikasi ini memiliki beberapa proses di

dalamnya yang dapat dilihat pada diagram level 0. Diagram level 0 dapat dilihat

pada gambar 3.7.

Gambar 3.7 Diagram Level 0

Diagram level 0 diatas menggambarkan bahwa dalam sistem klasifikasi ini

terdapat dua proses yaitu proses memproses data training dan proses memproses
38

data testing. Proses preprocessing data terdiri atas judul skripsi dan hasil

klasifikasi. Semua proses ini dapat dilihat pada diagram level 1 yang ditunjukkan

pada gambar 3.8

Gambar 3.8 Diagram Level 1

Diagram level 1 menunjukkan proses klasifikasi judul melalui tahap

preprocessing yaitu judul skripsi yang telah diinput sebelumnya akan diproses

pada tahap preprocessing diantaranya yaitu tokenisasi, case folding,

filtering/stopword dan stemming. Setiap data training dan testing yang melalui

proses preprocessing, hasil pada tahap ini akan diproses lagi pada klasfikasi

judul menggunkan naïve bayes sehingga akan menghasilkan klasifikasi judul

skripsi berdasarkan kategori yaitu RPL, SC, dan IoT.

G. Teknik Pengumpulan Data

Teknik pengumpulan data yang dilakukan dalam penelitian ini adalah

dengan cara mengambil sekumpulan judul skripsi dari situs sintaks informatika

unsulbar berdasarkan kategori kelas yang telah ditentukan yaitu RPL, Sistem

Cerdas, dan Iot. Pengambilan judul skripsi dilakukan secara random/acak

dimana jumlah keseluruhan data yang digunakan sebanyak 250 data judul skripsi

yang terbagi dalam data training sebanyak 150 sedangkan jumlah data testing

sebanyak 100 data untuk di uji validasi kebenaran kelas klasifikasinya sesuai
39

dengan kategorinya.

H. Teknik Analisis Data

Penelitian ini menggunakan analisis data berdasarkan algoritma naive

bayes dimana algoritma ini dapat melakukan pekerjaan dengan efisien. Jika input

dianggap seperangkat atribut, seperti kata-kata, kita bisa menghitung probabilitas

apakah judul skripsi milik kelas tertentu atau tidak. Proses ini terdiri dari dua fase

yaitu fase training dan fase klasifikasi. Pada fase training, filternya akan dilatih

menggunakan kumpulan kata yang dikenal untuk diklasifikasikan berdasarkan

kategori kelasnya. Dari kemunculan term/kata untuk menghitung nilai

probabilitas masing-masing kelas berdasarkan klasifikasinya. Analisis data adalah

proses inspeksi, pembersihan dan pemodelan data dengan tujuan menemukan

informasi yang berguna, menginformasikan kesimpulan dan mendukung

pengambilan keputusan. Hal inilah yang digunakan penulis untuk mengumpulkan

data-data judul skripsi Teknik Informatika Unsulbar, data yang di dapatkan

kemudian di olah sebelum dimasukkan kedalam program untuk melihat apakah

data ini sudah bisa digunakan atau belum.

I. Teknik Pengujian

Pengujian dilakukan untuk mengetahui apakah penggunaan algoritma

Naive Bayes berhasil dalam mengklasifikasikan judul skripsi berdasarkan

kategori kelas yaitu RPL, Sistem Cerdas, dan Iot. Pengujian dilakukan dengan

menggunakan jumlah data training sebanyak 150 data yang diambil dari situs

sintaks Informatika Unsulbar berbasis web. Tahapan selanjutnya dilakukan

pengujian terhadap model klasifikasi naive bayes, dengan menginput data testing
40

sebanyak 100 judul skripsi berdasarkan 3 kelas klasifikasi yaitu RPL, Sistem

Cerdas dan Iot. Dimana pada proses testing ini akan menampilkan hasil validasi

klasifikasi model naive bayes apakah sesuai dengan kelasnya atau tidak. Proses

terakhir yaitu menghitung nilai akurasi dari data testing.


BAB IV

HASIL DAN PEMBAHASAN

A. Hasil

1. Pengolahan Data

Penelitian ini menggunakan data judul skrpsi prodi informatika fakultas

teknik universitas sulawesi barat mulai dari angkatan 2009-2018 yang diambil

dari situs resmi informatika yaitu sintaks informatika untuk melakukan klasifikasi

atau pengelompokan judul skripsi berdasarkan kategori kelasnya yaitu RPL,

Sistem Cerdas dan Iot Dimana situs ini dijadikan sebagai situs bagi mahasiswa

tingkat akhir yang akan mengajukan judul skripsi sebagai tugas akhir. Data yang

digunakan dalam penelitian ini sebanyak 250 judul yang dibagi kedalam data

training sebanyak 150 judul sedangkan untuk data testing sebanyak 100 judul.

Sebelum data judul skripsi diolah menggunakan algoritma naïve bayes, data akan

diolah terlebih dahulu kedalam text mining yaitu preprocessing yang sudah

dibahas dibab sebelumnya. Tabel dibawah ini berisikan dataset yang digunakan

dan telah diberi kelas kategori atau pelabelan manual, untuk melihat jumlah

keseluruhan data dapat dilihat pada lampiran.

Tabel 4.1 Contoh Data Training

No. Judul Kategori


1 Sistem Informasi Pengolahan Data Simpan Pinjam RPL
Koperasi Pegawai Republik Indonesia Karya Dharma
Kabupaten Majene
2 Implementasi Elimination And Choice Translation Reality Sistem Cerdas
(Electre) Untuk Menentukan Calon Pembimbing Tugas
Akhir Mahasiswa
3 Sistem Otomasi Pada Smart Home Berbasis Internet Of Iot
Things (Iot)

41
42

2. Text Preprocessing

Preproses (Preprocessing) atau tahapan preprocessing merupakan tahapan

yang penting dalam melakukan analisa klasifikasi, bertujuan untuk

membersihkan data-data dari unsur-unsur yang tidak dibutuhkan berguna untuk

mempermudah dalam proses klasifikasi.

a. Tokenisasi

Proses memisahkan teks menjadi kata, dikenal sebagai token yang

bertujuan untuk proses memisahkan atau memecah teks atau kalimat menjadi

sebuah kumpulan kata agar mudah dalam melakukan pembobotan tiap kata

nantinya.

Hasil tokenisasi untuk data training judul skripsi dapat dilihat pada tabel 4.3

Tabel 4.3 Hasil Tokenisasi Judul skirpsi

No. Judul Hasil Case Folding Hasil Tokenisasi Kategori


1 Sistem Informasi sistem informasi sistem
Pengolahan Data pengolahan data informasi
Simpan Pinjam simpan pinjam pengolahan
Koperasi Pegawai koperasi pegawai data
Republik Indonesia republik indonesia simpan
Karya Dharma karya dharma pinjam
Kabupaten Majene kabupaten majene koperasi
pegawai RPL
republik
indonesia
karya
dharma
kabupaten
majene
2 Implementasi implementasi implementasi Sistem
Elimination And elimination and elimination Cerdas
Choice Translation choice translation and
43

No. Judul Hasil Case Folding Hasil Tokenisasi Kategori


Reality (Electre)reality (electre) choice
Untuk Menentukan untuk menentukan reality
Calon Pembimbing calon pembimbing electre
Tugas Akhir tugas akhir untuk
Mahasiswa mahasiswa menentukan
calon
pembimbing
tugas
akhir
mahasiswa
3 Sistem Otomasi sistem otomasi pada sistem
Pada Smart Home smart home otomasi
Berbasis Internet Of berbasis internet of pada
Things (Iot) things (Iot) smart
home Iot
berbasis
intermet
of
things
Iot

b. Case Folding

Proses case folding adalah tahapan penyeragaman bentuk huruf dengan

mengubah semua huruf yang ada menjadi huruf kecil. Tabel 4.2 adalah hasil data

yang telah dilakukan proses case folding:

Tabel 4.2 Hasil Case Folding Judul skirpsi

No. Judul Hasil Case Folding Kategori


1 Sistem Informasi Pengolahan sistem informasi pengolahan RPL
Data Simpan Pinjam Koperasi data simpan pinjam koperasi
Pegawai Republik Indonesia pegawai republik indonesia
Karya Dharma Kabupaten karya dharma kabupaten
Majene majene
2 Implementasi Elimination And implementasi elimination and Sistem
Choice Translation Reality choice translation reality Cerdas
(Electre) Untuk Menentukan (electre) untuk menentukan
44

Calon Pembimbing Tugas calon pembimbing tugas akhir


Akhir Mahasiswa mahasiswa
3 Sistem Otomasi Pada Smart sistem otomasi pada smart Iot
Home Berbasis Internet Of home berbasis internet of
Things (Iot) things (Iot)

c. Filtering/Stopword

Tahap ini membuang atau menyaring kata-kata yang dapat

merepresentasikan isi dari suatu dokumen dengan mengacu pada kamus stopword

yang telah ada untuk kata atau term mana yang seharusnya di hilangkan. Seperti

yang telah dijelaskan dibab sebelumnya. Tabel 4.4 adalah hasil data yang telah

dilakukan proses filtering/Stopword

Tabel 4.4 Hasil Filtering/Stopword data judul Skripsi

No. Judul Hasil Tokenisasi Hasil Filtering Kategori


1 Sistem Informasi Sistem sistem
Pengolahan Data Informasi informasi
Simpan Pinjam Pengolahan pengolahan
Koperasi Pegawai Data data
Republik Indonesia Simpan simpan
Karya Dharma Pinjam pinjam
Kabupaten Majene Koperasi koperasi
Pegawai pegawai RPL
Republik republik
indonesia indonesia
Karya karya
Dharma dharma
kabupaten kabupaten
Majene
2 Implementasi implementasi implementasi
Elimination And elimination elimination
Choice Translation And and
Reality (Electre) Choice choice
Untuk Menentukan Reality reality Sistem Cerdas
Calon Pembimbing Electre electre
Tugas Akhir Untuk
Mahasiswa Menentukan menentukan
45

No. Judul Hasil Tokenisasi Hasil Filtering Kategori


Calon calon
pembimbing pembimbing
Tugas tugas
Akhir akhir
Mahasiswa mahasiswa
3 Sistem Otomasi Sistem sistem
Pada Smart Home Otomasi otomasi
Berbasis Internet Of Pada
Things (Iot) Smart smart
Home home Iot
Berbasis berbasis
Intermet intermet
Of of
Things things
Iot Iot

d. Stemming

Stemming merupakan tahapan proses untuk mengambil suatu kata inti atau

kata dasar dari hasil filtering . pada tahap ini akan dilakukan penghilangan kata

imbuhan awalan dan akhiran sehingga menghasilkan kata dasar dari setiap kata

(token). Tabel 4.5 adalah hasil data yang telah dilakukan proses Stemming.

Tabel 4.5 Hasil Stemming data judul Skripsi

No. Judul Hasil Filtering Hasil Stemming Kategori


1 Sistem Informasi Sistem sistem
Pengolahan Data Informasi informasi
Simpan Pinjam Pengolahan olah
Koperasi Pegawai Data data
Republik Simpan Simpan
Indonesia Karya Pinjam Pinjam
Dharma Koperasi Koperasi
Kabupaten RPL
Pegawai Pegawai
Majene
Republik Republik
Indonesia Indonesia
Karya Karya
Dharma Dharma
kabupaten Kabupaten
46

No. Judul Hasil Filtering Hasil Stemming Kategori

2 Implementasi implementasi implementasi


Elimination And elimination elimination
Choice And and
Translation Choice choice
Reality (Electre) Reality reality
Untuk Electre electre Sistem
Menentukan Cerdas
Calon menentukan tentu
Pembimbing Calon calon
Tugas Akhir pembimbing bimbing
Mahasiswa
Tugas tugas
Akhir akhir
mahasiswa
3 Sistem Otomasi Sistem sistem
Pada Smart Home Otomasi otomasi
Berbasis Internet
Of Things (Iot) Smart smart Iot
Home home
Berbasis basis
Intermet intermet
Of of
Things things
Iot

3. Menentukan Atribut Kata

Target kelas klasifikasi yang dipilih adalah RPL, Sistem Cerdas dan Iot.

Selanjutnya dilakukan penentuan atribut kata (Token). Atribut kata ditentukan

berdasrkan hasil hitung frekunsi kata atau kemunculan kata yang benar-benar

merepresentasikan isi dari suatu judul skripsi tersebut. Karena semakin sering kata

tersebut muncul maka dapat dikatakan bahwa kata tersebut mencirikan suatu kelas

tertentu. 10 kata yang paling banyak muncul akan dipilih sebagai atribut kata.

Atribut kata yang dipilih dapat dilihat pada tabel 4.6 berikut.
47

Tabel 4.6 Atribut Kata

RPL SC Iot

Sistem Implementasi Otomatis

Perancangan Algoritma Iot

Informasi Citra Deteksi

Bangun Diagnosa Microcontroller

Web Site Pakar Arduino

Aplikasi Mining Monitoring

Perangkat Metode Smart

Lunak Klasifikasi Alat

Rancang Prediksi Suhu

Web Perbandingan Kontrol

Sumber : Kaprodi Informatika Unsulbar, 2022

4. Tahap Pembobotan (TF-IDF)

Pembobotan adalah proses mengubah kata menjadi bentuk angka. Dan TF

adalah frekuensi dari kemunculan term dalam dokumen yang bersangkutan.

Semakin besar jumlah atau nilai bobot pada kemunculan suatu term dalam

dokumen, maka akan semakin besar bobotnya atau akan memberikan nilai

kesesuaian yang semakin besar. Sedangkan TF-IDF merupakan metode untuk

menghitung nilai TF dan IDF pada setiap token (kata) di setiap dokumen.

Berdasarkan kemunculan masing-masing kata diberikan probabilitas kapasitasnya

untuk menentukan kelas klasifikasinya.


48

1. Langkah pertama yang dilakukan menghitung TF dengan cara menghitung

bobot tiap term dalam teks. Dengan memberikan bobot nilai 1 dan 0.

Tabel 4.7 Pembobotan TF

TF
Kata (Term)
Data 1 Data 2 Data 3
Sistem 1 1 0
Informasi 1 0 0
Olah 1 0 0
Data 1 0 0
Simpan 1 0 0
Pinjam 1 0 0
Koperasi 1 0 0
pegawai 1 0 0
republik 1 0 0
indonesia 1 0 0
karya 1 0 0
dharma 1 0 0
kabupaten 1 0 0
otomasi 0 1 0
smart 0 1 0
home 0 1 0
bas 0 1 0
internet 0 1 0
of 0 1 0
things 0 1 0
implementasi 0 0 1
elimination 0 0 1
and 0 0 1
choice 0 0 1
translation 0 0 1
reality 0 0 1
electre 0 0 1
tentu 0 0 1
calon 0 0 1
bimbing 0 0 1
tugas 0 0 1
akhir 0 0 1
49

2. Langkah kedua menghitung DF dengan cara menjumlahkan bobot nilai term

dalam dokumen.

Tabel 4.8 Hasil Pembobotan DF

TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF
sistem 1 1 0 2
informasi 1 0 0 1
olah 1 0 0 1
data 1 0 0 1
simpan 1 0 0 1
pinjam 1 0 0 1
koperasi 1 0 0 1
pegawai 1 0 0 1
republik 1 0 0 1
indonesia 1 0 0 1
karya 1 0 0 1
dharma 1 0 0 1
kabupaten 1 0 0 1
otomasi 0 1 0 1
smart 0 1 0 1
home 0 1 0 1
bas 0 1 0 1
internet 0 1 0 1
of 0 1 0 1
things 0 1 0 1
implementasi 0 0 1 1
elimination 0 0 1 1
And 0 0 1 1
choice 0 0 1 1
translation 0 0 1 1
reality 0 0 1 1
electre 0 0 1 1
tentu 0 0 1 1
calon 0 0 1 1
bimbing 0 0 1 1
tugas 0 0 1 1
akhir 0 0 1 1
50

3. Langkah ketiga menghitung IDF dengan menggunakan rumus 2.1 pada bab 2

Term (sistem)

IDF = log 3⁄2 = log 1.5 = 0,176

Term (informasi)

IDF= log 3⁄1 = log 3 = 0,477

Term (olah)

IDF = log 3⁄1 = log 3 = 0,477

Term (data)

IDF = log 3⁄1 = log 3 = 0,477, dan seterusnya sampai pada term ke32

Tabel 4.9 Hasil Pembobotan IDF

TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF log 𝐷⁄𝐷𝐹
sistem 1 1 0 2 0,176
informasi 1 0 0 1 0,477
olah 1 0 0 1 0,477
data 1 0 0 1 0,477
simpan 1 0 0 1 0,477
pinjam 1 0 0 1 0,477
koperasi 1 0 0 1 0,477
pegawai 1 0 0 1 0,477
republik 1 0 0 1 0,477
indonesia 1 0 0 1 0,477
karya 1 0 0 1 0,477
dharma 1 0 0 1 0,477
kabupaten 1 0 0 1 0,477
otomasi 0 1 0 1 0,477
smart 0 1 0 1 0,477
home 0 1 0 1 0,477
bas 0 1 0 1 0,477
51

TF IDF
Kata (Term)
Data 1 Data 2 Data 3 DF log 𝐷⁄𝐷𝐹
internet 0 1 0 1 0,477
of 0 1 0 1 0,477
things 0 1 0 1 0,477
implementasi 0 0 1 1 0,477
elimination 0 0 1 1 0,477
and 0 0 1 1 0,477
choice 0 0 1 1 0,477
translation 0 0 1 1 0,477
reality 0 0 1 1 0,477
electre 0 0 1 1 0,477
tentu 0 0 1 1 0,477
calon 0 0 1 1 0,477
bimbing 0 0 1 1 0,477
tugas 0 0 1 1 0,477
akhir 0 0 1 1 0,477

4. Langkah keempat menghitung bobot TF-IDF. Pada tabel 4.9 adalah hasil

pembobotan berdasarkan data judul skripsi di tabel sebelumya. Bobot akhir

suata term adalah mengalikan keduanya yaitu TF x IDF

Tabel 4.10 Hasil Pembobotan TF-IDF

TF IDF
Kata (Term) Data Data Data DF log 𝐷⁄𝐷𝐹 Data 1 Data 2 Data 3
1 2 3
sistem 1 1 0 2 0,176 0,176 0,176 0
informasi 1 0 0 1 0,477 0,477 0 0
olah 1 0 0 1 0,477 0,477 0 0
data 1 0 0 1 0,477 0,477 0 0
simpan 1 0 0 1 0,477 0,477 0 0
pinjam 1 0 0 1 0,477 0,477 0 0
koperasi 1 0 0 1 0,477 0,477 0 0
pegawai 1 0 0 1 0,477 0,477 0 0
republik 1 0 0 1 0,477 0,477 0 0
indonesia 1 0 0 1 0,477 0,477 0 0
karya 1 0 0 1 0,477 0,477 0 0
dharma 1 0 0 1 0,477 0,477 0 0
kabupaten 1 0 0 1 0,477 0,477 0 0
otomasi 0 1 0 1 0,477 0 0,477 0
smart 0 1 0 1 0,477 0 0,477 0
52

TF IDF
Kata (Term) Data Data Data DF log 𝐷⁄𝐷𝐹 Data 1 Data 2 Data 3
1 2 3
home 0 1 0 1 0,477 0 0,477 0
bas 0 1 0 1 0,477 0 0,477 0
internet 0 1 0 1 0,477 0 0,477 0
of 0 1 0 1 0,477 0 0,477 0
things 0 1 0 1 0,477 0 0,477 0
implementasi 0 0 1 1 0,477 0 0 0,477
elimination 0 0 1 1 0,477 0 0 0,477
and 0 0 1 1 0,477 0 0 0,477
choice 0 0 1 1 0,477 0 0 0,477
translation 0 0 1 1 0,477 0 0 0,477
reality 0 0 1 1 0,477 0 0 0,477
electre 0 0 1 1 0,477 0 0 0,477
tentu 0 0 1 1 0,477 0 0 0,477
calon 0 0 1 1 0,477 0 0 0,477
bimbing 0 0 1 1 0,477 0 0 0,477
tugas 0 0 1 1 0,477 0 0 0,477
akhir 0 0 1 1 0,477 0 0 0,477
Berdasarkan hasil perhitungan bobot kata yang diperoleh dari proses

perhitungan kemunculan kata dapat diperoleh bahwa nilai bobot kata yang

memiliki nilai bobot tertinggi maka kata tersebut mencerminkan kategori

tersebut.

5. Perhitungan Menggunakan Naïve Bayes Classifier

Proses klasifikasi Naive Bayes ini, seluruh dataset dibagi menjadi

beberapa tahap data latih dan data uji. Berikut adalah penjelasan langkah-

langkahnya beserta contoh perhitungan:

a. Pertama hitung probabilitas setiap kategori (prioritas). pada penelitian ini

yang menjadi kategori ada tiga yaitu kategori RPL, Sistem Cerdas, dan Iot.
Rpl
D( Sc )
Iot
P (Rpl/Sc/Iot) =
|C|
= 1⁄3 = 0,333
d(Rpl)
P(Rpl) =
|C|
53

= 1⁄3 = 0,333
d(Sc)
P(Sc) = |C|

= 1⁄3 = 0,333
d( Iot)
P(Iot) = |C|
Keterangan :

𝑝 (Rpl/Sc/Iot) = Peluang kemunculan dokumen dari kelas rpl, sc, dan Iot
ⅆ(Rpl/Sc/Iot) = Jumlah seluruh dokumen pada setiap kelas
|𝑐| = Jumlah keselurahan data yang dilatih yaitu Rpl, Sc, dan Iot

b. Setelah melakukan perhitungan probabilitas setiap kategori kemudian selanjutnya

menghitung probabilitas setiap term dari semua dokumen. Banyak term

tergantung pada hasil preproses data. Berikut adalah merupakan perhitungan

probabilitas pada setiap term:

( nk|Rpl|Sc|Iot )+1
P(w |Rpl|Sc|Iot ) =
( n,|Rpl|Sc| Iot ) +|Kosakata|

Keterangan :

𝑝 (𝑤𝑘|Rpl|Sc|Iot) = Peluang kemunculan kata pada kategori


𝑤𝑘 = Kata yang muncul pada sebuah kategori.
(𝑛𝑘,rpl|sc|Iot) + 1 = Jumlah frekuensi kemunculan kata pada kategori.
𝑛𝑘 = Kemunculan setiap kata pada kategori.
|𝑘𝑜𝑠𝑎𝑘𝑎𝑡𝑎| = Jumlah semua kata dari semua kategori.

Contoh perhitungan bobot data training untuk kelas RPL:


0,176+1 1,176
P( sistem | Rpl ) = = = 0,0345
2+32 34

0,477+1 1,477
P(informasi| Rpl ) = = = 0,043
2+32 34

0,477 +1 1,477
P(olah| Rpl ) = = = 0,043
2+32 34

0,477+1 1,477
P(data | Rpl ) = = = 0,043
2+32 34

0,477+1 1,477
P(simpan | Rpl ) = = = 0,043
2+32 34

0,477+1 1,477
P(pinjam | Rpl ) = = = 0,043,
2+32 34
54

0,477+1 1,477
P(koperasi | Rpl ) = = = 0,043,
2+32 34

0,477+1 1,477
P(koperasi | Rpl ) = = = 0,043,
2+32 34

0,477+1 1,477
P(pegawai | Rpl ) = = = 0,043,
2+32 34

0,477+1 1,477
P(republik | Rpl ) = = =0,043,
2+32 34

0,477+1 1,477
P(indonesia | Rpl ) = = =0,043,
2+32 34

0,477+1 1,477
P(karya | Rpl ) = = =0,043,
2+32 34

0,477+1 1,477
P(dharma | Rpl ) = = =0,043,
2+32 34

0,477+1 1,477
P(kabupaten | Rpl ) = = =0,043, dan seterusnya sampai pada term
2+32 34

akhir. Sehingga diperoleh model data training naïve bayes berdasarkan

kategori kelasnya sebagai berikut:

Tabel 4.11 Hasil Model Data Training Naïve Bayes

Kelas
P(𝑋𝑘𝑗 | 𝐶𝑖 ) RPL SC Iot
0,3333 0,3333 0,3333
sistem 0,0345 0,0294 0,0345
informasi 0,0434 0,0294 0,0294
olah 0,0434 0,0294 0,0294
data 0,0434 0,0294 0,0294
simpan 0,0434 0,0294 0,0294
pinjam 0,0434 0,0294 0,0294
koperasi 0,0434 0,0294 0,0294
pegawai 0,0434 0,0294 0,0294
republik 0,0434 0,0294 0,0294
indonesia 0,0434 0,0294 0,0294
karya 0,0434 0,0294 0,0294
dharma 0,0434 0,0294 0,0294
kabupaten 0,0434 0,0294 0,0294
otomasi 0,0294 0,0294 0,0434
smart 0,0294 0,0294 0,0434
home 0,0294 0,0294 0,0434
55

Kelas
P(𝑋𝑘𝑗 | 𝐶𝑖 ) RPL SC Iot
0,3333 0,3333 0,3333
bas 0,0294 0,0294 0,0434
internet 0,0294 0,0294 0,0434
of 0,0294 0,0294 0,0434
things 0,0294 0,0294 0,0434
implementasi 0,0294 0,0434 0,0294
elimination 0,0294 0,0434 0,0294
and 0,0294 0,0434 0,0294
choice 0,0294 0,0434 0,0294
translation 0,0294 0,0434 0,0294
reality 0,0294 0,0434 0,0294
electre 0,0294 0,0434 0,0294
tentu 0,0294 0,0434 0,0294
calon 0,0294 0,0434 0,0294
bimbing 0,0294 0,0434 0,0294
tugas 0,0294 0,0434 0,0294
akhir 0,0294 0,0434 0,0294

Tabel 4.12 Contoh Data testing yang akan diuji

Judul Skripsi Kategori Atribut Kata (Term)


Sistem Informasi Data Medis Ibu dan ? Sistem, informasi
Anak Di Puskesmas Banggae
Impementasi Sistem Pakar Dalam ? Implementasi, sistem
Klasifikasi Kepribadian Menggunakan
Forward Chaining
Penerapan Smart Room Berbasis Internet ? Smart, Internet, Of,
Of Things Pada Program Studi Informatika Things
Universitas Sulawesi Barat
Sumber : Data Uji

Berdasarkan data testing yang akan diuji dengan judul skripsi “Sistem

Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae” dengan status kelas

yang belum diketahui. Tahapan selanjutnya, akan melakukan probabilitas

maisng-masing kata didata uji dengan menggunakan hasil probabilitas term yang

didapat pada data latih. Tabel probabilitas yang sudah terbentuk dengan

menggunakan persamaan (2.7)


56

P(Rpl|Judul) = P(Rpl)x P(sistem |Rpl )x P(informasi |Rpl)x P(data |Rpl)

= 0,333 x 0,0345 x 0,0434 x 0,0434


= 2.1762827070286E-5
P(Sc|Judul) = P(Sc)x P(sistem |Sc)x P(informasi |Sc)x P(data |Sc)
= 0,333 x 0,0294 x 0,0294 x 0,0294
= 8.4809010109234E-6
P(Iot |Judul) = P(Iot)x P(sistem |Iot )x P(informasi |Iot )x P(data |Iot )
=0,333 x 0,0345 x 0,0294 x 0,0294
=9.9743135478635E-6
Dilihat dari nilai peluang paling maksimum, maka kategori judul skripsi

“Sistem Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae”

dikategorikan ke dalam kategori kelas RPL dengan nilai maksimum yang

dihasilkan sebesar 2.1762827070286E-5.

B. Implementasi Sistem

Implementasi sistem adalah penerapan model sistem klasifikasi text mining

untuk mengelompokkan data judul skirpsi berdasarkan kategori kelasnya

menggunakan perhitungan algoritma Naïve Bayes Clasifior.

1. Halaman Login

Gambar 4.1 Halaman Login


57

Tampilan halaman login ini merupakan Langkah awal seorang

Admin/pengguna untuk dapat mengakses atau masuk dalam sistem ini. Pengguna

terlebih dahulu harus memasukkan username dan password yang sudah

disediakan dalam sistem ini.

Gambar 4.2 Username dan Password Salah

Gambar 4.2 diatas menunjukkan Ketika admin memasukkan username

dan password yang tidak sesuai kedalam sistem, maka pengguna ataupun Admin

tidak dapat mengakses atau gagal masuk kedalam sistem akan muncul

pemberitahuan bahwa kombinasi user dan password yang anda masukkan salah,

silahkan coba lagi.

2. Halaman Home

Gambar 4.3 Halaman Home/Beranda


58

Gambar 4.3 menunjukkan setelah admin berhasil masuk kedalam sistem

maka tampilan yang pertama kali muncul adalah menu home. Pada menu ini,

sistem akan menampilkan penjelasan mengenai algoritma naïve bayes serta fitur-

fitur menu yang ada pada sistem ini

3. Halaman Menu Master Data

Halaman ini berfungsi untuk menampung data yang terdapat pada

stopword dengan klasifikasi yang digunakan di antaranya adalah RPL, Sistem

cerdas, dan Iot.

Gambar 4.4 Halaman Stopword

Gambar 4.5 Halaman Klasfikasi

4. Halaman Data Training

Halaman data training ini berfungsi untuk menampilkan semua data judul

skripsi yang digunakan sebagai data training. Pada halaman ini memuat semua

dataset yang berada pada database saat ini. Sistem ini dilengkapi fitur bagi admin
59

dalam mengolah sistem ini diantaranya adalah menambahkan, mengedit, dan

menghapus data yang ada pada menu ini.

Gambar 4.6 Halaman Data Training

5. Halaman Preprocessing untuk Data Traiining dan Data Testing

Gambar 4.7 Halaman Preprocessing Training

Gambar 4.8 Halaman Preprocessing Testing


60

Halaman ini berfungsi untuk mengolah data judul skripsi yang telah di

input kedalam data training, sehingga data ini diolah menggunakan proses text

mining yang dikenal sebagai preprocessing. Tahap preprocessing ini memiliki

beberapa tahap yaitu tokenisasi yang berfungsi membagi data menjadi kata

tunggal yang mewakilinya, case folding berfungsi untuk mengubah data menjadi

huruf kecil, tahap stopword berfungsi untuk menyaring atau menghilangkan kata

yang tidak penting dengan menggunakan kamus dari tala yang telah dibahas bab

sebelumnya sedangkan untuk tahap stemming berfungsi untuk menghilangkan

imbuhan yang terdapat pada data tersebut dan menyisahkan kata dasar dari data

tersebut.

6. Halaman Data Testing

Halaman ini berfungsi untuk menampung data yang dijadikan sebagai data

uji, yang nantinya akan diklasifikasikan berdasarkan kategori kelasnya. Sistem ini

juga dilengkapi fitur bagi admin untuk mengolah data ini diantaranya adalah

menambahkan, mengedit dan menghapus data uji tersebut.

Gambar 4.9 Halaman Data Testing

7. Halaman Klasifikasi NBC

Halaman ini berfungsi untuk melihat nilai akurasi dari data yang sudah

diuji berdasarkan dataset atau data training yang telah diproses sehingga dapat
61

diketahui tingkat keberhasilan dari algoritma naïve bayes apakah dapat

mengelompokan atau mengklasifikasian judul skripsi berdasarkan kelas

kategorinya yaitu RPL, Sistem Cerdas dan Iot.

Gambar 4.10 Halaman Klasifikasi NBC

8. Halaman Hasil Klasifikasi

Halaman ini berfungsi untuk menghitung nilai kemunculan term,

pembobotan term dari hasil stemming dan menghitung nilai probabilitas masing-

masing term sehingga menghasilkan klasifikasi judul skripsi berdasarkan kategori

kelasnya.

Gambar 4.11 Halaman Hasil Klasifikasi


62

9. Halaman Hasil

Gambar 4.12 Halaman Hasil

Halaman ini berfungsi untuk melihat hasil klasifikasi berdasarkan nilai

akurasi dan confusion matriks. Sistem ini akan menampilkan akurasi dari hasil

klasifikasi judul skripsi sehingga dapat diketahui keakuratan dari algoritma yang

digunakan.

C. Hasil Pengujian

1. Pengujian Akurasi

Penelitian ini penulis melakukan pengujian menggunakan data judul

skripsi mahasiswa program studi Informatika Unsulbar yang dipilih secara

random/acak dengan keseluruhan data sebanyak 250 data yang terdiri dari 150

data training dan 100 data testing yang akan dilakukan uji coba untuk mengetahui

hasil akurasi terhadap algoritma klasifikasi yaitu naïve bayes. Data tersebut

digunakan untuk mengelompokan sebuah data baru yang belum diketahui kelas

kategorinya apakah data tersebut masuk dalam kelas RPL, Sistem Cerdas, dan
63

Iot. Jumlah keseluruhan data training dan data testing dapat dilihat pada lampiran

Berdasarkan hasil klasifikasi dari data training dan data testing yang telah

dihitung nilai probabiltas sebelumnya yang telah di testing kedalam program,

sistem menampilkan sebanyak 3 data judul skripsi yang tidak sesuai dengan

kategori kelasnya. Hasil akurasi diketahui dari berapa jumlah data testing sesuai

target kelas yang telah ditentukan dibagi dengan jumlah keseluruhan data testing,

untuk menghitung nilai akurasi dapat menggunakan persamaan matematika 2.8.

sehingga hasil akurasi dari uji coba dapat dilihat pada sebagai berikut:

97
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑥 100 % = 97 %
100

2. Pengujian dengan Confusion Matriks

Berdasarkan hasil pengolahan 150 data training dan 100 data testing

menggunakan naïve bayes menunjukkan bahwa tingkat akurasi yang dihasilkan

sebesar 97 %. Untuk mencari nilai akurasi, precision dan recall dapat digunakan

nilai true positif, false negatif, true negatif, dan false positif. Untuk mengetahui

nilai-nilai tersebut dapat diketahui melalui tabel confusion matriks.

Tabel 4. 13 Model Confusion Matriks untukAlgoritma Naïve bayes

Klasifikasi TP FP TN FN Accuracy Precision Recall


RPL 32 1 66 1 0.98 0.97 0.97
SC 31 1 66 2 0.97 0.969 0.939
Iot 34 1 65 0 0.99 0.971 1
Jumlah 0,98 0,97 0,96
Sumber : Hasil Pengujian Akurasi

Berdasarkan tabel confusion matriks menunjukkan bahwa nilai klasifikasi

pada kelas IoT dan bernilai true positif (TP) adalah sebanyak 32 judul, false positif

(FP) sebanyak 1 judul, true negatif (TN) sebanyak 66 judul, dan false negatif
64

(FN) sebanyak 1 judul, berikutnya untuk nilai klasifikasi pada kelas RPL dan

bernilai true positif sebanyak 31 judul, False Positif sebanyak 1, true negatif

sebanyak 66 judul, dan false negatif sebanyak 2 judul, sedangkan untuk nilai

klasifikasi kelas Sistem Cerdas dan bernilai true positif sebanyak 34 judul, false

positif sebanyak 1 judul, true negatif sebanyak 65 dan false negatif sebanyak 0.

Dalam pengujian ini menggunakan 250 data judul skripsi yang dipilih secara

random/acak yang kemudian dibagi kedalam data training dan data testing.

Dimana sebanyak 150 data training dan sebanyak 100 data yang menjadi data

testing. Untuk mendapatkan nilai masing-masing accuracy, precission dan recall

sebagai berikut:

(TP+TN)
Accuracy = (TP+FP+TN+FN)

( 32+66 )
= (32+1+66+1 )

98
= = 0,98
100

(TP)
Precission=
(TP+FP)

( 32 )
= (32+1 )

32
= = 0,97
33

(TP)
Recall =
(TP+FN)

( 32 )
= (32+1 )

32
= 33 = 0,97

Pengujian akurasi klasifikasi judul skripsi berdasarkan kategori untuk

mengetahui tingkat akurasi klasifikasi secara manual dengan klasifikasi yang


65

dilakukan dengan sistem menggunakan algoritma naïve bayes. Pengujian ini

dilakukan dengan menggunakan confusion matrix yaitu dengan sebuah matrik dari

prediksi yang akan dibandingkan dengan atribut asli dari data inputan. Pengujian

ini dilakukan dengan menggunakan 100 data testing, data testing tersebut akan

dibandingkan hasil klasifikasi yang dilakukan oleh sistem. Hasil pengujian akurasi

klasifikasi judul skripsi berdasarkan kategori dapat dilihat pada tabel 4.13

Berikut ini adalah tabel dari confusion matrix:

Tabel 4.14 Confusion Matrix

Predicted Class
Actual
RPL SC Iot
RPL 32 1 0
SC 1 31 1
Iot 0 0 34
Sumber : Pengujian

Setelah sistem melakukan klasifikasi, lalu hitung nilai accuracy dan error

rate dengan rumus untuk menghitung accuracy dan rumus untuk menghitung

error rate.
32+31+34
Accuracy = 32+0+2+1+33+1+0+0+31 x 100%

97
= 100
x 100%=97 %

1+0+0+0+1+1
Error Rate = 32+0+2+1+31+1+0+0+34 x 100%

3
= x 100%=0,03 % atau 3 %
100

3. Pengujian Terhadap Data Testing

K-fold adalah salah satu metode Cross Validation yang populer dengan

melipat data sebanyak k dan mengulangi (iterasi) eksperimennya sebanyak k


66

juga. Pada pengujian ini data yang akan digunakan adalah 100 judul skripsi

termasuk data uji yang nantinya akan dibagi menjadi 10 bagian atau k=10

sehingga data yang diperoleh adalah 100 data dibagi menjadi 10 lipatan dengan

masing-masing isinya adalah 10 data judul. Selain itu akan ditentukan mana yang

termasuk data training dan mana yang termasuk data testing dengan

perbandingan 1-10, sehingga didapatkan 90 data sebagai data training dan 10

sisanya sebagai data training.

Berdasarkan 10 lipatan yang sudah ditentukan maka akan ada 9 lipatan

dikalikan 10 = 90 data training dan sisanya 1 lipatan dikalikan 10 = 10 data

Testing. Pengujian menggunakan data yang sudah dipartisi akan diulang

sebanyak 10 kali (k=10) dengan posisi data tes berbeda disetiap iterasinya.

Misalkan iterasi pertama data tes pada posisi awal, iterasi kedua data tes di posisi

kedua begitu seterusnya. Hingga iterasi kesepuluh Gambaran iterasi k-fold dapat

dilihat pada Gambar 5.

Pengujian hasil terhadap model klasifikasi naive bayes dilakukan dengan

menggunakan K- Fold Cross validation untuk mengetahui tingkat akurasi dari

metode naïve bayes. Skema pengujian dalam penelitian ini dilakukan dengan

membagi data training dengan ukuran yang berbeda-beda, hal ini dilakukan

untuk melihat bagimana hasil pengujian program terhadap nilai-nilai tersebut.

Penelitian ini pengujian dilakukan sebanyak 10 (sepuluh) kali dengan

membagi jumlah fold pada masing-masing data training dan data testing yang

berbeda, agar dapat mengetahui pengaruh data training terhadap hasil klasifikasi.

Pada tabel hasil pengujian terdapat beberapa field antara lain, Data training dan
67

Data testing yang akan diuji kebenaran kelasnya. data failed yang artinya data

yang gagal memprediksi kebenaran kelasanya dan data testing benar artinya data

sesuai dengan kelas yang telah ditentukan. Berikut adalah urutan pengujian yang

telah dilakukan. Untuk pengujian pertama hingga pengujian terakhir data

training yang digunakan berturut-turut sebanyak 1-10, 11-20, 21-30, 31-40, 41-

50, 51-60, 61-70, 71-80, 81-90, 91-100.

a. Pengujian 1

Pengujian pertama dilakukan menggunakan data training sebanyak 10

judul skripsi. Dimana terdapat 3 kelas katgeori yaitu RPL, SC, dan IOT. Untuk

pengujian fold ke-1 jumlah data Testing sebanyak 10 data. Dari hasil pengujian

yang dilakukan semua data berhasil diklasifikasikan sesuai dengan target

kelasnya. Maksudnya dari 10 data judul yang di proses menggunakan model

klasifikasi Naive Bayes berhasil mengidentifikasi data tersebut ke dalam kelas

yang benar, sesuai dengan target kelas yang telah ditentukan. Hasil data testing

pengujian fold 1 dapat dilihat pada tabel 4.14 berikut.

Tabel 4.15 Pengujian K-Fold Crosss Validation 1-10

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Alat Pendeteksi Suhu Tubuh Berbasis Iot Iot ✔
Mikrokontroler Arduino Uno
2 Perancangan Website Pada Puskesmas RPL RPL ✔
Pambusuang
3 Sistem Informasi Aplikasi Rekam Mudik Pada RPL RPL ✔
Rumah sakit Umum Daerah Kabupaten
Majene
4 Pemetaan Daerah Prioritas Penanganan Sistem Sistem ✔
Stunting Pada Ibu Hamil Menggunakan Cerdas Cerdas
Metode TOPSIS (Studi Kasus:Kabupaten
68

Klasifikasi
No Dokumen Klasifikasi NBC Benar
Majene)
5 Uji Plagiarism Pada Tugas Mahasiswa Sistem Sistem ✔
Menggunakan Algoritma Winnowing Cerdas Cerdas
6 Implementasi Metode Ahp Dan Topsis Pada Sistem Sistem ✔
Sistem Pendukung Keputusan Calon Penerima Cerdas Cerdas
Bedah Rumah (Studi Kasus : Desa Bonde
Utara)
7 Sistem Informasi Data Medis Ibu dan Anak Di RPL RPL ✔
Puskesmas Banggae
8 Sistem Keamanan Rumah Walet berdasarkan Iot Iot ✔
getaran dan Inframerah berbasis Internet Of
Things (IOT)
9 Rancang Bangun Sistem Informasi Monitoring RPL RPL ✔
Absensi Perkuliahan Mahasiswa Via SMS
Gafe
10 Implementasi data mining persediaan obat Sistem Sistem ✔
pada Puskesmas Banggae II menggunakan Cerdas Cerdas
Algoritma Apriori
Data pengujian Fold 1

Tabel 4.16 Confusion Matrix Fold 1

Predicted Class
Actual
RPL SC Iot
RPL 4 1 0
SC 0 3 1
Iot 1 0 2
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.15 diperoleh

hasil testing diantaranya, terdapat 4 judul sesuai dengan target kelas klasifikasi

RPL, 1 judul RPL dikategorikan ke dalam kelas sistem Cerdas, dan 3 judul SC

sesuai dengan target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 2 judul

Iot sesuai dengan target kelas klasifikasi Iot.


69

b. Pengujian 2 K-Fold Cross Validation 11-20

Tabel 4.17 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Analisis Dan Pengajuan Tranmisi Data Dengan RPL Sistem Failed
Modern GSM 20Menggunakan Axence Nettols Cerdas
2 Prototype Monitoring Penyiraman dan Iot Iot ✔
Pemupukan Otomatis Pada Tanaman Bawang
Mandar Berbasis IoT (Internet Of Things)
3 Aplikasi Perpustakaan Di SDN 1 Saleppa RPL RPL ✔
Berbasis Website
4 Rancang Bangun Tempat Sampah Pintar IOT RPL Failed
Pemilah Sampah Organik Dan Anorganik
Berbasis Mikrocontroller Arduino
5 Sistem Kontrol Ph Air Dan Monitoring Nutrisi Iot Iot ✔
Pada Tanaman Hidroponik Dengan Internet Of
Things
6 Implementasi algortima forecasting Sistem Sistem ✔
menggunakan metode triple exponential Cerdas Cerdas
smooting pada persediaan obat studi kasus
apotek anita farma
7 Rancang Bangun Website Hotel Villa Bogor RPL RPL ✔
Kabupaten Majene
8 Prototype Sistem Monitoring Penggunaan Daya Iot Iot ✔
Listrik Dan Pengontrolan Penggunaan Air
Menggunakan Mikrokontroler
9 Sistem Pendukung Keputusan Kelayakan Sistem Sistem ✔
Pendonor Darah Menggunakan Metode Topsis Cerdas Cerdas
Berbasis Web
10 Sistem Otomasi Pada Smart Home Berbasis Iot Iot ✔
Internet Of Things (Iot)
70

Data pengujian Fold 2

Tabel 4.18 Confusion Matrix Fold 2

Predicted Class
Actual
RPL SC Iot
RPL 2 1 0
SC 0 2 1
Iot 1 0 4
Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.16 diperoleh

hasil testing diantaranya, terdapat 2 judul sesuai dengan target kelas klasifikasi

RPL, 1 judul RPL dikategorikan ke dalam kelas sistem Cerdas, dan 2 judul SC

sesuai dengan target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 4 judul

Iot sesuai dengan target kelas klasifikasi Iot, 1 judul Iot dikategirikan kedalam

kelas RPL.

c. Pengujian 3 K-Fold Cross Validation 21-30

Tabel 4.19 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Prototype Alat Penyortir dan Penghitung Telur Iot Iot ✔
Otomatis Berbasis Internet of Things
2 Prototype Alat Stabilisasi Suhu Kandang Ayam Iot Iot ✔
Berbasis Mikrokontroller
3 Aplikasi Pelayanan Berkas Persyaratan Nikah RPL RPL ✔
Di Kua Kecamatan Banggae Timur
4 Perancangan Alat Internet Of Things (Iot) Iot Iot ✔
Untuk Monitoring Serta Mengendalikan Suhu
Dan Kelembapan Pada Budidaya Jamur
5 Pendeteksi Kesegaran Ikan Menggunakan Iot Iot ✔
Sensor Mq-135
6 Penentuan Dosen Teladan Berdasarkan Penilaian Sistem Sistem ✔
Kinerja Menggunakan Metode Simple Additive Cerdas Cerdas
Weighting (Studi Kasus Dosen Unsulbar)

7 Perancangan Perangkat Lunak Metode Pencairan RPL RPL ✔


Data Pelanggang
8 Sistem pengontrolan ketersediaan lahan parkir Iot Iot ✔
berbasis iot
71

Klasifikasi
No Dokumen Klasifikasi NBC Benar
9 Perancangan Sistem Informasi Simpan Deposito RPL RPL ✔
Koperasi Citra Sejahtera Kabupaten Majene
10 Sistem Monitoring dan kontrol cairan infus pasien Iot Iot ✔
berbasis Internet Of Things (IoT)

Data pengujian Fold 3

Tabel 4.20 Confusion Matrix Fold 3

Predicted Class
Actual
RPL SC Iot
RPL 3 0 0
SC 0 1 1
Iot 0 0 6
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.17 diperoleh

hasil testing diantaranya, terdapat 3 judul sesuai dengan target kelas klasifikasi

RPL, dan 1 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 6 judul Iot sesuai dengan target kelas klasifikasi Iot.

d. Pengujian 4 K-Fold Cross Validation 31-40

Tabel 4.21 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Monitoring Suhu Dan Kelembapan Rumah Walet Iot Iot ✔
Berbbasis Lora (Long Range)
2 Perancangan Website Museum Daerah Mandar RPL RPL ✔
Kabupaten Majene
3 Penerapan Algoritma Naive Bayes Dalam Sistem Sistem ✔
Menentukan Kelayakan Nasabah Pada Koperasi Cerdas Cerdas
Simpan Pinjam
4 Penerapan Logika Fuzzy Alat Penyangrai Biji Iot Iot ✔
Kopi Otomatis Menggunakan Arduino Uno
5 Sistem Informasi Pengolahan Data Simpan RPL RPL ✔
Pinjam Koperasi Pegawai Republik Indonesia
Karya Dharma Kabupaten Majene
6 Perancangan sistem Menggunakan Manajemen RPL RPL ✔
72

Klasifikasi
No Dokumen Klasifikasi NBC Benar
Adminitrasi SDN 008 Camba - Camba Kec.
Limboro
7 Implementasi Elimination And Choice Sistem Sistem ✔
Translation Reality (Electre) Untuk Menentukan Cerdas Cerdas
Calon Pembimbing Tugas Akhir Mahasiswa
8 Implementasi Algoritma Levensthein String Studi Sistem Sistem ✔
Kasus Arsip Data Pasien Rumah Sakit Umum Cerdas Cerdas
Daerah Kabupaten Majene
9 Diagnosis Penyakit Stunting Pada Balita Melalui Sistem Sistem ✔
Penerapan Sistem Pakar Menggunakan Metode Cerdas Cerdas
Certainty Factor
10 Perancangan early warning system pada smart Iot Iot ✔
home berbasis internet of things (IOT
Sumber : Hasil Pengujian

Data pengujian Fold 4

Tabel 4.22 Confusion Matrix Fold 4

Predicted Class
Actual
RPL SC Iot
RPL 3 1 0
SC 0 4 0
Iot 0 0 3
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.18 diperoleh

hasil testing diantaranya, terdapat 3 judul sesuai dengan target kelas klasifikasi

RPL, dan 4 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 3 judul Iot sesuai dengan target kelas klasifikasi Iot.

e. Pengujian 5 K-Fold Cross Validation

Tabel 4.23 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Sistem Kontrol Dan Monitoring Pemberi Pakan Ikan Iot Iot ✔
Otomatis Berbasis Iot
2 Prototype Smart Green House Kelompok Tani Di Iot Iot ✔
Mamasa Menggunakan Wemos
73

Klasifikasi
No Dokumen Klasifikasi NBC Benar
3 Sistem Pakar Identifikasi Hama Tanaman Cabai Sistem Sistem ✔
Menggunakan Metode Iterative Dichotomizer Tree Cerdas Cerdas
(Id3)
4 Sistem Pendukung Keputusan Penentuan Sistem Sistem ✔
Masyarakat Miskin Dengan Metode Weighted Cerdas Cerdas
product di Desa Bukit Samang
5 alat pemantau penggunaan daya listrik pada indekos Iot Iot ✔
berbasis IOT
6 Identifikasi Hama Dan Penyakit Pada Tanaman Sistem Sistem ✔
Kacang Tanah Menggunakan Case Based Cerdas Cerdas
Reasoning Dan Algoritma K-Nearest Neighbor
7 Perancangan Aplikasi Propil layanan Kantor Urusan RPL RPL ✔
Agama Kecamatan Campalagian Dengan
Pemdekatan Prototype
8 System Monitoring Suhu Panas Pada Empang Iot Iot ✔
Menggunakan Mikrokontroler Berbasis Internet Of
Things
9 Perancangan Aplikasi Registrasi Pendaftaran KK RPL RPL ✔
dan Tanda Penduduk Dinas Kependudukan dan
Catatan Sipil Kabupaten Polewali Mandar
10 Prototype Food Feeding System Pada Ayam Broiler Iot Iot ✔
Berbasis Internet Of Things
Data pengujian Fold 5

Tabel 4.24 Confusion Matrix Fold 5

Predicted Class
Actual
RPL SC Iot
RPL 2 0 0
SC 0 3 0
Iot 0 0 5
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.19 diperoleh

hasil testing diantaranya, terdapat 2 judul sesuai dengan target kelas klasifikasi

RPL, dan 3 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 5 judul Iot sesuai dengan target kelas klasifikasi Iot.
74

f. Pengujian 6 K-Fold Cross Validation 41-50

Tabel 4.25 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Implementasi Algoritma Genetika untuk Sistem Sistem ✔
Menyelesaikan Course Scheduling Problem Cerdas Cerdas
Menggunakan Random Pair Mutation Gen
2 Aplikasi Penjualan Berbasis Client Server Pada RPL RPL ✔
Toko UD. Setia
3 Sistem Pakar Diagnosa Penyakit pada Tanaman Sistem Sistem ✔
Kakao menggunakan Metode Certainty Factor Studi Cerdas Cerdas
Kasus Kab. Mamuju
4 Penerapan Data Mining Menggunakan Algoritma Sistem Sistem ✔
K-Means Untuk Mendukung Strategi Promosi Cerdas Cerdas
Universitas Sulawesi Barat Berbasis Web
5 Sistem Monitoring Pembayaran dan Remainder Iot Iot ✔
Penyewaan Kamar Indekos Berbasis IoT
6 Sistem Pendukung Keputusan Pemilihan Tempat Sistem Sistem ✔
Kos Mahasiswa Universitas Sulawesi Barat Dengan Cerdas Cerdas
Menggunakan Metode Saw (Simple Additive
Weighting) Dan Metode Fuzzy Multi-Attribute
Decision Making
7 Monitoring Gudang Farmasi Menggunakan Web Iot Iot ✔
Server Streaming Video Dengan Pembacaan Sensor
8 Perancangan Apiikasi Koperasi Simpan Pinjam RPL RPL ✔
Kantor Kementerian Agama Kabupaten Majene
9 Perancangan early warning pada system Iot Iot ✔
kebencanaan berbasis Internet Of Things (IOT)
10 Perancangan Aplikasi Sistem Informasi Adminitrasi RPL RPL ✔
Siswa SMP Neg. 5. Polman
Data pengujian Fold 6

Tabel 4.26 Confusion Matrix Fold 6

Predicted Class
Actual
RPL SC Iot
RPL 3 0 0
SC 0 4 0
Iot 0 0 3
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.6 diperoleh

hasil testing diantaranya, terdapat 3 judul sesuai dengan target kelas klasifikasi
75

RPL, dan 4 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 3 judul Iot sesuai dengan target kelas klasifikasi Iot.

g. Pengujian 7 K-Fold Cross Validation 51-60

Tabel 4.27 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Implementasi Algoritma Knn Untuk Memprediksi Sistem Sistem ✔
Kelulusan Mahasiswa Teknik Informatika Cerdas Cerdas
Universitas Sulawesi Barat
2 Implementasi Sistem Pendukung Keputusan (SPK) Sistem Sistem ✔
untuk Pemilihan Konsentrasi Studi Mahasiswa Cerdas Cerdas
menggunakan AHP dan TOPSIS
3 Clustering Wilayah Berdasarkan Data Kesehatan Sistem Sistem ✔
Lingkungan Menggunakan Fuzzy C-Means Cerdas Cerdas
4 Sistem pakar diagnosa penyakit ayam petelur Sistem Sistem ✔
dengan metode Dempster Shafer Cerdas Cerdas
5 Perancangan Sistem Panduan Tempat Wisata RPL RPL ✔
Berbasis Web Di Kabupaten Majene Sulawes Barat
6 aplikasi metode e learning sdn no copala RPL RPL ✔
7 Aplikasi Metode E - Learning Pada SDN No. 16 RPL RPL ✔
Copala
8 Sistem Pakar Mendiagnosis Penyakit Dan Hama Sistem Sistem ✔
Pada Tanaman Padi Cerdas Cerdas
9 Perbandingan Algoritma Naive Bayes Dan C45 Sistem Sistem ✔
Dalam Mengidentifikasi Penyakit Diabetes Di Cerdas Cerdas
Puskesmas Lembang Majene
10 Implementasi algortima forecasting menggunakan RPL RPL ✔
metode triple exponential smooting pada persediaan
obat studi kasus apotek anita farma

Data pengujian Fold 7

Tabel 4.28 Confusion Matrix Fold 7

Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 6 0
Iot 0 0 0
Sumber : Pengujian
76

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.6 diperoleh

hasil testing diantaranya, terdapat 4 judul sesuai dengan target kelas klasifikasi

RPL, dan 6 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

h. Pengujian 8 K-Fold Cross Validation

Tabel 4.29 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Perancangan Website Museum Daerah Mandar RPL RPL ✔
Kabupaten Majene
2 Sistem Informasi Perincian Gaji Pegawai Negeri Di RPL RPL ✔
Kantor Kelurahan Baruga Kabupaten Majene
3 Implementasi algoritma Levenshtein distance dalam Sistem Sistem ✔
perbaikan pencarian kata kunci pada koleksi Cerdas Cerdas
Museum Kebudayaan Mandar Majene berbasis
Digital.
4 Sistem Pengolahan Data Surat Masuk Dan Surat RPL RPL ✔
Keluar Di Kantor Notaris Nurhidayah Kab. Majene
5 Rancang Bangun Alat Fermentasi Tempe Iot Iot ✔
Menggunakan Arduino Uno
6 Penentuan Lokasi Strategis Pusat Oleh – Oleh Khas Sistem Sistem ✔
Majene Menggunakan Metode Topsis Cerdas Cerdas
7 Pemberian Pakan Ikan Otomatis Untuk Iot Iot ✔
Pengembangan Fishery Manajemen Sistem
8 Implementasi Sistem Penyiraman Otomatis Berbasis Iot Iot ✔
Mikrontroler Pada Tanaman Bawang Merah
9 Rancang Bangun Sistem Informasi Akademik Di RPL RPL ✔
SDN Inpres No. 26 Pakkola
10 Implementasi Sistem Pendukung Keputusan (SPK) Sistem Sistem ✔
untuk Pemilihan Konsentrasi Studi Mahasiswa Cerdas Cerdas
menggunakan AHP dan TOPSIS
77

Data pengujian Fold 8

Tabel 4.30 Confusion Matrix Fold 8

Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 3 0
Iot 0 0 3
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.6 diperoleh

hasil testing diantaranya, terdapat 4 judul sesuai dengan target kelas klasifikasi

RPL, dan 3 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 3 judul Iot sesuai dengan target kelas klasifikasi Iot.

i. Pengujian 9 K-Fold Cross Validation 81-90

Tabel 4.31 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Perancangan Website Pada Puskesmas Pambusuang RPL RPL ✔
2 Perbandingan Metode K-NN dan Naïve Bayes Sistem Sistem ✔
dalam Klasifikasi Penentuan Calon Pendonor Darah Cerdas Cerdas
(Studi Kasus UTD RSUD Majene)
3 Prediksi Produktivitas Kakao Dengan Algoritma K - Sistem Sistem ✔
Nearest Neighbor Untuk Mendukung Kebijakan Cerdas Cerdas
Dinas Pertanian Kabupaten Mamuju
4 Sistem Monitoring Infus Secara Otomatis Iot Iot ✔
Menggunakan Nodemcu
5 Sistem Monitoring Tangki Air Berbasis Internet Of Iot Iot ✔
Things Menggunakan Nodemcu Esp8266 Dan
Sensor Ultrasonik Di Kampus Teknik Parang-
Parang
6 Sistem Monitoring Air Layak Komsumsi Berbasis Iot Iot ✔
Mikrokontroller
7 ancang aplikasi data base terima raskin lurah RPL RPL ✔
baruga dhua
8 Perancangan Aplikasi Data Base Penerima Raskin RPL RPL ✔
Di Kelurahan Baruga Dhua
9 Penerapan Teknologi IoT pada Hidroponik Iot Iot ✔
78

Klasifikasi
No Dokumen Klasifikasi NBC Benar
menggunakan Arduino
10 Perancangan Sistem Informasi Penerimaan Bansos RPL RPL ✔

Data pengujian Fold 9

Tabel 4.32 Confusion Matrix Fold 9

Predicted Class
Actual
RPL SC Iot
RPL 4 0 0
SC 0 3 0
Iot 0 0 4
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.6 diperoleh

hasil testing diantaranya, terdapat 4 judul sesuai dengan target kelas klasifikasi

RPL, dan 3 judul SC sesuai dengan target kelas klasifikasi Sistem Cerdas.

Selanjutnya terdapat 3 judul Iot sesuai dengan target kelas klasifikasi Iot.

j. Pengujian 10 K-Fold Cross Validation 91-100

Tabel 4.33 Pengujian K-Fold Crosss Validation

Klasifikasi
No Dokumen Klasifikasi NBC Benar
1 Monitoring Produksi Ayam Petelur Menggunakan Iot Iot ✔
Internet Of Things
2 Penerapan Clustering K-Means Dalam Pemetaan Sistem Sistem ✔
Kunjungan Wisata Di Kabupaten Majene Cerdas Cerdas
3 Smart Aquaponic System Menggunakan Internet Of Iot Iot ✔
Things
4 Sistem Antrian Berbasis Komputer Pada Puskesmas RPL RPL ✔
Tutallu Kecapatan Alu Kebupaten Polewali Mandar
5 Implementasi Metode K-Means Dalam Pemetaan Sistem Sistem ✔
Sebaran Alumni Cerdas Cerdas
6 Pemetaan Pusat Kesehatan Berbasis GIS Sistem Sistem ✔
menggunakan Algoritma Djisktra (Studi Kasus Cerdas Cerdas
Kabupaten Polman)
79

Klasifikasi
No Dokumen Klasifikasi NBC Benar
7 Membangun Perangkat Lunak Sebagai Alat Bantu RPL Iot Failed
Penagajar Berbasis Multimedia Tentang Benda -
Benda Langit ( Tata Surya )
8 sistem pakar diagnosa penyakit diare pada balita Sistem Sistem ✔
dengan metode forward chaining Cerdas Cerdas
9 Sistem Pakar Diagnosis Kerusakan Komputer Sistem Sistem ✔
Menggunakan Algoritma C4.5 Cerdas Cerdas
10 Rancang Bangun Aplikasi Reservasi Hotel Online RPL RPL ✔
Pada Hotel Pasifik Wonomulyo Berbasis Web
Sumber : Pengujian

Data Pengujian Fold 10

Tabel 4.34 Confusion Matrix Fold 10

Predicted Class
Actual
RPL SC Iot
RPL 2 0 1
SC 0 5 0
Iot 0 0 2
Sumber : Pengujian

Berdasarkan confusion matriks yang ditunjukkan pada tabel 4.6 diperoleh

hasil testing diantaranya, terdapat 2 judul sesuai dengan target kelas klasifikasi

RPL, 1 judul RPL dikategorikan sebagai kelas Iot dan 5 judul SC sesuai dengan

target kelas klasifikasi Sistem Cerdas. Selanjutnya terdapat 2 judul Iot sesuai

dengan target kelas klasifikasi Iot.

4. Analisis Hasil Pengujian

Hasil akurasi pengujian diketahui dari berapa jumlah data testing yang

sesuai target kelas yang telah ditentukan dibagi dengan jumlah keseluruhan data

testing yang berhasil diklasifikasikan.


80

Penelitian ini penulis melakukan pengujian dengan menggunakan jumlah

data training yang berbeda yaitu membagi jumlah training pada penelitian ini

pengujian dilakukan sebanyak 10 (sepuluh) kali dengan membagi jumlah fold

pada masing-masing data training dan data testing yang berbeda, agar dapat

mengetahui pengaruh data training terhadap hasil klasifikasi. Pada tabel hasil

pengujian terdapat beberapa field antara lain, Data training dan data testing yang

akan diuji kebenaran kelasnya. Hasil akurasi dari keseluruhan pengujian dapat

dilihat pada tabel 4.35 berikut.

Tabel 4.35 Hasil Keseluruhan Pengujian Akurasi

Data Testing
No. Fold Data Testing benar Akurasi
salah

1 1-10 0 10 100%

2 11-20 2 8 80%

3 21-30 0 10 100%

4 31-40 0 10 100%

5 41-50 0 10 100%

6 51-60 0 10 100%

7 61-70 0 10 100%

8 71-80 0 10 100%

9 81-90 0 10 100%

10 91-100 1 9 90%
81

Hasil akurasi dari keseluruhan pengujian dapat digambarkan kedalam

grafik seperti pada gambar 4.10 berikut.

Hasil Akurasi
12
10
8
Akurasi

6
4
2
0
Fold
Fold Fold Fold Fold Fold Fold Fold Fold Fold
91-
1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90
100
Data Salah 0 2 0 0 0 0 0 0 0 1
Data Benar 10 8 10 10 10 10 10 10 10 9
Akurasi 100% 80% 100% 100% 100% 100% 100% 100% 100% 90%

Gambar 4.13 Grafik Hasil Pengujian Akurasi.


BAB V

KESIMPULAN DAN SARAN

A. KESIMPULAN

Berdasarkan penelitian yang dilakukan sebelumnya dapat diambil

kesimpulan bahwa klasifikasi judul skripsi menggunakan algoritma naive bayes

dapat dilakukan dalam mengelompokkan judul skripsi sesuai kelas topiknya. Dari

hasil pengujian akurasi yang dilakukan terhadap 150 data training dan 100 data

testing yang digunakan diperoleh tingkat akurasi sebesar 97 %. Adapun pengujian

presisi didapatkan nilai sebesar 0,97 %, Recall mendapat nilai sebesar 0,96 % dan

nilai laju error sebesar 0,03 %. Berdasarkan hasil pengujian dapat diketahui

bahwa implementasi metode naive bayes dalam melakukan pengklasifikasian

judul skripsi kedalam kategori kelas sudah baik, dapat dilihat dari tingkat akurasi

yang diperoleh terhadap 100 data testing dan 150 data training.

B. SARAN

Penulis menyadari bahwa dalam penelitian ini masih banyak terdapat

kekurangan, sehingga penulis mengusulkan untuk kelanjutan penelitian

kedepannya yaitu dibutuhkan penggunaan algoritma klasifikasi yang lain atau

melakukan kombinasi algoritma yang lain sehingga diperoleh tingkat akurasi yang

lebih baik lagi. Sehingga, dapat dilakukan perbandingan untuk memperoleh

metode yang paling cocok dengan melihat nilai akurasi dari metode yang

digunakan.

82
83

Adapun penelitian kedepannya juga diharapkan dapat meningkatkan

jumlah data training dan data uji yang digunakan untuk meningkatkan keakuratan

klasifikasi judul skripsi kedepannya.


DAFTAR PUSTAKA

Aris J. Ordoñez, R. E. J. P. R. N. N., 2018. SMS Classification Method for


Disaster Response. [Online] Available at:
https://ieeexplore.ieee.org/document/8644872 (Diakses 12 Agustus 2022).
Agusta, L. (2009). Perbandingan algoritma stemming Porter dengan algoritma
Nazief & Adriani untuk stemming dokumen teks bahasa
indonesia. Konferensi Nasional Sistem dan Informatika, 2009, 196-201.
Barnawi. (2015). Teknik Penulisan Karya Ilmiah. Ar-Ruzz Media
Banjarsari, M. A., Budiman, I., & Farmadi, A. (2016). Penerapan K-Optimal Pada
Algoritma Knn Untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program
Studi Ilmu Komputer Fmipa Unlam Berdasarkan Ip Sampai Dengan
Semester 4. Klik-Kumpulan Jurnal Ilmu Komputer, 2(2), 159-173.
Baharuddin, M. M., Azis, H., & Hasanuddin, T. (2019). Analisis Performa
Metode K-Nearest Neighbor Untuk Identifikasi Jenis Kaca. ILKOM Jurnal
Ilmiah, 11(3), 269-274.
Dragut, E., Fang, F., Sistla, P., Yu, C., & Meng, W. (2009). Stop word and related
problems in web interface integration. Proceedings of the VLDB
Endowment, 2(1), 349-360.
Evan, F. H., WP, Y. S. P., & Pranowo, P. (2014). Pembangunan perangkat lunak
peringkas dokumen dari banyak sumber menggunakan sentence scoring
dengan metode TF-IDF. In Seminar Nasional Aplikasi Teknologi Informasi
(SNATI).
Fathan Hidayatullah, A., Rifqi Ma, M., & Program Studi Manajemen Informatika
STMIK Jenderal Achmad Yani Yogyakarta Jl Ringroad Barat, arif. (2016).
Penerapan Text Mining dalam Klasifikasi Judul Skripsi. Seminar Nasional
Aplikasi Teknologi Informasi (SNATi) Agustus, 1907–5022
Gupta, N (2012). Text mining for information retrieval
(Hidayat et al., 2020)Bharata, H. K. (2016). Noptimasi Skripsi Mahasiswa Teknik
Informatika Menggunakan Klasifikasi Algoritma Naive Bayes Dan Support
Vector Machine.
Hidayat, M. S., Puspaningrum, E. Y., Hanindia, M., & Swari, P. (2020).
Penerapan Case Based Reasoning Pada Sistem Rekomendasi Topik Skripsi
Program Studi Infor Matika Upn “ Veteran ” Jawa Timur. 1(2), 272–281.
Kurniawan, Dedik. The Master of 3. Elex Media Komputindo. Jakarta, 2009
Khalida, R., & Bharata, H. K. (2020). Analisa Komparasi Tiga Metode Data
Mining dalam Prediksi Impor Komoditas Tanaman Biofarmaka. Jurnal
Ilmiah KOMPUTASI, 19(2), 145-154

84
80

Mandias, G. F. (2015). Penerapan data mining untuk evaluasi kinerja akademik


mahasiswa di Universitas Klabat dengan metode klasifikasi. Proceedings
Konferensi Nasional Sistem dan Informatika (KNS&I).
Marlinda, L., & Rianto, H. (2013). Pembelajaran Bahasa Indonesia Berbasis Web
Menggunakan Metode Maximum Marginal Relevance. SESINDO 2013.
Machmud, “Tuntunan Penulisan Tugas Akhir Berdasarkan Prinsip Dasar.
Penelitian Ilmiah”, Cet. 1 (Malang: Penerbit Selaras, 2016)
Muttaqin, M. R., & Defriani, M. (2020). Algoritma K-Means untuk
Pengelompokan Topik Skripsi Mahasiswa. ILKOM Jurnal Ilmiah, 12(2),
121–129. https://doi.org/10.33096/ilkom.v12i2.542.121-129
Peraturan Menteri Riset, Teknologi, dan Pendidikan Tinggi Nomor 44 Tahun
2015 tentang Standar Nasional Pendidikan Tinggi (Lembaran Negara
Republik Indonesia Tahun 2015 Nomor 1952)
Pradikdo, A. C., & Ristyawan, A. (2018). Model Klasifikasi Abstrak Skripsi
Menggunakan Text Mining Untuk Pengkategorian Skripsi Sesuai Bidang
Kajian. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 9(2),
1091–1098. https://doi.org/10.24176/simet.v9i2.2513
Pandie, Emerensye S. Y. 2012. Implementasi Algoritma Data mining K-Nearest
Neighbour (KNN) Dalam Pengambilan Keputusan Pengajuan Kredit.
Jurusan Ilmu Komputer, Fakultas Sains dan Teknik, Universitas Nusa
Cendana : Kupang
Pujianto, U., Widiyaningtyas, T., Prasetya, D. D., & Romadhon, B. (2019).
Penerapan algoritma naïve bayes classifier untuk klasifikasi judul skripsi
dan tugas akhir berdasarkan Kelompok Bidang Keahlian. Tekno, 27(1), 79.
https://doi.org/10.17977/um034v27i1p79-92
Putro, M. F., Prayitno, E., Siregar, J., & Muharrom, M. (2021). Penerapan Data Mining
Dengan Naïve Bayes Untuk Klasifikasi Siswa Sekolah Menengah Atas Dalam
Penentuan Perguruan Tinggi. Jurnal AKRAB JUARA, 6(2), 306–312. Rif qo, M.
H., & Wijaya, A. (2017). Implementasi Algoritma Naive Bayes Dalam Penentuan
Pemberian Kredit. Pseudocode, 4(2), 120–128.
https://doi.org/10.33369/pseudocode.4.2.120-128
Rachman, D. A. C., Goejantoro, R., & Amijaya, F. D. T. (2021). Implementasi
text mining pengelompokkan dokumen skripsi menggunakan metode k-
means clustering. EKSPONENSIAL, 11(2), 167-174.
Rasjid, N., Arifin, N., & Cahya, N. (2021). KLASIFIKASI NASABAH BANK LAYAK
KREDIT MENGGUNAKAN METODE NAIVE BAYES: CLASSIFICATION
OF CUSTOMERS OF CREDIT-WORTH BANKS USING NAIVE BAYES
METHOD. Jurnal ilmiah Sistem Informasi dan Ilmu Komputer, 1(1), 01-10.
Suyanto, 2018. Machine Learning Tingkat Dasar dan Lanjut. Bandung:
Informatika Bandung.
81

Solichin, A. (2016). Pemrograman web dengan PHP dan MySQL. Penerbit Budi
Luhur.
Sani, R. R., Zeniarza, J., & Luthfiarta, A. (2016). Pengembangan Aplikasi
Penentuan Tema Tugas Akhir Berdasarkan Data Abstrak Menggunakan
Algoritma K-nearest Neighbor. Unisbank Semarang, 207, 103–111.
Sanjaya, S., & Absar, E. A. (2015). Pengelompokan Dokumen Menggunakan
Winnowing Fingerprint dengan Metode K-Nearest Neighbour. Jurnal
CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi
Informasi, 1(2), 50-56.
Syahdrajat, T. (2015). Panduan menulis tugas akhir kedokteran & kesehatan.
Kencana.
Sukamto, R. A., & Shalahuddin, M. (2013). Rekayasa Perangkat Lunak Terstruktur dan
Berorientasi Objek. Bandung: Informatika.
Riyanto, Slamet. 2014. Adobe Photoshop to CSS3. Jakarta:PT Elex Media
Komputindo
Raschka, S. 2015.Naive Bayes and Text Classification I Introduction And Theory.
New York: Cornell University Library, (Online),
(https://arxiv.org/pdf/1410.5329v3.pdf), diakses pada 15 November 2022)
Soyomukti, N. 2015. Teori-Teori Pendidikan: Dari Tradisional, (Neo) Liberal,
Marxis-Sosialis, Hingga Postmodern. Yogyakarta: Ar-Ruzz Media.
Somantri, O., Wiyono, S., & Dairoh, D. (2016). Metode K-Means untuk Optimasi
Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector
Machine (SVM). Scientific Journal of Informatics, 3(1), 34–45.
https://doi.org/10.15294/sji.v3i1.5845
Wurdianarto, S. R., Novianti, S., dan Rosyidah, U. (2014). “Perbandingan
Euclidean Distane Dengan Canberra Distance”. Face Recognition
TECHNO.COM, 13 (1), 31-37
Yusra, Olivita, D., & Vitriani, Y. (2016). Perbandingan Klasifikasi Tugas Akhir
Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes
Classifier dan K-Nearest Neighbor. Jurnal Sains, Teknologi Dan Industri,
14(1), 79–85.
82

LAMPIRAN
83

LAMPIRAN DATA TRAINING


No Data Asli Label

1 Sistem Informasi Pengolahan Data Simpan Pinjam Koperasi Pegawai Republik RPL
Indonesia Karya Dharma Kabupaten Majene

2 Perancangan Sistem Informasi Penerimaan Bansos RPL

3 Perancangan Website Museum Daerah Mandar Kabupaten Majene RPL

4 Rancang Bangun Sistem Informasi Akademik Di SDN Inpres No. 26 Pakkola RPL

5 Sistem Informasi Gaji Pegawai Negeri Sipil Di Kantor Kelurahan Baruga RPL

6 Perancangan sistem Informasi Penjualan RPL

7 Sistem Informasi Data Medis Ibu dan Anak Di Puskesmas Banggae RPL

8 Perancangan Website Pada Puskesmas Pambusuang RPL

9 Sistem Informasi Akademik Universitas Sulawesi Barat Prodi Teknik Informatika RPL

10 Perancangan Website Pada Puskesmas Pambusuang RPL

11 Perancangan Aplikasi Rental Mobil Pada Usaha Rental Amanah RPL

12 Perancangan Aplikasi Pemimjaman Dan Pengembalian Buku Pada Kantor RPL


Perpustakaan Arsip Dan Dokumentasi Daerah Kabupaten Majene

13 Aplikasi Metode E - Learning Pada SDN No. 16 Copala RPL

14 Aplikasi Penjualan Berbasis Client Server Pada Toko UD. Setia RPL

15 Perancangan Apiikasi Koperasi Simpan Pinjam Kantor Kementerian Agama RPL


Kabupaten Majene

16 Perancangan Aplikasi Data Base Penduduk Kantor Desa Pesuloang RPL

17 Perancangan Aplikasi Data Base Penerima Raskin Di Kelurahan Baruga Dhua RPL

18 Analisis Dan Pengajuan Tranmisi Data Dengan Modern GSM 20Menggunakan RPL
Axence Nettols

19 Membangun Perangkat Lunak Sebagai Alat Bantu Penagajar Berbasis Multimedia RPL
Tentang Benda - Benda Langit ( Tata Surya )

20 Perancangan Aplikasi Katalog Buku Berbasis Client Sever Pada Kantor Perpustakaan RPL
Umum Kab. Majene

21 Perancangan Sistem Pengelolaan Adminitrasi Uang Makan dan Uang Lembur Pada RPL
Bagian Keuangan Kantor Kab. Majene
84

No Data Asli Label

22 Pengendalian Perangkat Listrik Melalui Fasilitas SMS Gateway RPL

23 Aplikasi Perpustakaan Di SDN 1 Saleppa Berbasis Website RPL

24 Aplikasi Pelayanan Berkas Persyaratan Nikah Di Kua Kecamatan Banggae Timur RPL

25 Perancangan Aplikasi Sistem Informasi Pengelolaan Surat Masuk dan Surat Keluar RPL
Pada SMK Neg. 2 Majene

26 Sistem Informasi Pengelolaan Surat Masuk Dan Surat Keluar Pada Dinas Satuan RPL
Polisi Pamong Praja Dan Perlindungan Masyarakat

27 Rancang Bangun Web Server Menggunakan Debian Linux RPL

28 Rancang Bangun E - Learning SMP Neg. 2 Majene RPL

29 Rancang Bangun Sistem Informasi Monitoring Absensi Perkuliahan Mahasiswa Via RPL
SMS Gafe

30 Perancangan Sistem Pengolahan Data Inventaris Oba t Pada Apotik Citra Farmasiando RPL
Majene

31 Sistem Pengolahan Data Surat Masuk Dan Surat Keluar Di Kantor Notaris RPL
Nurhidayah Kab. Majene

32 Rancang Bangun Aplikasi Reservasi Hotel Online Pada Hotel Pasifik Wonomulyo RPL
Berbasis Web

33 Perancangan Aplikasi Registrasi Pendaftaran KK dan Tanda Penduduk Dinas RPL


Kependudukan dan Catatan Sipil Kabupaten Polewali Mandar

34 Perancangan Aplikasi Profil Siswa dan Calon Siswa Baru Di SMP Neg. 1 RPL
Campalagian

35 Rancang Bangun Website Hotel Villa Bogor Kabupaten Majene RPL

36 Perancangan Kamus istilah Komputer Android RPL

37 Sistem Antrian Berbasis Komputer Pada Puskesmas Tutallu Kecapatan Alu RPL
Kebupaten Polewali Mandar

38 Perancangan sistem Menggunakan Manajemen Adminitrasi SDN 008 Camba - RPL


Camba Kec. Limboro

39 Perancangan Aplikasi Data Pegawai Kantor Badan Lingkungan Hidup Dan Pertanian RPL
Kabupaten Majene

40 Sistem Informasi Aplikasi Rekam Mudik Pada Rumah sakit Umum Daerah RPL
Kabupaten Majene
85

No Data Asli Label

41 Perancangan Sistem Pengolahan Data Pernikahan Pada Kantor Urusan Agama ( KUA RPL
) Kecamatan Tammerodo Sendana

42 Sistem Informasi Perincian Gaji Pegawai Negeri Di Kantor Kelurahan Baruga RPL
Kabupaten Majene

43 Perancangan Game Sandeq Race Berbasis Android RPL

44 Apliksi SistemData Base Perkiraan Cuaca BMKG Majene RPL

45 Perancangan Sistem Panduan Tempat Wisata Berbasis Web Di Kabupaten Majene RPL
Sulawes Barat

46 Perancangan Perangkat Lunak Metode Pencairan Data Pelanggang RPL

47 Perancangan Aplikasi Sistem Informasi Adminitrasi Siswa SMP Neg. 5. Polman RPL

48 Perancangan Aplikasi Propil layanan Kantor Urusan Agama Kecamatan Campalagian RPL
Dengan Pemdekatan Prototype

49 Perancangan Sistem Informasi Simpan Deposito Koperasi Citra Sejahtera Kabupaten RPL
Majene

50 SISTEM PAKAR IDENTIFIKASI HAMA TANAMAN CABAI MENGGUNAKAN Sistem


METODE ITERATIVE DICHOTOMIZER TREE (ID3) Cerdas

51 Clustering Wilayah Berdasarkan Data Kesehatan Lingkungan Menggunakan Fuzzy Sistem


C-Means Cerdas

52 Pemetaan Daerah Prioritas Penanganan Stunting Pada Ibu Hamil Menggunakan Sistem
Metode TOPSIS (Studi Kasus:Kabupaten Majene) Cerdas

53 IMPLEMENTASI Elimination and Choice Translation Reality (ELECTRE) UNTUK Sistem


MENENTUKAN CALON PEMBIMBING TUGAS AKHIR MAHASISWA Cerdas

54 Perbandingan Algoritma AHP dan SAW Untuk Sistem Penunjang Keputusan Sistem
Pemilihan Bibit Jagung Cerdas

55 Implementasi Sistem Pendukung Keputusan (SPK) untuk Pemilihan Konsentrasi Sistem


Studi Mahasiswa menggunakan AHP dan TOPSIS Cerdas

56 IMPLEMENTASI PENJADWALAN MATA PELAJARAN MENGGUNAKAN Sistem


METODE ALGORITMA GENETIKA (STUDI KASUS DI MTs DDI MAJENE) Cerdas

57 SISTEM PENDUKUNG KEPUTUSAN PEMBERIAN BEASISWA Sistem


MENGGUNAKAN METODE FUZZY MULTIPLE ATRIBUTE DECISION Cerdas
MAKING (FMADM) DAN ALGORITMA WEIGHTED PRODUCT (WP)

58 IMPLEMENTASI METODE AHP DAN TOPSIS PADA SISTEM PENDUKUNG Sistem


KEPUTUSAN CALON PENERIMA BEDAH RUMAH (STUDI KASUS : DESA Cerdas
86

No Data Asli Label

BONDE UTARA)

59 SISTEM PEMILIHAN JURUSAN DI PERGURUAN TINGGI BAGI SISWA SMA Sistem


MENGGUNAKAN LOGIKA FUZZY DAN SIMPLE ADDITIVE WEIGHTING Cerdas
(SAW)

60 Sistem Pendukung Keputusan Penentuan Masyarakat Miskin Dengan Metode Sistem


Weighted product di Desa Bukit Samang Cerdas

61 Implementasi Algoritma Analytical Hierarchy Process (AHP) Dalam Sistem Sistem


Pengambilan Keputusan Sebagai Rekomendasi Pembimbing Tugas Akhir Cerdas

62 Kombinasi Algoritma Certainty factor dan Forward Chaining Untuk Mengidentifikasi Sistem
Penyakit Ayam Petelur Cerdas

63 Implementasi algoritma Naive bayes dalam menentukan Penerima PKH Sistem


Cerdas

64 PREDIKSI PRODUKTIVITAS KAKAO DENGAN ALGORITMA K-NEAREST Sistem


NEIGHBOR UNTUK MENDUKUNG KEBIJAKAN DINAS PERTANIAN Cerdas
KABUPATEN MAMUJU

65 PENERAPAN CLUSTERING K-MEANS DALAM PEMETAAN KUNJUNGAN Sistem


WISATA DI KABUPATEN MAJENE Cerdas

66 IMPELEMENTASI METODE FUZZY MULTIPLE DECISION MAKING Sistem


(FMADM) dan SIMPLE ADDITIVE WEIGHTING (SAW) PADA SISTEM Cerdas
PENDUKUNG KEPUTUSAN PENERIMAAN BEASISWA BANK INDONESIA
(Studi Kasus : Uiversitas Sulawesi Barat)

67 IMPLEMENTASI ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI Sistem


PENYAKIT DEMAM BERDARAH (DBD) (STUDI KASUS RUMAH SAKIT Cerdas
MAJENE)

68 Analisis Pengguna Algoritma Apriori Untuk Rekomendasi Penempatan B uku Sistem


Berdasarkan Data Peminjaman Pada Dinas Perpustakaan Dan Kearsipan Kabupaten Cerdas
Majene

69 SISTEM PAKAR MENDIAGNOSIS PENYAKIT DAN HAMA PADA TANAMAN Sistem


PADI Cerdas

70 PENENTUAN LOKASI STRATEGIS PUSAT OLEH – OLEH KHAS MAJENE Sistem


MENGGUNAKAN METODE TOPSIS Cerdas

71 IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI Sistem


UNTUK MENENTUKAN POLA PEMBELIAN OBAT DI RUMAH SAKIT Cerdas

72 Perbandingan Metode K-NN dan Naïve Bayes dalam Klasifikasi Penentuan Calon Sistem
Pendonor Darah (Studi Kasus UTD RSUD Majene) Cerdas

73 PENERAPAN ALGORITMA NAIVE BAYES DALAM MENENTUKAN Sistem


87

No Data Asli Label

KELAYAKAN NASABAH PADA KOPERASI SIMPAN PINJAM Cerdas

74 PENENTUAN DOSEN TELADAN BERDASARKAN PENILAIAN KINERJA Sistem


MENGGUNAKAN METODE SIMPLE ADDITIVE WEIGHTING (STUDI KASUS Cerdas
DOSEN UNSULBAR)

75 IMPLEMENTASI METODE K-MEANS DALAM PEMETAAN SEBARAN Sistem


ALUMNI Cerdas

76 Implementasi data mining persediaan obat pada Puskesmas Banggae II menggunakan Sistem
Algoritma Apriori Cerdas

77 PERBANDINGAN ALGORITMA NAIVE BAYES DAN C45 DALAM Sistem


MENGIDENTIFIKASI PENYAKIT DIABETES DI PUSKESMAS LEMBANG Cerdas
MAJENE

78 Diagnosis Penyakit Stunting Pada Balita Melalui Penerapan Sistem Pakar Sistem
Menggunakan Metode Certainty Factor Cerdas

79 IMPLEMENTASI ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI Sistem


PENYAKIT TUBERCOLOSIS (TBC) Cerdas

80 MODEL PENENTUAN RUTE TERPENDEK PENJEMPUTAN SAMPAH Sistem


MENGGUNAKAN TRAVELING SALESMAN PROBLEM DAN ALGORITMA Cerdas
GENETIKA

81 SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN TEMPAT KOS Sistem


MAHASISWA UNIVERSITAS SULAWESI BARAT DENGAN Cerdas
MENGGUNAKAN METODE SAW (SIMPLE ADDITIVE WEIGHTING) DAN
METODE FUZZY MULTI-ATTRIBUTE DECISION MAKING

82 UJI PLAGIARISM PADA TUGAS MAHASISWA MENGGUNAKAN Sistem


ALGORITMA WINNOWING Cerdas

83 Sistem Pendeteksi Ikan Tidak Segar Menggunakan pengolahan Citra Berbasis Sistem
Android Dengan Metode K-NEAREST NEIGHBOR Cerdas

84 SISTEM PENDUKUNG KEPUTUSAN KELAYAKAN PENDONOR DARAH Sistem


MENGGUNAKAN METODE TOPSIS BERBASIS WEB Cerdas

85 Implementasi Algoritma Genetika untuk Menyelesaikan Course Scheduling Problem Sistem


Menggunakan Random Pair Mutation Gen Cerdas

86 Pemetaan Pusat Kesehatan Berbasis GIS menggunakan Algoritma Djisktra (Studi Sistem
Kasus Kabupaten Polman) Cerdas

87 Implementasi algortima forecasting menggunakan metode triple exponential smooting Sistem


pada persediaan obat studi kasus apotek anita farma Cerdas

88 PENERAPAN METODE SAW DALAM SISTEM PENENTUAN KELULUSAN Sistem


CALON MAHASISWA BARU JALUR MANDIRI Cerdas
88

No Data Asli Label

89 IMPLEMENTASI ALGORITMA KNN UNTUK MEMPREDIKSI KELULUSAN Sistem


MAHASISWA TEKNIK INFORMATIKA UNIVERSITAS SULAWESI BARAT Cerdas

90 Penerapan Algoritma FSA (Finite State Automaton) pada aplikasi penerjemah bahasa Sistem
indonesia -mandar Cerdas

91 Sistem pakar diagnosa penyakit ayam petelur dengan metode Dempster Shafer Sistem
Cerdas

92 sistem pakar diagnosa penyakit diare pada balita dengan metode forward chaining Sistem
Cerdas

93 SISTEM PAKAR DIAGNOSIS KERUSAKAN KOMPUTER MENGGUNAKAN Sistem


ALGORITMA C4.5 Cerdas

94 IMPLEMENTASI ALGORITMA LEVENSTHEIN STRING STUDI KASUS ARSIP Sistem


DATA PASIEN RUMAH SAKIT UMUM DAERAH KABUPATEN MAJENE Cerdas

95 Implementasi algoritma Levenshtein distance dalam perbaikan pencarian kata kunci Sistem
pada koleksi Museum Kebudayaan Mandar Majene berbasis Digital. Cerdas

96 IDENTIFIKASI HAMA DAN PENYAKIT PADA TANAMAN KACANG TANAH Sistem


MENGGUNAKAN CASE BASED REASONING DAN ALGORITMA K- Cerdas
NEAREST NEIGHBOR

97 PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS Sistem


UNTUK MENDUKUNG STRATEGI PROMOSI UNIVERSITAS SULAWESI Cerdas
BARAT BERBASIS WEB

98 Sistem Pakar Diagnosa Penyakit pada Tanaman Kakao menggunakan Metode Sistem
Certainty Factor Studi Kasus Kab. Mamuju Cerdas

99 Sistem pendukung keputusan pemilihan skincare sesuai dengan kebutuhan kulit Sistem
wajah menggunakan metode SMARTER Cerdas

100 Rancang Bangun Sistem Pendeteksi Gempa Bumi Berbasis Internet Of Things IOT

101 SISTEM OTOMASI PADA SMART HOME BERBASIS INTERNET OF THINGS IOT
(IoT)

102 IMPLEMENTASI SISTEM PENYIRAMAN OTOMATIS BERBASIS IOT


MIKRONTROLER PADA TANAMAN BAWANG MERAH

103 Perancangan prototype pulse sensor monitoring Berbasis IoT (Internet of Things) IOT

104 ALAT PENDETEKSI SUHU TUBUH BERBASIS MIKROKONTROLER IOT


ARDUINO UNO

105 PENGEMBANGAN FISH FEEDING SYSTEM BERBASIS IoT IOT


89

No Data Asli Label

106 Sistem Monitoring Tangki Air Berbasis Internet Of Things Menggunakan Nodemcu IOT
Esp8266 Dan Sensor Ultrasonik Di Kampus Teknik Parang-Parang

107 Sistem pengontrolan ketersediaan lahan parkir berbasis iot IOT

108 SISTEM MONITORING INFUS SECARA OTOMATIS MENGGUNAKAN IOT


NODEMCU

109 Prototype Alat Stabilisasi Suhu Kandang Ayam Berbasis Mikrokontroller IOT

110 PENERAPAN LOGIKA FUZZY ALAT PENYANGRAI BIJI KOPI OTOMATIS IOT
MENGGUNAKAN ARDUINO UNO

111 FISH FARM MONITORING BERBASIS INTERNET OF THINGS IOT

112 Smart Aquaponic System Menggunakan Internet Of Things IOT

113 Prototype Monitoring Penyiraman dan Pemupukan Otomatis Pada Tanaman Bawang IOT
Mandar Berbasis IoT (Internet Of Things)

114 Implementasi Modul RFID Internet of Things untuk Smart Door IOT

115 RANCANG BANGUN TEMPAT SAMPAH PINTAR PEMILAH SAMPAH IOT


ORGANIK DAN ANORGANIK BERBASIS MIKROCONTROLLER ARDUINO

116 RANCANG BANGUN ALAT FERMENTASI TEMPE MENGGUNAKAN IOT


ARDUINO UNO

117 SISTEM MONITORING AIR LAYAK KOMSUMSI BERBASIS IOT


MIKROKONTROLLER

118 PROTOTYPE SISTEM PENGERINGAN IKAN ASIN MENGGUNAKAN IOT


MIKROKONTROLER ARDUINO

119 System Monitoring Suhu Panas Pada Empang Menggunakan Mikrokontroler Berbasis IOT
Internet Of Things

120 SISTEM KONTROL PH AIR DAN MONITORING NUTRISI PADA TANAMAN IOT
HIDROPONIK DENGAN INTERNET OF THINGS

121 KONTROL NUTRISI AIR PADA TANAMAN HIDROPONIK BERBASIS IOT


MICROCONTROLLER

122 Prototype food feeding system pada ayam broiler berbasis internet of things IOT

123 SMART FEEDING BERBASIS IOT MENGGUNAKAN ARDUINO NODEMCU IOT


ANDROID MQTT

124 PROTOTYPE SISTEM MONITORING PENGGUNAAN DAYA LISTRIK DAN IOT


PENGONTROLAN PENGGUNAAN AIR MENGGUNAKAN
90

No Data Asli Label

MIKROKONTROLER

125 PERANCANGAN ALAT INTERNET OF THINGS (IOT) UNTUK MONITORING IOT


SERTA MENGENDALIKAN SUHU DAN KELEMBAPAN PADA BUDIDAYA
JAMUR

126 alat pemantau penggunaan daya listrik pada indekos berbasis IOT IOT

127 Pengembangan Sistem Monitoring Kumbung Jamur Menggunakan Mikrokontroller IOT

128 Perancangan early warning system pada smart home berbasis internet of things (IOT IOT

129 Perancangan early warning pada system kebencanaan berbasis Internet Of Things IOT
(IOT)

130 Perancangan early warning pada system kebencanaan berbasis Internet Of Things IOT
(IOT)

131 Real time notification pada sistem deteksi kebakaran berbasis Internet of Things (IoT) IOT

132 Sistem Keamanan Rumah Walet berdasarkan getaran dan Inframerah berbasis IOT
Internet Of Things (IOT)

133 Monitoring Produksi Ayam Petelur Menggunakan Internet Of Things IOT

134 Sistem monitoring pembudidayaan pada tanaman cabai berbasis iot(internet of things) IOT

135 Pemberian Pakan Ikan Otomatis Untuk Pengembangan Fishery Manajemen Sistem IOT

136 SISTEM PEMANTAUAN KUALITAS AIR PADA PEMBUDIDAYAAN IKAN IOT


AIR TAWAR BERBASIS MICROCONTROLLER

137 Prototype Alat Penyortir dan Penghitung Telur Otomatis Berbasis Internet of Things IOT

138 PROTOTYPE SMART GREEN HOUSE KELOMPOK TANI DI MAMASA IOT


MENGGUNAKAN WeMos

139 MONITORING GUDANG FARMASI MENGGUNAKAN WEB SERVER IOT


STREAMING VIDEO DENGAN PEMBACAAN SENSOR

140 SISTEM KONTROL DAN MONITORING PEMBERI PAKAN IKAN OTOMATIS IOT
BERBASIS IOT

141 PENDETEKSI KESEGARAN IKAN MENGGUNAKAN SENSOR MQ-135 IOT

142 Penerapan Teknologi IoT pada Hidroponik menggunakan Arduino IOT

143 Sistem Monitoring dan kontrol cairan infus pasien berbasis Internet Of Things (IoT) IOT

144 Prototipe Sistem Monitoring Ketinggian Air Pada Bendungan Berbasis Internet Of IOT
91

No Data Asli Label

Things

145 MONITORING SUHU DAN KELEMBAPAN RUMAH WALET BERBBASIS IOT


LORA (LONG RANGE)

146 Sistem Monitoring Pembayaran dan Remainder Penyewaan Kamar Indekos Berbasis IOT
IoT

147 Sistem Pengukur Tekanan Darah dan Denyut Nadi Berbasis Internet Of Things IOT

148 RANCANG BANGUN SISTEM PENGAMAN PINTU BERBASIS IoT IOT

149 PROTOPTYPE PENGAIRAN SAWAH DAN MONITORING KUALITAS PH IOT


TANAH BERBASIS IOT

150 Perancangan Aplikasi Penggajian Pegawai Pada Dinas Pendidikan Pemuda Dan RPL
Olahraga Kab. Majene

LAMPIRAN DATA TESTING


No Data Asli

1 Perancangan Sistem Informasi Berbasis web SMP negeri 2 Campalagian Menggunakan Metode
WISDM

2 Sistem Infromasi Pengarsipan Surat Masuk Dan Surat Keluar Berbasis web Pada Kantor Camat
Banggae Timur Kab. Majene Prototype

3 Sistem Informasi Persuratan Masuk dan Keluar di Instansi Dinas Pendidikan Kab. Majene

4 Rancang Bangun Website Stikmar Majene Berdasarkan Metode WSDM

5 Sistem Informasi Singkronisasi Data Musrembang Pada Kantor Camat Matakali

6 Sistem Informasi Pengelolaan Data Penjual Laptop dan Aksesoris Komputer Pada Komputer
Berbasis Web

7 Perencanaan Sistem Informasi Pariwisata Daerah Polewali Mandar Dengan Menggunakan Metode
BUMN

8 Perancangan Sistem Informasi Pengelolaan Industri Tradisional Sarung Sutra Dengan Pemodelan
BDMN Studi Kasus KSU Mitra Mandiri Sejahtera Desa Renggean

9 Perancangan Model Proses Bisnis Pengelolaan Pengarsipan Dokemen Di Dinas Keuangan Kab.
Majene Berdasarkan Bussines Process Modelling Notation ( BPMN )

10 Pembuatan Wajan Bolic Sebagai Antena Sektoral Di Desa Lemba Sumara Kecamatan Soyojaya
Provinsi Sulawesi Tengah
92

No Data Asli

11 Sistem Informasi Data Penduduk Pada Kantor Desa Laliko Kecamatan Campalagian Kabupaten
Polewali Mandar

12 Perancangan Sistem Informasi Monitorin Aktivitas Desa Berbasis Web Dengan Metode BPMM

13 Perancangan Sistem Informasi Pengelolaan Persalinan Di Puskesmas Wonomulyo Kabupaten


Polewali Mandar Berdasarkan Business Process Modeling Notation (BPMN)

14 Sistem Pengarsipan Pembayaran SPP/UKT Universitas Sulawesi Barat Berbasis Web

15 Sistem Informasi Data Rekapitulasi Absensi Pegawai Pada Instansi Dinas Pekerjaan Umum
Kabupaten Majene

16 Rancangan Aplikasi Pengarsipan Buku Tanah Pada Kantor Badan Pertanahan Nasional (BPN)
Kabupaten Polewali Mandar Berdasarkan Metode Prototype

17 Aplikasi Jadwal Penggunaan Laboratorium Teknologi Informasi Universitas Sulawesi Barat

18 Rancang Bangun Penyusun Kebutuhan Sistem Pada Proses pengarsipan Dokumen Berbasis Web
Di Dinas Keuangan Dengan Pengelolaan Agile Model Driven

19 Aplikasi Sistem E-Commerce Dengan Pendekatan Agile Model Driven Studi Kasus Toko Fara
Hijab

20 Perancangan Sistem Informasi Persediaan Obat Pada Puskesmas Tinambung Berbasis Web
Menggunakan Metode Agile

21 Rancang Bangun Model Bisnis Web E-Commerce Toko UD Perkasa Berdasarkan Business
Process Modeling Notation (BPMN)

22 Pengembangan Media Pembelajaran Berbasis Makro Media Plus Pada SMK Negeri 2 Majene

23 Sistem Informasi Penerimaan Mahasiswa Baru Berbasis Web Dengan Metode Prototype

24 Aplikasi Ujian Online Di Stikmar Majene Dengan Metode Prototype

25 Aplikasi Website Sistem Informasi Dinas Lingkungan Hidup Dan Kebersihan Kabupaten Majene

26 Aplikasi Penjadwalan Aktivitas Pimpinan Pemerintah Kabupaten Polewali Mandar Dengan


Pendekatan Agile Driven

27 Pemodelan Sistem Informasi Tracer Studi Berdasarkan Metode Agile Studi Kasus Program Studi
Teknik Informatika Unsulbar

28 Sistem Informasi layanan Rumah Sewa di kabupaten majene Berbasis Waeb Dengan Pendekatan
Prototype

29 Sistem Informasi Pengelolaan Surat Masuk dan Surat Keluar pada Dinas Satuan Polisi Pamong
Praja dan Perhubungan Masyarakat
93

No Data Asli

30 Penerapan Metode Prototype Untuk Pengembangan Sistem Informasi Penjadwalan Kuliah Dan
Nilai Pada Program Studi Informatika Di Universitas Sulawesi Barat

31 Implementasi Ensiklopedia Mandar Berbasis Website Menggunakan Algoritma Levenshtein


Distance

32 SISTEM PAKAR DIAGNOSA PENYAKIT GIGI PADA MANUSIA MENGGUNAKAN


METODE LOGIKA FUZZY

33 PENERAPAN ALGORITMA C45 UNTUK MENENTUKAN KETERSEDIAAN BARANG (


STUDI KASUS TOKO ATK)

34 PENERAPAN CLUSTERING K-MEANS DALAM PEMETAAN KUNJUNGAN WISATA DI


KABUPATEN MAJENE

35 IMPLEMENTASI METODE FUZZY MULTI CRITERIA DECISION MAKING SEBAGAI


KLASIFIKASI KELUARGA MISKIN (STUDI KASUS : DESA TOTOLISI SENDANA)

36 Implementasi Data Mining Menggunakan Algoritma Apriori Untuk Mengetahui Pola Pembelian
Konsumen Obat Pada Data Transaksi Penjualan Di Apotek Rahma

37 IMPLEMENTASI DATA MINING UNTUK MENENTUKAN PENJUALAN MOTOR


DENGAN METODE K-MEANS CLUSTERING

38 Perbandingan Algoritma Genetika dan Ant Colony Optimization pada Penyelesaian Travelling
Salesman Problem

39 perhitungan bibit ikan bandeng berdasarkan citra biner berbasis android di kel. baurung kab.
majene

40 Rekomendasi makanan pendamping ASI untuk bayi menggunakan algoritma naive bayes
berdasarkan kebutuhan kalori

41 IMPLEMENTASI GEOGRAPHIC INFORMATION SYSTEM (GIS) DALAM PENENTUAN


LOKASI DAN FASILITAS PERUMAHAN DI WILAYAH KABUPATEN MAJENE
MENGGUNAKAN MODEL WATERFALL DAN ALGORITMA AHP

42 IMPLEMENTASI METODE TEMPLATE MATCHING DALAM MENDETEKSI WAJAH


MENGGUNAKAN MASKER

43 Klasifikasi Kualitas Gula Aren dengan Citra Digital Menggunakan K-Nearest Neighbor (K-NN)

44 PERBANDINGAN KINERJA ALGORITMA SPIDER MONKEY OPTIMIZATION DAN


GENETIKA UNTUK MENYELESAIKAN TRAVELLING SALESMAN PROBLEM

45 Implementasi Algoritma Naive Bayes Untuk Mengukur Tingkat Keefektifan Dan Kepuasan Publik
Sistem Belajar Daring Di Masa Pandemi Covid-19

46 SISTEM PENDUKUNG KEPUTUSAN PREDIKSI KELULUSAN MAHASISWA


MENGGUNAKAN METODE NAIVE BAYES
94

No Data Asli

47 DIAGNOSA HAMA DAN PENYAKIT PADA TANAMAN PADI MENGGUNAKAN


METODE CERTAINTY FACTOR BERBASIS ANDROID

48 IMPLEMENTASI ALGORITMA FP-GROWTH DAN ASSOCIATION RULE UNTUK


MEMPREDIKSI KETERSEDIAAN PANGAN

49 Penerapan Algoritma Naive Bayes Dalam Memprediksi Persediaan Bahan Baku Mebel

50 IMPLEMENTASI ALGORITMA BOYER-MOORE PADA PERANCANGAN KAMUS


BAHASA KHAS DAERAH MAMASA

51 OPTIMASI JUDUL PENELITIAN MENGGUNAKAN KLASIFIKASI ALGORITMA NAIVE


BAYES BAGI MAHASISWA TEKNIK INFORMATIKA

52 Sistem Diagnosa Penyakit Diabetes Mellitus Menggunakan Metode Certainty Factor Dan Fuzzy
Logic Berbasis Web

53 Sistem pendukung keputusan penerima bantuan bencana alam menggunakan metode topsis

54 Sistem Pendukung Keputusan Pencarian Kos-Kosan Untuk Mahasiswa di Majene Menggunakan


Metode Analityc Network Process(ANP

55 IMPEMENTASI SISTEM PAKAR DALAM KLASIFIKASI KEPRIBADIAN


MENGGUNAKAN FORWARD CHAINING

56 Sistem Pendukung Keputusan Pendistribusian Logistic Secara Merata Pasca Bencana Alam
Menggunakan Metode Weighted Product (WP)

57 Sistem Pakar Diagnosa Penyakit Hepatitis Menggunakan Metode Certainty Factor Berbasis Web

58 MONITORING SLOT PARKIRAN SECARA REALTIME MENGGUNAKAN METODE


STRUCTURAL SIMILARITY INDEX (SSIM) SECARA REALTIME

59 ANALISIS KEAMANAN JARINGAN DENGAN FIREWALL FILTER BERBASIS MIKROTIK


DI SEKOLAH MENEGENGAH KEJURUAN NEGERI LABUANG

60 Rancangan Otomatis Splinker Pada Tanaman Jagung Menggunakan Teknik PWM Berbasis
Arduino

61 Sistem Pemantau Kondisi Air Sungai Berbasis IoT

62 Pengembangan Sistem Alat Pendeteksi Kebocora n Pipa Tanaman Hidroponik Menggunakan


Sensor Water Flow

63 Desain dan Pengembangan Sistem Otomasi Vertical Hydroponic Berbasis IoT

64 Sistem Deteksi Kebakaran Berbasis IOT Menggunakan Aplikasi Telegram

65 Perancangan sistem keamanan Smarthome Berbasis IoT Menggunakan Google Assistant


95

No Data Asli

66 PROTOPTYPE PENGAIRAN SAWAH DAN MONITORING KUALITAS PH TANAH


BERBASIS IOT

67 Perancangan Sistem Keuangan Sekolah Berbasis Web pada SMP Negeri 4 Malunda

68 SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT LAMBUNG MENGGUNAKAN


METODE DAMPSTER SHATER

69 Budidaya Kangkung Menggunakan Sistem Aeroponik Berbasis Arduino

70 Perancangan sistem monitoring penggunaan air perusahaan daerah air minum berbasis website
menggunakan Arduino Uno dan komunikasi lora

71 Penerapan Fitur Koreksi Kesalahan Ejaan Bahasa Indonesia Pada Media Tulis Artikel Muslimah
Malaqbiq Community Menggunakan Metode Smoothing Jelinek -Mercer

72 IMPLEMENTASI CONVOLUTIONAL NEURAL NETWORK (CNN) UNTUK


PENGHITUNGAN JUMLAH BENIH IKAN MAS

73 Perancangan Program Penghitung Kendaraan Dan Sistem Kendali Otomatis Lampu Lalu Lintas
Menggunakan Metode Multiple Object Tracking

74 Sistem Pendeteksi Dan Pengusir Hama Pada Buah Kakao Menggunakan Mikrokontroler Arduino
Uno Berbasis Web

75 Penerapan Sistem Monitoring Perkuliahan Mahasiswa Menggunakan Fingerprint Solution X105


(Studi Kasus: Program Studi Teknik Informatika Universitas Sulawesi Barat)

76 Prototype Alat Pendeteksi Hama Pada Tanaman Jagung Menggunakan Mp3 DFPlayer Dan
Mikrokontroler

77 PERBANDINGAN CASE BASED REASONING DAN RULE BASED REASONING UNTUK


PENGEMBANGAN RECOMENDER SYSTEM KELAYAKAN PEMBERIAN PINJAMAN
KOPERASI

78 MULTIPLE OBJECTIVE OPTIMIZATION DALAM SOFTWARE PROJECT SCHEDULING


PROBLEM (SPSP) MENGGUNAKAN EVOLUTIONARY ALGORITHM

79 PEMODELAN RANCANGAN SISTEM INFORMASI TRACER STUDI BERDASARKAN


METODE AGILE STUDI KASUS: PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS SULAWESI BARAT

80 Deteksi Wajah Dengan Metode Local binary pattern histogram Pada OpenCV Menggunakan
Pemrograman Python

81 Aplikasi Pembelajaran Sistem Operasi Dasar Berbasis Multimedia

82 Analisis Elektabilitas Tokoh Publik Majene Pada Berita Online Menggunakan Text Mining

83 Sistem Informasi Layanan Rumah Sewa di Majene Berbasis Web dengan Pendekatan Metode
96

No Data Asli

Prototype

84 Sistem Monitoring Denyut Nadi Pada Pasien Di Puskesmas Banggae Majene Menggunakan Pulse
Sensor

85 PERANCANGAN SISTEM PENDETEKSIAN WAJAH DENGAN MEMAKAI MASKER DAN


TIDAK MEMAKAI MASKER MENGGUNAKAN METODE EIGENFACE

86 Sistem komunikasi wireless jarak jauh dan berdaya rendah menggunakan modul komunikasi LoRa
dstudi kasus rompon nelayan di kab majene

87 pengembangan website layanan algoritma data mining yang terintegrasi dengan aplikasi mobile
menggunakan metode REST API

88 SISTEM PEMBAGIAN WARISAN ISLAM DENGAN METODE FORWARD CHAINING

89 Analisis sentimen kelangkaan minyak goreng pada media Instagram

90 Implementasi metode forward chaining dalam sistem pakar untuk mendiagnosa penyakit
kandungan

91 Pengolahan citra pemilihan size udang vaname mengguna kan algoritma naive bayes

92 Penerapan Sistem Informasi Geografis Untuk Pemetaan Golongan Darah Pendonor Menggunakan
Metode K-Means Clustering Studi Kasus : UTD Kabupaten Polewali Mandar

93 SISTEM PENDUKUNG KEPUTUSAN PENENTUAN JENIS TANAH TERBAIK BAGI


TANAMAN PORANG MENGGUNAKAN METODE ANALYTICAL HIERARCHY PROCESS
(AHP)

94 KLASIFIKASI CITRA TINGKAT KEMATANGAN BIJI KOPI SANGRAI MENGGUNAKAN


LINEAR DISCRIMINANT ANALYSIS ( LDA )

95 SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT LAMBUNG MENGGUNAKAN


METODE DAMPSTER SHATER

96 IMPLEMENTASI ALGORITMA DJISKTRA DI E-WARUNG DALAM PENENTUAN JALUR


TERPENDEK PENGANTARAN MAKANAN

97 PERANCANGAN SISTEM PAKAR BERBASIS WEB UNTUK MENDIAGNOSA PENYAKIT


MENULAR DENGAN METODE BACKWARD DAN FORWARD CHAINING

98 PENERAPAN SMART ROOM BERBASIS INTERNET OF THINGS PADA PROGRAM


STUDI INFORMATIKA UNIVERSITAS SULAWESI BARAT

99 PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN KENAIKAN PANGKAT


MENGGUNAKAN METODE FUZZY MULTI-CRITERIA DECISION DI UNIVERSITAS
SULAWESI BARAT

100 sistem pendukung keputusan pemilihan skincare menggunakan algoritma smart


97

Anda mungkin juga menyukai