Jurnal Vol 4 Jtmi 2018

ISSN (print):1693-6604
ISSN (on-line):2580-8044
Jurnal Teknologi dan Manajemen Informatika
Jurnal Teknologi dan Manajemen Informatika adalah publikasi ilmiah dari Fakultas
Teknologi Informasi Universitas Merdeka Malang berupa artikel yang diterbitkan secara
berkala dan berkesinambungan. Publikasi ilmiah ini dimaksudkan sebagai wadah
pertukaran gagasan, telaah dan hasil-hasil penelitian dan pengembangan keilmuan di
bidang ilmu komputer yang mencakup teknologi informasi, sistem informasi, dan
manajemen informatika. Jurnal Teknologi dan Manajemen Informatika ini mempublikasikan
karya ilmiah hasil penelitian dari kalangan ahli, akademisi maupun praktisi di bidang
komputer. Artikel yang dipublikasiakan telah melalui proses review dan penyuntingan
oleh penerbit tanpa mengubah substansi artikel. Tulisan yang dipublikasikan
merupakan tanggung jawab pribadi penulis dan bukan mencerminkan pendapat
penerbit.
Jurnal Teknologi dan Manajemen Informatika terbit dua kali dalam setahun, yaitu Bulan
Januari dan Juli. Terbit pertama Juni 2015.
Alamat:
Fakultas Teknologi Informasi Universitas Merdeka Malang
Jl. Terusan Raya Dieng No. 62-64 Malang, 65146
Telp.: 0341-568395 Psw. 500
E-mail: jurnal.fti@unmer.ac.id
http://jurnal.unmer.ac.id/index.php/jtmi
Teknologi dan
Manajemen Informatika
Volume 4, Nomor 1, Tahun 2018
ISSN (print):1693-6604
ISSN (on-line):2580-8044
JURNAL
TEKNOLOGI DAN MANAJEMEN INFORMATIKA
FAKULTAS TEKNOLOGI INFORMASI

UNIVERSITAS MERDEKA MALANG
Jl. Terusan Raya Dieng No. 62-64 Malang-65146
Telp. 0341 566462, 0341 568395 Psw. 657
E-mail: jm_tmi@unmer.ac.id
http://jurnal.unmer.ac.id/index.php/jtmi/
Teknologi dan
Penanggung Jawab
Dekan Fakultas Teknologi Informasi
Ketua Penyunting
Dr. Mardiana Andarwati, S.E., M.Si., Universitas Merdeka Malang
Penyunting Pelaksana
Devita Maulina Putri, S.ST., M.Pd., Universitas Merdeka Malang
Kukuh Yudhistira, S.Kom., M.Kom., Universitas Merdeka Malang
Bambang Nurdewanto, S.Kom., M.Kom., Universitas Merdeka Malang
Drs. Anis Zubair, M.Kom., Universitas Merdeka Malang
Ronald David MAngero, S.Kom., M.Kom., Universitas Merdeka Malang
Aditya Galih Pramaditya, S.Kom., M.Kom., Universitas Merdeka Malang
Ahmad Rofiqul Muslikh, S.Kom., M.Kom., Universitas Merdeka Malang
Penyunting Ahli
Prof. Ir. Agus Suprapto, M.Sc., PhD., Universitas Merdeka Malang
Prof. Dr. Grahita Chandrarin, SE., MSi Ak.CA., Universitas Merdeka Malang
Dr. Boge Triatmanto, Universitas Merdeka Malang
Prof. Ir. Respati Wikantiyoso, MSA., Ph. D., Universitas Merdeka Malang
Reviewer
Prof. Ir. M.Sc., P.hD Arif Djunaidy, Institut Teknologi Sepuluh November Surabaya,
Indonesia
Dr. ST., MT Apol Pribadi Subriadi, Institut Teknologi Sepuluh November Surabaya,
Indonesia
Dr. Eng, ST., MT Anik Nur Handayani, (SCOPUS ID: 57193701633), Universitas
Negeri Malang
Dr.Eng, ST., MT Rosa Andrie Asmara, (SCOPUS ID: 55315476100), Politeknik
Negeri Malang, Indonesia
Syaiful Anam, S.Si., MT., P.hD (SCOPUS ID: 55702010900), Universitas
Brawijaya, Indonesia
Aji Prasetya Wibawa, ST., MMT., P.hD (SCOPUS ID: 56012410400), Universitas
Negeri Malang, Indonesia
Dr. S.Si., M.Kom Kiswara Agung Santoso, Universitas Jember, Indonesia
Saide Saide, S.Kom., M.Kom., M.I.M (SCOPUS ID: 57188873069), Universitas
Islam Negeri Sultan Syarif Kasim Riau, Indonesia
Haviluddin Haviluddin, S.Kom., M.Kom., P.hD., Universitas Mulawarman
Syahroni Wahyu Iriananda, S.Kom, MT., Universitas Widyagama Malang,
Indonesia
Redaksi menerima kiriman artikel yang relevan dengan pengembangan ilmu

dibidang computer. Tulisan harus asIi bukan plagiat. Artikel merupakan hasil
penelitian, gagasan atau pemikiran ilmiah dengan disertai acuan/pustaka
sebagaimana kaedah penulisan ilmiah. Tulisan belum pernah diplubikasikan
pada jurnal ilmiah yang lain. Tulisan akan akan dilakukan blind review oleh
reviewer.
Teknologi dan
DAFTAR ISI
Penerapan Metode SDLC Waterfall Dalam Pembuatan........................... 184-191
Sistem Informasi Akademik Berbasis Web Studi Kasus Pondok
Pesantren Al-Habi Sholeh Kabupaten Kubu Raya, Kalimantan Barat
Yoki Firmansyah, Udi
Perbandingan Algoritma Nazief & Adriani Dengan................................ 192-195
Algoritma Idris Untuk Pencarian Kata Dasar
Adhi Prasidhatama, Kristien Margi Suryaningrum
Aplikasi Pengelompokan Pelanggan Pada Ums Store.............................. 196-203
Menggunakan Algoritma K-Means
Muhammad Abdul Ghofar, Yogiek Indra Kurniawan
Implementasi Data Mining Dengan Algoritma Apriori Untuk................ 204-209
Memprediksi Tingkat Kelulusan Mahasiswa
Irham Kurnawan, Fitri Marisa, Dwi Purnomo
Aplikasi Klasifikasi Penerima Kartu Indonesia Sehat............................... 210-216

Menggunakan Algoritma Naïve Bayes Classifier
Aziz Abdul Rahman, Yogiek Kurniawan
Aplikasi Klasifikasi Penentuan Pengajuan Kartu Kredit.......................... 217-223

Menggunakan Metode Naive Bayes Di Bank Bni Syariah Surabaya
Monika Antaristi, Yogiek Indra Kurniawan
Aplikasi Prediksi Kelayakan Calon Anggota Kredit Menggunakan...... 224-231
Algoritma Naïve Bayes
Diky Alfian Kurniawan, Yogiek Indra Kurniawan
Penerapan Metode SDLC Waterfall Dalam Pembuatan Sistem Informasi Akademik
Berbasis Web Studi Kasus Pondok Pesantren Al-Habi Sholeh Kabupaten Kubu Raya,
Kalimantan Barat
Yoki Firmansyah [1],Udi[2]

yoki.yry@bsi.ac.id[1] , udi1608@bsi.ac.id [2]
Program Studi Manajemen Informatika, AMIK BSI Pontianak[1] [2]
Abstract
Academic Information System is one of the information that is needed by educational institutions as one As
reference for the development and achievement of teaching and learning activities. Academic information sys-
tems can also spur teachers to be more transparent in delivering learning outcomes to students and also spur
students in improving learning outcomes, so that has more meaning as a communication between teachers and
students. This system will also spur all to know the development of boarding school because the existing infor-
mation system at Al-habib Pondok Pesantren Sholeh Bin Alwi Alhaddad, Currently, Alhabib use the manual
system to data processor ex stundents, assessment and processing of academic information. With the existence
of this academic information system it will facilitate the admin to provide academic information, facilitate the
teacher in providing assessments of students didiknya more easily and transparently, facilitate students and
parents learn mngetahui student development. The website also has feature facilitate all obtain information
relating to boarding school and will further spur all in using the internet by accessing the academic website of
Pesantren Al-habib sholeh Bin Alwi Al-haddad.
Keywords: Pembuatan Sistem Akademik, Pesantren Al-habib Sholeh, Berbasis Web
1. PENDAHULUAN pengelolaan manajemen lembaga dan untuk

Pada saat ini Teknologi Informasi mengalami pengambilan keputusan Dan untuk menghindari atau
perkembangan yang sangat cepat. Tidak sedikit meminimalisasi terjadinya kesalahan yang di
orang menggunakan aplikasi sebagai alat bantu dalamnya mencakup aspek-aspek pelayanan
dalam pengambilan keputusan dan aplikasi tersebut sehingga dapat memberiakan informasi-informasi
digunakan sebagai bahan untuk memperoleh hasil yang dibutuhkan.
pencarian dari suatu pokok permsalahan. diharapkan Berdasarkan latar belakang yang terjadi di
hasilnya akan memeberikan solusi serta mengambil Madrasah Aliyah Pondok Pesantren Al Habib
keputusan dengan tepat. Pada lembaga pendidikan Sholeh Bin Alwi Al haddad yang telah dijelaskan
yang penerapan sistem informasi akademik dapat sebelumnya penulis berusaha menerapkan Informasi
meningkatkan performa kegiatan akademik, akademik, dimana sebuah sistem yang di rancang
dikarenakan penerapan sistem informasi dapat untuk keperluan pengolaan data akademik Madrasah
memperoleh informasi yang cepat dan tepat pada Aliyah Pondok Pesantren Al Habib Sholeh Bin Alwi
saat dibutuhkan. Informasi akademik di rancang Al haddad dengan penerapan teknaologi komputer.
untuk keperluan pengolahan data akademik dengan Sehingga seluruh proses kegiatan akademik dapat
penerapan teknaologi komputer. Sehingga seluruh dikelola menjadi informasi yang bermanfaat dalam
proses kegiatan akademik dapat dikelola menjadi pengelolaan manajemen.
informasi yang bermanfaat. Dengan demikian dilihat dari masalah seperti
Selama ini dalam segala pengarsipan terutama yang di jelaskan diatas penulis mengambil judul
pada Madrasah Aliyah Pondok Pesantren Al Habib “Pembuatan Sistem Informasi Akademik Berbasis
Sholeh Bin Alwi Al haddad masih menggunakan Web Pada Pondok Pesantren Al-habib Sholeh Bin
pencatatan buku maupun kertas yang di simpan pada Alwi Al-haddad Kec. Sungai Ambawang Kabupaten
buku induk seperti untuk menyimpan Data Guru, Kubu Raya.”
Santri Dan Nilai, Yang Mengakibatkan Data yang
berupa kertas dapat berakibat terjadinya pencatatan 1.2. Rumusan Masalah
yang berulang, kerusakan seperti berkas hilang atau - Bagaimana membuat sistem informasi akademik
pun rusak. begitu juga dalam hal informasi berbasis web pada Pondok Pesantren Al habib
akademik masih terbatas seperti informasi akademik Sholeh Bin Alwi Alhaddad dengan mengikuti
yang di terapkan masih mengunakan kertas. metodologi SDLC Waterwall
Informasi akademik adalah sebuah sistem yang - Bagaimana melaksanakan proses pengolahan
di rancang untuk keperluan pengolaan data data siswa, guru, nilai dan informasi akademik
akademik dengan penerapan teknaologi komputer. - Bagaimana memberikan informasi terhadap
Sehingga seluruh proses kegiatan akademik dapat orang tua dan untuk umum tentang kegiatan yang
dikelola menjadi informasi yang bermanfaat dalam di lakukan lembaga.
Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Yoki Firmansyah,Udi (2018) 184-191 185
1.4. Maksud dan Tujuan nangani database, MySQL adalah database Server
Adapun maksud dan tujuan adalah sebagai yang sangat populer dan banyak digunakan untuk
berikut; menangani data yang disajikan di halaman web.”
- Mempelajari dan menerapkan sistem Menurut Sibero (2013:112) “cascading style
terkomputerisasi dalam pengolahan data guru, sheet” dikembangkan untuk menata gaya pengaturan
siswa, nilai, dan informasi pada madrasah aliyah halaman web. terdiri dari Selector properti dan nilai
pondok pesantren Al Habib Sholeh Bin Alwi Al seperti halnya HTML atau PHP dan bahasa pemo-
Haddad yang selama ini masih menggunakan graman lainnya.”
pencatatan yang di simpan ke buku induk dan
seringnya pencatan data yang berulang 2.3 Sistem Informasi Akademik
- Kesulitan dalam hal penyampaian informasi Menurut Prasojo dan Riyanto (2011:152)
perkembangan siswa kepada orang tua siswa. Sistem adalah elemen-elemen yang terintegrasi dan
- Memberikan wadah komunikasi santri dan orang saling berhubungan untuk mencapai suatu tujuan
tua santri tentang informasi dan kegiatan santri. yang diinginkan
- Dapat memberikan solusi yang lebih baik dari Menurut Pratama (2014:9) “informasi adalah
setiap permasalahan yang dialami Madrasah merupakan hasil pengolahan data dari satu atau
Aliyah Pondok Pesantren Al Habib Sholeh Bin berbagai sumber yang kemudian diolah, sehingga
Alwi Al Haddad. memberikan nilai, arti dan manfaat.” Sedangkan
menurut Kadir dan Triwahyuni(2013:384)
1.5. Ruang Lingkup “informasi merupakan salah satu sumber daya
Bersadarkan Rumusan Masalah yang telah penting dalam suatu organisai dalam pengambilan
penulois identifikasi maka didapatlah ruang lingkup keputusan”
pada penelitian ini yaitu hanya membahas Menurut Agus Saputra (2012:11) “Sistem
pemograman Web Sistem Informasi Akademik yang Akademik merupakan sistem yang diciptakan dan
menggunakan metodologi waterfall Meliputi digunakan untuk memenuhi kebutuhan manajemen
Pendataan Guru, Pendataan Santri, Pendataan Nilai kampus.” sistem informasi akademik adalah
Dan Informasi Akademik pada Madrasah Aliyah perangkat lunak yang digunakan untuk menyajikan
Pondok Pesantren Al Habib Sholeh Bin Alwi Al informasi dan penata administrasi yang berhubungan
haddad. Yang dimana Sistem ini hanya dapat dengan penggunaan perangkat lunak seperti kegiatan
gunakan oleh Admin, Guru, wali kelas MA dan administrasi akademik dapat dikelola dengan baik
Santri MA. Tetapi Sistem informasi akademik ini dan informasi yang di perlukan dapat diperoleh
tidak di kususkan untuk MI dan MTs. dengan mudah dan cepat (Satoto, 2008)
2. TINJAUAN PUSTAKA 2.4 Model Pengembangan Waterfall

2.1 Internet Model Waterfall merupakan salah satu model
Menurut Irawan (2011:2) mengemukakan pengembangan perangkat lunak yang ada di dalam
bahwa “Internet merupakan kependekan dari kta model SDLC (Sequencial Development Life Cycle).
Internetwork yang berarti rangkaian Komputer yang Menurut Sukamto dan Shalahuddin (2013:26)
terhubung menjadi beberapa rangkaian jaringan. mengemukakan bahwa “ SDLC atau Software De-
Sedangkan Menurut Arief (2011:7) mengemukakan velopment Life Cycle atau sering disebut juga System
bahwa “Web adalah salah satu aplikasi yang berisi- Development Life Cycle adalah proses mengem-
kan dokumen-dokumen multimedia (teks, gambar, bangkan atau mengubah suatu sistem perangkat lu-
suara, animasi,video) di dalamnya yang nak dengan menggunakan model-model dan metod-
menggunakan protokol HTTP (hypertext transfer ologi yang digunakan orang untuk mengembangkan
protocol) dan untuk mengaksesnya menggunakan sistem-sistem perangkat lunak sebelumnya, ber-
perangkat lunak yang disebut browser”. Sedangkan dasarkan best practice atau cara-cara yang sudah
Menurut Dipraja (2013:10) mengemukakan bahwa teruji baik.”
“web page (halaman web) adalah sebuah halaman Sedangkan Sukamto dan Shalahuddin
khusus dari situs web tertentu, sedangkan homepage (2013:28) di jelaskan bahwa model waterfall sering
adalah sampul halaman yang berisi daftar isi atau juga disebut model sekuensi linear atau alur hidup
menu dari sebuah situs web.” klasik. Pengembangan sistem dikerjakan secara
Menurut Simarmata (2010:148) Mendefinisi- terurut mulai dari analisis, desain, pengkodean,
kan bahwa “PHP (Hypertext Preprocessor) adalah pengujian dan tahap pendukung.
PHP mengijinkan pengembang untuk menempelkan 3. METODOLOGI
kode didalam HTML dengan menggunakan bahasa Terdapat beberapa metode yang digunakan dalam
yang sama seperti perl dan UNIX shells.” melakukan penelitian ini, diantaranya yaitu :
Menurut Kadir Dan Triwahyuni (2013:321) a. Metode Penulisan
“HTML adalah bahasa markah yang digunakan Pada penelitian ini penulis menggunakan metode
untuk menyusun halaman Web”. penulisa yang bersifat deskriptif dimana dalam
Menurut Kadir (2013:15) mengemukakan penulisan desktiptif hasil dari penelitian di tuliskan
bahwa “MySQL adalah nama database server, data- secara jelas dan mendeskripsikan inti dari penulisan
base server adalah server yang berfungsi untuk me- b. Metode Pengembangan Perangkat Lunak

Pada penelitian ini selain menggunakan metode - Admin membutuhkan Username dan Password
penulisan, penulis juga menggunakan metode untuk bisa Login.
pengembangan perangkat lunak untuk mengem- - Menambahkan Admin, Untuk menambahkan
bangkan Sistem Informasi Akademik berbasis Web data admin user membutuhkan Nama Admin,
Ini, adapun metode yang digunakan adalah SDLC Username, Password dan Foto untuk di simpan
Waterfall yang disadur dari buku Sukamto dan ke database.
Shalahuddin tahun 2013. Adapun penjelasan dari - Menambahkan Data guru, Untuk menambahkan
metode ini adalah sebagai berikut : data Guru user membutuhkan kode guru, Nip,
nama guru, jenis kelamin, Alamat, telepon,
status, foto, password dan mata pelajaran yang
di ambil agar bisa di simpan ke database.
Sistem/Rekayasa - Menambahkan Data wali kelas, Untuk
Informasi
menambahkan data wali kelas user
Analisis Desain Pengodean Pengujian
membutuhkan nama guru, kelas, username dan
password agar bisa di simpan ke database.
- Menambahkan Data siswa, Untuk
menambahkan data siswa user membutuhkan
Sumber :Sukamto dan Shalahuddin (2013:29) kode siswa, nama siswa, nis, nik, jenis kelamin,
Gambar 1. Kerangka Penelitian tempat lahir, tanggal lahir, alamat siswa, no
telpon, foto, nama ayah, nama ibu, alamat ortu,
- Analisis pekerjaan ayah, pekerjaan ibu, no telpon, nama
- Dalam tahap ini penulis mulai menganalisa apa wali dan alamat wali agar bisa di simpan ke
saja kebutuhan dari system, mulai dari kebutuhan database.
fungsional system maupun kebutuhan non - Menambahkan Data Mata Pelajaran, Untuk
fungsional dari sistem menambahkan data mata pelajaran admin
- Desain membutuhkan kode pelajaran, nama pelajaran,
Tahap desain merupakan tahapan lanjut dari kelas dan keterangan agar bisa di simpan ke
tahap analisis dimana dalam tahap ini disajikan database.
desain desain dari aplikasi seperti desain antar - Membberikan Informasi Akademik, Saat admin
muka, dan desain data base yang akan diterapkan menambahkan informasi maka akan tampil
kedalam system Informasi Akademik yang akan nama admin sebagai penanggung jawab agar
dibuat dapat di simpan ke database dan akan di
- Pengkodean tampilkan kehalaman utama sistem akademik
Pada tahap ini penulis menerapkan desai data 2. Guru
base serta desain antar muka kedalam bahasa Untuk mengisi nilai siswa Guru harus login
pemrograman, dimana bahasa pemrograman terlebih dahulu, dengan menggunakan Username
yang dipakai adalah menggunakan bahasa PHP Dan Password yang teleh di perolehnya dari Admin
untuk website setelah itu guru akan masuk sistem kehalaman Guru,
- Pengujian yang di dalam halaman guru terdapat menu masukan
Tahap uji merupakan tahap akhir dalam metode nilai untuk mengisi nilai sesuai kebutuhan Guru.
waterfall dimana dalam tahap pengujian ini 3. Siswa
digunakan teknik pengujian blackbox testing Untuk mengetahui nilai dan informasi siswa
harus login terlebih dahulu menggunakan NIS
4. PEMBAHASAN sebagai Username dan Tanggal lahir sebagai
4.1. Tahap Analisis Kebutuhan Perangkat Lu- password agar dapat masuk ke sistem siswa, setelah
nak login siswa dapat melihat informasi yang dikirimkan
Dalam penelitian ini penulis akan membahas tentang oleh masing-masing wali kelas siswa dan siswa
Sistem Informasi Akademik Berbasis Web pada dapat melihat nilai masing mata pelajaran atau
Pondok Pesantren Alhabib Sholeh Bin Alwi seluruh mata pelajaran, siswa juga dapat mencetak
Alhaddad menggunakan metode SDLC Waterfall nilai siswa keseluruhan sesuai yang telah disediakan
dimana tahap pertamanya adalah tahap analisa, ada- sistem.
pun hasil analisa kebutuhan yang dilakukan yaitu 4. Wali Kelas
sebagai berikut : Untuk memasuki sistem wali kelas membutukan
- Kebutuhan Fungsional username dan pasword untuk dapat masuk ke
Tahap keutuhan fungsional ini di perlukan halaman wali kelas, setelah login wali kelas hanya
untuk mengindifikasi apa saja yang dibutuhkan dan dapat memberikan informasi yang dapat tampil di
di inginkan oleh pengguna dari Aplikasi Sistem setiap masing-masing halaman beranda siswa setelah
Informasi Akademik pada Pondok Pesantren Al- siswa melakukan login sesuai status wali kelas.
habib Sholeh in Alwi Al-haddad adapun kebutuhan - Kebutuhan Non Fungsional
Fungsional adalah sebagai berikut: Dalam Tahapan kebutuhan Non fungsional ini
1. Admin penulis mengindifikasi apa saja yang dibutuhkan
oleh pengguna untuk menjalankan Aplikasi Sistem

Informasi Akademik pada Pondok Pesantren Al- Tabel 1. Spesifikasi File Admin
Habib Sholeh in Alwi Al-haddad. No Elemen Data Nama Field Type Size Keterangan
1. Spesifikasi Perangkat Keras
1 Id_Admin Id_Admin Int 10 Primary Key
 Server
CPU Intel Core i3-5005U (2.0 GHz, 3 MB L3
Cache), RAM 4 GB, Harddisk 500 Gb, Mouse, 2 Nama_Admin Nama_Admin Varchar 25
Keyboard, Monitor Dengan Resolusi Layar Mini- 3 Username Username Varchar 25
mum 1366 X 768, Kecepatan Internet 1 Mbps 4 Password Password Varchar 50
 Client
CPU, Intel Core i3-5005U (2.0 GHz, 3 MB L3 5 Foto Foto Varchar 100
Cache), RAM 4 GB, Harddisk 500 GB, Mouse ,
Keyboard, Monitor Dengan Resolusi Layar Mini- - Spesifikasi File Guru
mum 1366 X 768, Kecepatan Internet 1 Mbps, Tabel 2. Spesifikasi File Guru
2. Spesifikasi Perangkat Lunak
 Server
Paket Hosting, Domain Ponpes-Alhaddad.Ac.Id,
Microsoft Windows 7, Google Chrome, Mozila Fire-
fox, Opera
 Client
Microsoft Windows 7, Google Chrome, Mozila
Firefox, Opera
4.2. Tahap Desain

a. ERD ((Entity Relationship Diagram)
- Spesifikasi File Siswa

Tabel 3. Spesifikasi File Siswa
Elemen data Nama Type Size Ket-
field erangan
Kode_siswa Kode_sisw Varchar 10 Primary
a key
Nis Nis Varchar 20
Nik Nik Varchar 20
Nama_siswa Na- Varchar 25
ma_siswa
Jenis_kelami Jenis_kela Char 1
n min
Tempat_lahir Tem- Varchar 25
pat_lahir
Tanggal_lahir Tang- Date
gal_lahir
Alamat Alamat Text
No_telepon No_telepo Varchar 20
Gambar 2. ERD (Entity Relationship Diagram) n
b. LRS Kelas Kelas Int 1
Status_aktif Sta- Int 1
tus_aktif
Foto Foto Varchar 100
Nama_ayah Na- Varchar 25
ma_ayah
Nama_ibu Nama_ibu Varchar 25
Alamat_ortu Ala- Varchar 100
mat_ortu
Peker- Peker- Varchar 25
jaan_ibu jaan_ibu
No_telepon_ No_telepo Varchar 20
Gambar 3. LRS (Logical Relational Strukture) ortu n_ortu
Peker- Peker- Varchar 25
c. Desain Database jaan_ayah jaan_ayah
- Spesifikasi File Admin Nama_wali Na- Varchar 25
ma_wali

Alamat_wali Ala- Varchar 100 2 Id_wali_kela Id_wali_kela Var- 10 Foreign key

mat_wali s s char
Email Email Varchar 50 3 Tgl_informas Tgl_informas Date
i i
Ket- Ket- Text
4 Informasi Informasi Text 50
erangan_sisw erangan_s
a iswa
Tahun_ajaran Ta- Varchar 10
- Spesifikasi File Informasi
hun_ajara
n Tabel 8. Spesifikasi File Informasi
Id_admin Id_admin Int 10 No Elemen data Nama field Type Size Keterangan
1 Id_informasi Id_informasi Int 10 Primary key

- Spesifikasi File Nilai
Tabel 4. Spesifikasi File Nilai 2 Id_admin Id_admin Int 10 Foreign key
No Elemen data Nama field Type Si Ket- 3 Tgl_informasi Tgl_informasi Date
ze erangan
4 Informasi Informasi Text
1 Id Id Int 10 Primary key
2 Kode_pelajar Kode_pela- Var- 10 Foreign key
an jaran char 4.3. Tahap Implementasi
3 Kode_guru Kode_guru Var- 10 Foreign key - Implementasi Halaman Utama Sistem Informasi
char
4 Kode_siswa Kode_siswa Var- 10 Foreign key
Akademik
char
5 Kelas Kelas Int 1
6 Nilai_tugas1 Nilai_tu- Int 3
gas1
7 Nilai_tugas2 Nilai_tu- Int 3
gas2
8 Nilai_uts Nilai_uts Int 3
9 Nilai_uas Nilai_uas Int 3
10 Keterangan Keterangan Var- 50
char
11 Ta- Tahun_aja- Var- 10 Gambar 9. Implementasi Halaman Utama
hun_ajaran ran char Sistem Informasi Akademik
Halaman (page) pertama dalam website ini
adalah beranda, yang dimana dapat dilihat secara
- Spesifikasi File Pelajaran umum. Yang berisikan Sejarah Singkat, Informasi
Tabel 5. Spesifikasi File Pelajaran Pendaftaran, Informasi Akademik Dan Visi Misi
No Elemen data Nama field Type Siz Ket-
e erangan
Pondok Pesantren Alhabib Sholeh Bin Alwi
1 Kode_pelajar Kode_pelajar Varchar 10 Primary Alhaddad.
an an key
2 Na- Na- Varchar 25
ma_pelajara ma_pelajara
n n
3 Kelas Kelas Int 1
4 Keterangan Keterangan Varchar 50
5 Id_admin Id_admin Int 10
- Spesifikasi File Wali_Kelas

Tabel 6. Spesifikasi File Wali Kelas
No Elemen data Nama field Type Size Keterangan
1 Id_wali_kelas Id_wali_kelas Int 10 Primary key

2 Kode_guru Kode_guru Varchar 10 Foreign key
3 Kelas Kelas Int 1
4 Username Username Varchar 25
5 Password Password Varchar 50
6 Id_admin Id_admin Int 10
- Spesifikasi File Informasi_Wali_Kelas

Tabel 7. Spesifikasi File Informasi Wali kelas
No Elemen Data Nama Field Type Size Keterangan
1 Id_informasi Id_informasi Int 10 Primary Key

_wali_kelas _wali_kelas

- Implementasi Halaman Ruang Siswa
Halaman ruang siswa ini dapat di akses oleh
siswa yang memiliki Username dan passwoed yang
telah di peroleh melalui pendaftaran. Agar siswa
dapat melihat sistem informasi akademik dan nilai
siswa masing-masing.
Gambar 13. Implementasi Halaman Ruang

Admin
Gambar 10. Implementasi Halaman Ruang
Siswa 4.4. Tahap Pengujian
- Implementasi Halaman Ruang Utama Guru a. Halaman Login Admin
Halaman guru ini hanya dapat dilakukan oleh Pengujian ini dimaksudkan untuk menguji
guru yang telah terdaftar namanya pada data guru, apakah ketika admin salah memasukkan kode nik
ketika guru memasukan username dan password dan password bahkan sama sekali tidak diisi dan
dengan benar maka guru dapat masuk kedalam langsung melakukan proses login, maka sistem akan
website guru menampilkan pesan menolak masuk ke sistem. Se-
hingga tidak sembarang orang bisa masuk ke sys-
tem, dan setelah diuji dengan berbagai sekenario
maka halaman ini berjalan dengan baik
b. Pengujian Fungsional tambah Siswa
Pengujian ini dimaksudkan untuk menguji
apakah jika admin mengisi data siswa dan tidak
mengisi salah satu data yang tersedia atau tidak
mengisi semua data dan langsung melakukan proses,
maka sistem akan menampilkan pesan peringatan
untuk mengisi data yang masih kosong, sehingga
Gambar 11. data siswa harus lengkap diisi.
Implementasi Halaman Beranda Guru c. Pengujian Fungsional Tambah Informasi
Akademik
- Implementasi Halaman Ruang Wali Kelas Pengujian ini dimaksudkan untuk menguji
Halaman Ruang wali kelas ini hanya dapat apakah jika user mengisi data tambah informasi dan
dilakukan oleh guru yang telah menjadi wali kelas, tidak mengisi salah satu data yang tersedia atau tidak
untuk login masukan username dan password mengisi semua data dan langsung melakukan proses
dengan benar maka guru dapat masuk kedalam terbitkan, maka sistem akan menampilkan pesan
website guru. peringatan untuk mengisi data yang masih kosong,
sehingga data tambah informasi harus lengkap diisi.
d. Pengujian Fungsional Login Guru
apakah ketika guru salah memasukkan Nip dan
tanggal lahir bahkan sama sekali tidak diisi dan
langsung melakukan proses login, maka sistem akan
menampilkan pesan menolak masuk ke sistem. Se-
hingga tidak sembarang orang bisa masuk ke sistem
e. Pengujian Fungsional Masukan Nilai
Gambar 12.
apakah ketika guru memasukan nilai atau tidak diisi
Implementasi Halaman Ruang Wali Kelas
dan melakukan proses simpan, maka sistem akan
menampilkan peringatan untuk mengisi data yang
- Implementasi Halaman Login Admin
masih kosong, sehingga data nilai harus diisi.
Halaman login admin dapat di akses oleh admin
yang bertanggung jawab sepenuhnya atas sistem
informasi akademik pondok pesantren melalui
username dan password yang telah dimilkinya.

f. Pengujian Fungsional Login Wali Kelas Setelah penulis menyusun dan membuat suatu
Pengujian ini dimaksudkan untuk menguji sistem informasi akademik, penulis dapat
apakah ketika wali kelas salah memasukkan Nis dan mengetahui apa yang menjadi kelebihan dan
tanggal lahir bahkan sama sekali tidak diisi dan kekurangan dari sistem yang penulis buat. Adapun
langsung melakukan proses login, maka sistem akan saran yang dapat penulis sampaikan pada sistem
menampilkan pesan menolak masuk ke sistem. Se- informasi akademik pada Pondok Pesantren Al-
hingga tidak sembarang orang bisa masuk ke sistem habib Sholeh Bin Alwi Alhaddad, adalah sebagai
g. Pengujian Fungsional Tambah Informasi Wali berikut :
Kelas - Di harapakan program sistem inforasi akademik
Pengujian ini dimaksudkan untuk menguji yang telah dirancang dapat dikembangkan
apakah jika wali kelas mengisi data informasi dan kembali menjadi lebih sempurna dalam berbagai
tidak mengisi salah satu data yang tersedia atau tidak hal sperti desain dan tampilan program yang
mengisi semua data dan langsung melakukan proses dapat diperbaikai menjadi lebih bagus supaya
simpan, maka sistem akan menampilkan pesan user tidak jenuh dan agar sedikit lebih menarik.
peringatan untuk mengisi data yang masih kosong, - Diharapkan pihak sekolah dapat
sehingga data tambah informasiharus lengkap diisi. mengembangkan sistem informasi akademik
h. Pengujian Fungsional Login Siswa yang lebih kompleks seperti Penambahan SMS
Pengujian ini dimaksudkan untuk menguji Getway untuk memberikan informasi seputar
apakah ketika siswa salah memasukkan Nis dan kegiatan akademik kepada guru dan atau kepada
tanggal lahir bahkan sama sekali tidak diisi dan orang tua siswa,
langsung melakukan proses login, maka sistem akan - Di harapkan pihak sekolah Penambahan Ujian
menampilkan pesan menolak masuk ke sistem. Se- online pada sistem informasi akademik.
hingga tidak sembarang orang bisa masuk ke sistem. Layanan ini akan sangat berguna untuk
i. Pengujian Fungsional Profil Siswa menghemat sumber daya, seperti kertas dan
Pengujian ini dimaksudkan untuk menguji tenaga untuk melaksanan kegiatan ujian serta
apakah jika admin mengisi data siswa dan tidak menilai hasil ujian setiap peserta ujian (siswa).
mengisi salah satu data yang tersedia atau tidak - Di harapkan pihak pondok pesantren dapat
mengisi semua data dan langsung melakukan proses, mengembangkan sistem ini dengan menerapakn
maka sistem akan menampilkan pesan peringatan keseluruh sekolah sperti pada MI, MTs dan
untuk mengisi data yang masih kosong, sehingga seluruh sntri untuk pendataan.
data siswa harus lengkap diisi.
6. REFERENSI
5. KESIMPULAN DAN SARAN Sukamto,dan M. Shalahuddin. 2013. Rekayasa
5.1. Kesimpulan Perangkat Lunak Terstruktur Dan Berorientasi
Setelah melakukan analisa di Pondok Pesantren Objek. Bandung: Informatika.
Al-habib Sholeh Bin Alwi Alhaddad penulis
memcoba memeberikan solusi sebagai berikut: Evi, Holina., Dan Malabay. Analisis Pengembangan
- Metodologi SDLC waterfall sangat enak dipa- Aplikasi Web Untuk Profil Perusahaan, 2009
hami dan digunakan terutama dalam proses (Semnas If), (122-127).
pembuatan system Informasi Rizky, Soetam. Konsep Dasar Rekayasa Perangkat
- Dengan diterapkannya sistem informasi Lunak. Jakarta: Prestasi Pustaka, 2011.
akademik ini dapat membantu pengolahan data
sebelumnya menjadi terkomputerisasi. Simarmata, Janner. 2010. Rekayasa Perangkat Lu-
- Dengan adanya sistem informasi akademik ini nak. Yogyakarta: Cv. Andi Offset.
Proses pencarian data guru, data siswa, data
nilia dan informasi lebih efektif karna Irawan. 2011. Panduan Berinternet Untuk Orang
apenyimpanan data sudah dalam bentuk Awam. Palembang : Maxikom.
database.
- Dengan adanya sistem informasi akademik ini Saputra, Agus & Feni Agustin 2011. Pemograman
Pengambilan keputusan penilaian semakin cepat CSS Untuk Pemula. Mediakompotindo, Jakarta.
dan mudah karena sistem perhitungan penilaian
sudah otomatis dan sudah di sesuaikan dengan Priyadi, Yudi, 2013. Kolaborasi Sql Dan Erd Dalam
keputusan sekolah. Implementasi Database, Yogyakarta: Andi
- Dengan adanya sistem infrmasi akademik ini Yogyakarta.
Pihak siswa dan wali siswa dapat mengetahui
perkembangan nilai putranya dan informasi Pratama, I Putu Agus Eka. 2014. Sistem Informasi
pondok pesantren lebih mudah dan cepat Dan Inplementasi. Bandung: Informaitika
dengan mengakses website pondok Pesantren. Bandung.
5.2. Saran

Prasojo Diat, Lantip., Dan Riyanto. 2011. Teknologi

Informasi Pendidikan. Yogyakarta: Gava
Media.
Kadir, Abdul., Dan Triwahyuni Ch, Terra, 2013.

Pengantar Teknologi Informasi Edisi Revisi.
Yogyakarta: Andi.
Saputra Agus. 2012, Sistem Informasi Nilai

Akademik Untuk Panduan Skripsi.

Perbandingan Algoritma Nazief & Adriani
Dengan Algoritma Idris Untuk Pencarian Kata Dasar
𝐀𝐝𝐡𝐢 𝐏𝐫𝐚𝐬𝐢𝐝𝐡𝐚𝐭𝐚𝐦𝐚[𝟏], 𝐊𝐫𝐢𝐬𝐭𝐢𝐞𝐧 𝐌𝐚𝐫𝐠𝐢 𝐒𝐮𝐫𝐲𝐚𝐧𝐢𝐧𝐠𝐫𝐮𝐦[𝟐]
Teknik Informatika, Fakultas Teknik dan Desain, Universitas Bunda Mulia

email: aprasidatama@gmail.com
Teknik Informatika, Fakultas Teknik dan Desain, Universitas Bunda Mulia
email: ksuryaningrum@bundamulia.ac.id
Abstract
Stemming is a process used to search root words. Stemming can be implemented as
preprocessing in text processing. There are many stemming algorithms, one of them is Nazief &
Adriani and Idris. Nazief & Adriani algorithm is an algorithm created by Bobby Nazief and
Mirna Adriani to find the root word of Bahasa Indonesia. While the Idris algorithm is an
algorithm created by Norisma Idris to find the root words of Malay language. Indonesian and
Malay have similar language styles, so researchers want to find out whether the Idris algorithm
can be used as one of the Indonesian stemming algorithms. To know which algorithm is better,
then in this research will be explained about process speed and accuracy of result of each of
those algorithm. After knowing the result of comparison of stemming algorithm, hopefully can
help you in choosing which algorithm will be used for find root word of Bahasa Indonesia.
Keywords: Perbandingan, Nazief & Adriani, Idris, Stemming
1. PENDAHULUAN Setiono tahun 2002, Nazief & Adriani tahun 1996,

Ahmad Yusoff Sembok tahun 1996, Vega tahun 2001,
Komunikasi merupakan suatu proses dimana Idris tahun 2001 dan Enhanced Confix Stripping
seseorang atau beberapa orang menciptakan dan Stemmer tahun 2008.
menggunakan informasi agar terhubung dengan Mengetahui ada berbagai macam algoritma untuk
lingkungan dan orang lain. Komunikasi pada stemming bahasa Indonesia. Penulis memutuskan
umumnya dilakukan secara lisan atau verbal yang untuk mempersempit ruang penelitian ke algoritma
dapat dimengerti oleh kedua belah pihak. Dengan Nazief & Adriani dan algoritma Idris. Dikarenakan
adanya teknologi kita dapat berkomunikasi dengan algoritma Nazief & Adriani merupakan algoritma
satu dan lainnya dengan mudah. Namun tanpa stemming yang populer untuk memproses teks
disadari bahwa berkomunikasi langsung dengan berbahasa Indonesia, sedangkan algoritma Idris
sebuah program masih dianggap sulit. Dikarenakan sendiri kurang populer untuk stemming bahasa
oleh perbedaan bahasa maupun tatanan bahasanya itu Indonesia. Maka dari itu penilitian ini berjudul
sendiri. Sehingga program tidak dapat dengan mudah “Analisis Perbandingan Algoritma Nazief & Adriani
mengerti dari apa yang dimaksudkan oleh manusia. dengan Algoritma Idris untuk Pencarian Kata Dasar
Untuk mengerti apa yang dimaksud oleh manusia pada Teks Bahasa Indonesia Berbasis Website”. Pada
sebuah program harus memiliki beberapa kemampuan penelitian ini akan membahas mengenai cara kerja,
seperti text preprocessing, ekstraksi fitur, pencarian kelebihan & kekurangan, hingga hasil dari tiap
kata dasar, hingga pelatihan atau pembelajaran untuk algoritma yang akan dibandingkan.
mengembangkan pola pikirnya. Stemming merupakan
suatu proses untuk menemukan kata dasar dari sebuah Information retrievals System
kata dengan menghilangkan semua imbuhan (affixes) Information retrievals System atau sistem temu
baik yang terdiri dari awalan (prefixes), sisipan balik informasi merupakan bagian dari computer
(infixes), akhiran (suffixes) dan kombinasi dari awalan science tentang pengambilan informasi dari dokumen-
dan akhiran (confixes) pada kata turunan. Stemming dokumen yang didasarkan pada isi dan konteks dari
adalah inti dari teknik pemrosesan natural language dokumen-dokumen itu sendiri.[1] Informasi yang
untuk mendapatkan informasi kembali (Information diambil dapat berupa teks, gambar, audio, dan video
Retrieval) yang efektif dan efesien dan secara luas yang berguna untuk melakukan penyimpanan,
dapat diterima oleh pengguna (users). Stemming pencarian, dan pemeliharaan informasi.
digunakan untuk mengganti bentuk dari suatu kata
menjadi kata dasar dari kata tersebut yang sesuai Text preprocessing
dengan struktur morfologi bahasa Indonesia yang baik Text preprocessing berfungsi mengubah data
dan benar. Pada pencarian kata dasar (stemming) tekstual yang tidak terstruktur ke dalam data
khususnya bahasa Indonesia terdapat beberapa terstruktur dan disimpan dalam basis data. Tahap
algoritma seperti Jelita Asian tahun 2005, Arifin &

Adhi Prasidhatama, Kristien Margi Suryaningrum (2018) 192-195 193
preprocessing terdiri dari beberapa langkah yaitu : 6. Jika semua langkah telah selesai tetapi tidak juga
case floding, tokenization, filtering dan stemming.[5] berhasil maka kata awal diasumsikan sebagai
kata dasar lalu proses diakhiri.
Pada proses case floding karakter selain huruf
dihilangkan dan semua huruf diubah menjadi Algoritma Stemming Idris
lowercase. Tokenization adalah proses dimana sebuah Berikut tahapan-tahapan mengenai stemming
kalimat dipotong untuk menghasilkan kata-kata yang menggunakan algoritma Idris adalah sebagai
akan digunakan untuk proses selanjutnya. berikut.[4]
Pengambilan kata-kata penting dari hasil tokenization
merupakan proses yang dilakukan dalam filtering. 1. a. Kata yang belum di-stemming dicari pada
Proses filtering memiliki dua teknik yaitu stop list kamus umum atau Kamus Besar Bahasa
(membuang kata yang kurang penting) dan word list Indonesia (KBBI). Jika kata itu langsung
(menyimpan kata yang penting). Setelah mendapatkan ditemukan, berarti kata tersebut adalah kata
kata-kata yang dirasa penting, selanjutnya dilakukan dasar. Kata tersebut dikembalikan dan algoritma
proses stemming. Proses pada tahap stemming ialah dihentikan.
melakukan pengolahan dan pencarian kata dasar dari b. Kata yang belum di-stemming dicari pada
hasil filtering atau sekumpulan kata-kata yang sudah kamus lokal. Jika kata itu langsung ditemukan,
dianggap penting. berarti kata tersebut adalah kata dasar. Kata
tersebut dikembalikan dan algoritma dihentikan.
Algoritma Stemming Nazief & Adriani Kamus lokal digunakan karena algoritma Idris
Algoritma yang dibuat oleh Bobby Nazief dan dibuat untuk stemming bahasa melayu, yang
Mirna Adriani memiliki tahapan sebagai berikut.[2] dimana kamus lokal berisi kata-kata dasar
1. Cari kata yang akan distem dalam kamus. Jika bahasa melayu. Sedangkan stemming bahasa
ditemukan maka diasumsikan bahwa kata Indonesia tidak memerlukan kamus lokal.
tesebut adalah kata dasar. Maka algoritma 2. Menghilangkan turunan awalan. Langkah ini
berhenti. terus dilakukan sampai tidak ada lagi turunan
2. Infleksi akhiran (“-lah”, “-kah”, “-ku”, “-mu”, awalan. Jika tidak ada lagi, maka lanjutkan ke
atau “-nya”) dibuang. Jika berupa partikel (“- langkah berikutnya. Untuk beberapa kombinasi
lah”, “-kah”, “-tah” atau “-pun”) maka langkah imbuhan, dilakuan penghilangan awalan terlebih
ini diulangi lagi untuk menghapus kata ganti dahulu. Yaitu pada kombinasi imbuhan “ber-
posesif (“-ku”, “-mu”, atau “-nya”), jika ada. lah”, “ber-an”, “men-i”, “di-i”, “pe-i”, “ter-i”.
3. Hapus penurunan akhiran (“-i”, “-an” atau “- 3. Hilangkan ifleksi akhiran terlebih dahulu. Jika
kan”). Jika kata ditemukan di kamus, maka hal ini berhasil dan akhiran adalah partikel (“-
algoritma berhenti. Jika tidak maka ke langkah lah”, ”-pun” dan ”-kah”), langkah ini dilakukan
3a. lagi untuk menghilangkan kata ganti akhiran
a. Jika “-an” telah dihapus dan huruf terakhir posesif (“ku”, “mu” atau ”nya”).
dari kata tersebut adalah “-k”, maka “-k” 4. Hilangkan turunan akhiran. Langkah ini terus
juga ikut dihapus. Jika kata tersebut dilakukan sampai tidak ada lagi penurunan
ditemukan dalam kamus maka algoritma akhiran. Jika tidak ada lagi, maka lanjutkan ke
berhenti. Jika tidak ditemukan maka lakukan langkah berikutnya.
langkah 3b. 5. Setelah setiap penghilangan imbuhan dilakukan,
b. Akhiran yang dihapus (“-i”, “-an” atau “- maka lakukan pengecekan menggunakan kamus.
kan”) dikembalikan, lanjut ke langkah 4. Jika kata ditemukan, maka algoritma berhenti
4. Hapus penurunan awalan. Jika pada langkah 3 dan tidak perlu dilakukan pengecekan terhadap
ada akhiran yang dihapus maka pergi ke imbuhan lainnya. Jika sampai selesai
langkah 4a, jika tidak pergi ke langkah 4b. penghilangan imbuhan masih belum menemukan
a. Periksa tabel kombinasi awalan akhiran yang kata dasar, maka dilakukan recoding.
tidak diizinkan. Jika ditemukan maka 6. Jika semua langkah sudah dilakukan termasuk
algoritma berhenti, jika tidak pergi ke recoding dan tidak juga ditemukan dalam
langkah 4b. kamus, maka algoritma ini akan manganggap
b. Pada langkah ini dilakukan perulangan kata semula sebagai kata dasar.
sebanyak tiga kali. Tentukan tipe awalan
2. METODE PENELITIAN
kemudian hapus awalan. Jika kata dasar
belum juga ditemukan lakukan langkah 5,
Metode pengembangan sistem yang digunakan
jika sudah maka algoritma berhenti. Catatan:
adalah model watefall. Berikut merupakan jabaran
jika awalan kedua sama dengan awalan
mengenai metode pengembangan sistem model
pertama algoritma berhenti.
waterfall.[3]
5. Melakukan Recoding.
1. Analisis Kebutuhan
Dalam tahapan ini penulis menentukan
kebutuhan-kebutuhan pada sistem Analisa

Perbandingan Algoritma Nazief & Adriani dengan

Algoritma Idris untuk Pencarian Kata Dasar pada
Teks Bahasa Indonesia Berbasis Website baik itu
kebutuhan fungsional maupun kebutuhan non
fungsional.
2. Desain Sistem
Dalam tahapan desain sistem ini, penulis
membuat perancangan dari model atau desain sistem
dengan menggunakan beberapa alat bantu untuk
menggambarkan sistem berjalan ataupun sistem baru
yang akan dikembangkan secara logika. Untuk rincian
prosedur menggunakan flowchart sedangkan untuk
menggambarkan susunan logis antar data dan
hubungannya dengan sistem penulis menggunakan
Entity Relationship Diagram (ERD).
3. Implementasi dan Pengujian Unit
Pada tahap ini, penulis melakukan penerjemahan
desain yang telah dibuat ke dalam bentuk software
yang dirancang dengan bahasa pemrograman PHP dan
basis data menggunakan MySQL. Selanjutnya
melakukan pengujian terhadap program yang
dibangun per unit atau per modul kerja. Dimana
semua fungsi-fungsi software tersebut diuji cobakan,
agar software bebas dari error dan hasilnya harus Gambar 1. Laman masukkan pengujian
benar-benar sesuai dengan kebutuhan yang sudah Pada gambar 1 menampilkan bagaimana teks
didefinisikan sebelumnya. wacana dimasukkan untuk memulai pengujian.
4. Pengujian Sistem Setelah teks wacana selesai di masukkan. Penguji
Pada tahap ini program yang telah dibuat dan dapat memulai proses pengujian dengan menekan
diuji tiap unitnya kemudian disatukan menjadi suatu tombol submit.
sistem dan diuji secara keseluruhan berguna untuk
menguji tingkat integrasi antar unit yang dibuat
sebelumnya.
5. Maintenance atau Perawatan
Pada tahap ini program akan diawasi kinerja dan
hasil keluarannya. Jika terjadi sebuah kesalahan pada
saat program beoperasi atau hasil keluaran tidak
sesuai dengan yang diharapkan, maka akan dilakukan
perawatan yang berguna untuk memperbaiki program.
3. HASIL DAN PEMBAHASAN Gambar 2. Hasil stemming Nazief & Adriani
Objek pengujian untuk mengetahui kecepatan Pada gambar 2 menampilkan hasil dari
proses dan akurasi dari algoritma Nazief & Adriani pengolahan algoritma Nazief & Adriani. Atribut yang
dan Idris adalah berupa wacana berupa teks. Berikut ditampilkan pada hasil stemming Nazief & Adriani
merupakan tampilan dari laman masukkan pengujian berupa durasi pemrosesan, jumlah kata yang
dengan wacana berjudul “Legenda Danau Toba” dihasilkan, data kata dari hasil stemming, dan jumlah
dengan jumlah kata 520. kata salah. Jumlah kata salah merupakan jumlah dari
kata yang dihasilkan dari stemming namun tidak
sesuai dengan kata dasarnya.
Gambar 3. Hasil stemming Idris

Pada gambar 3 menampilkan hasil dari Harimau &

pengolahan algoritma Idris. Atribut yang ditampilkan Makan Adrian
Durian i
pada hasil stemming Idris berupa durasi pemrosesan, Legenda
jumlah kata yang dihasilkan, data kata dari hasil Harimau
8 639 Idris 8.24 88.22
stemming, dan jumlah kata salah. Jumlah kata salah Makan
merupakan jumlah dari kata yang dihasilkan dari Durian
Nazief
stemming namun tidak sesuai dengan kata dasarnya. Cinderal &
9 733 14.58 99.11
as Adrian
i
Cinderal
10 733 Idris 10.43 94.67
as
4. KESIMPULAN
Setelah dilakukan pengujian, maka diperoleh

kesimpulan sebagai berikut:
1. Algoritma stemming Idris memiliki waktu
pemrosesan yang lebih cepat dibandingkan
dengan algoritma stemming Nazief &
Adriani.
Gambar 4. Laman Rekap hasil Pengujan 2. Algoritma stemming Nazief & Adriani
Pada gambar 4 menampilkan rekap dari memiliki akurasi hasil yang lebih tinggi
pengujian yang telah dilakukan, seperti jumlah data dibandingkan dengan algoritma stemming
yang telah dimasukkan, total jumlah kata, hingga Idris.
kecepatan dan akurasi dari masing-masing algoritma.
Kecepatan didapatkan dari membagi jumlah waktu
5. REFERENSI
pemrosesan dengan jumlah kata. Sementara akurasi
didapatkan dari rata-rata hasil jumlah kata yang benar
[1] Hasanah, Nur. 2017. Sistem Pencarian Skripsi
dibagi dengan jumlah kata yang dimasukkan di awal.
Berbasis Information Retrieval di FASTIKOM
Berikut merupakan hasil pengujian yang telah
UNSIQ. Jurnal PPKM. 1 (1):105-113.
dilakukan terhadap 5 teks wacana berbeda.
[2] Nugroho, Hargyo Tri. 2017. Pengaruh Algoritma
Tabel 1. Hasil Pengujian Algoritma
Waktu
Stemming Nazief-Adriani Terhadap Kinerja
Nama Jumla Algorit Akurasi Algoritma Winnowing Untuk Mendeteksi
No proses
wacana h kata ma (%)
(detik) Plagiarisme Bahasa Indonesia. ULTIMA
Nazief Computing. 9 (1):36-40.
Legenda
& [3] Oktarino, Ade. 2015. Perancangan Sistem
1 Danau 520 7.80 92.55
Adrian
Toba Informasi Rekam Medis Pasien pada Klinik
i
Legenda Bersalin Kasih Ibu Menggunakan Metode
2 Danau 520 Idris 7.99 92.55 Waterfall. Scientia Journal. 4 (3):239-247.
Toba
[4]Permatasari, Nindy. 2016. Analisa Perbandingan
Nazief
Legenda Algoritma Idris dan Algoritma Enhanced Confix
&
3 Sangkuri 645 15.8 97.07 (ECS) Stemmer Pada Dokumen Teks Bahasa
Adrian
ang
i Indonesia. Skripsi. Universitas Komputer
Legenda Indonesia, Bandung.
4 Sangkuri 645 Idris 11.09 88.56
ang [5] Rahmawati, L. 2016. Analisa Clustering
Cerita Nazief Menggunakan Metode K-Means dan Hierarchical
Rakyat & Clustering (Studi Kasus: Dokumen Skripsi
5 637 10.98 99.1
Timun Adrian Jurusan Kimia, Fmipa, Universitas Sebelas
Mas i
Cerita Maret). Surakarta: ITSmart: Jurnal Teknologi dan
Rakyat Informasi. Vol. 3, No. 2: 66-73.
6 637 Idris 8.15 92.84
Timun
Mas
7 Legenda 639 Nazief 10.27 99.68

APLIKASI PENGELOMPOKAN PELANGGAN PADA UMS STORE
MENGGUNAKAN ALGORITMA K-MEANS
Muhammad Abdul Ghofar1), Yogiek Indra Kurniawan2)
1) 2)
, Program Studi Informatika, Fakultas Komunikasi dan Informatika
Universitas Muhammadiyah Surakarta
mvghofar1@gmail.com1), yogiek@ums.ac.id2)
Abstract
UMS Store is an official trading business unit owned by Muhammadiyah University of Surakarta that
provides various categories of books, journals, office stationery and official marchandise. UMS Store is
also a voucher exchange center for students. Of the many voucher redemption transactions and cash
purchases, UMS Store has abundant data and will continue to grow over time. The abundant data if left
unchecked would be a pile of only stored data. Actually, if the data is excavated will produce valuable
information. UMS Store need a customer grouping application that will be used to provide continuous
treatment such as giving discounts or vouchers to their best customers. This research is done to create the
application, where application can make customer grouping with UMS Store data and can give
recommendation through potential group that formed. This application was developed by utilizing K-
means algorithm, which is one of clustering method in data mining technique. Groupings made in the
application are limited to 3 large groups of data with restrictions using only student data using UMS Store
vouchers. Variables used consist of NIM, year force, discount, sub total, total paid, total item and date.The
results of this study is an application used to classify customers using K-means method. The results of this
study indicate that if the application is used to create three groups, it will form three clusters, ie clusters of
potential customers, normal customers and unlikely customer clusters.
Keywords: Clustering, Data Mining, K-Means, UMS Store
sulit dan rumit, khususnya dalam hal kepentingan

1 PENDAHULUAN
organisasi. Selain itu proses pengelompokan data tersebut
UMS Store merupakan sebuah unit usaha dagang resmi
juga tidak mungkin dilakukan, mengingat keterbatasan
yang dimiliki oleh Universitas Muhammadiyah Surakarta.
kemampuan yang dimiliki manusia pada bila
Selain menyediakan berbagai macam kategori buku,
menggunakan cara manual (Nugroho & Haryati, 2015).
tersedia pula jurnal, alat tulis kantor serta official
merchandise berupa barang yang mencirikan UMS. UMS Banyak sekali perusahaan yang tidak menyadari
Store juga menjadi pusat layanan program penukaran bahwa tumpukan data yang selama ini hanya disimpan
voucher bagi mahasiswa aktif yang diselenggarakan sebenarnya sangat berharga. Bahkan banyak diantara data
Universitas Muhammadiyah Surakarta. Voucher tersebut tersebut hanya dipandang sebagai arsip semata dan
diberikan kepada mahasiswa setiap semesternya dari kemudian menjadi data tak terpakai yang akhirnya
semester satu hingga tujuh. dibuang. Dengan penanganan yang tepat, apabila data
tersebut diproses maka akan diperoleh informasi strategis
Teknologi yang berkembang pesat membuat kita
yang berguna bagi masa depan perusahaan. Salah satu
hidup didunia yang penuh dengan data. Setiap hari, sistem
solusi yang dapat digunakan untuk mengatasi masalah ini
dapat mengumpulkan data dalam jumlah besar dari
ialah dengan menggunakan data mining dengan teknik
transaksi pelanggan (Khandre & Alvi, 2016). Sejak awal
klastering atau pengelompokan. Data mining dapat
berdirinya UMS Store telah melakukan banyak proses
digunakan sebagai alternatif dalam pengolahan data
transaksi, baik penukaran voucher maupun pembelian
menjadi sumber informasi strategis yang dapat pula
tunai. Dengan kata lain UMS Store memiliki data yang
sebagai pendukung pengambilan keputusan suatu
amat berlimpah dan pasti akan terus bertambah seiring
perusahaan dimasa mendatang.
berjalannya waktu. Banyaknya data yang tersimpan
tersebut membuat pengklasifikasian data menjadi lebih

Muhammad Abdul Ghofar, Yogiek Indra Kurniawan (2018) 196-203 197
Data mining merupakan sekumpulan proses yang khusus juga menggambarkan penggunaan teknik k-means
dilakukan dalam menemukan dan menggali nilai tambah clustering dan menjelaskan penggunaanya dalam
dari sekumpulan data yang selama ini sulit diketahui segmentasi pelanggan perusahaan televisi berdasarkan
secara manual. Kata mining dalam pengertiannya berarti berbagai variabel. Hasil simulasi menunjukkan pembagian
usaha untuk mendapatkan sedikit pengetahuan berharga delapan puluh pelanggan televisi ke dalam empat
dari sejumlah besar material dasar. Dengan demikian data kelompok. Pada penelitian serupa, Lanjewar, dkk (2013)
mining yang diterapkan memiliki tujuan yaitu untuk menguraikan teknik pengelompokan data untuk
mengungkap dan menggali pola tersembunyi dari sejumah melakukan segmentasi pelanggan pada perusahaan produk
data. Proses data mining sangat diperlukan, terutama susu. Proses klastering dapat membantu untuk
untuk mengolah data dalam jumlah yang besar demi mengidentifikasi kebutuhan dan perilaku pelanggan dan
memberikan informasi strategis yang akurat (Bahar, meningkatkan layanan demi kepuasan pelanggan. Dalam
Pramono, & Sagala, 2016). Data mining dilakukan untuk industri apapun langkah pertama untuk menemukan dan
mengekstrak informasi berharga dari sebuah dataset dan menghasilkan pelanggan yang menguntungkan ialah
kemudian memaparkannya dalam format yang mudah dengan pengelompokan. Hasil dari sistem tersebut
dimengerti oleh manusia dengan tujuan untuk mengambil memberikan profil dan pemahaman yang lebih baik
sebuah keputusan (Ezenkwu, Ozuomba, & Kalu, 2015) terhadap pelanggan. Dalam penelitian serupa, Jain, dkk
(2014) mengelompokkan konsumen berdasarkan perilaku
Dalam penelitian sebelumnya Sumadikarta, dkk
belanja konsumen. Data yang dikumpulkan dari 1014
(2016) mengembangkan sebuah aplikasi dengan konsep
responden dilakukan pengelompokan dengan metode k-
data mining menggunakan algoritma k-means yang
means dan menghasilakn empat buah kelompok
berfungsi untuk mengelompokkan data pelanggan serta
pelanggan. Mengelompokkan pelanggan kedalam segmen
data produk pada PT Mega Arvia Utama. Hasil dari
tertentu dapat membantu pemasaran dalam penargetan
sistem ini adalah membentuk klaster yang digunakan
konsumen dengan lebih terfokus.
sebagai bahan pertimbangan dalam menentukan strategi
penjualan perusahaan yaitu, dengan menghilangkan Berdasarkan latar belakang tersebut, maka
produk yang menempati klaster terbawah dan penelitian ini akan mengembangkan sebuah aplikasi
memeberikan reward kepada pelanggan poternsial yang klastering dengan teknik data mining menggunakan
menempati klaster teratas. Bahar, dkk (2016) juga algoritma K-means. Aplikasi ini dibuat untuk melakukan
mengembangkan sistem penentuan strategi yang dibuat pengelompokan pelanggan pada UMS Store untuk
untuk menerapkan metode data mining dengan menemukan kelompok pelanggan potensial, yang
menggunakan algoritma K-Means Clustering, yaitu nantinya akan digunakan untuk memberikan rekomendasi
dengan cara melakukan pembagian data yang ada menjadi berupa treatment dan penanganan lebih lanjut.
satu atau lebih cluster. Tujuan dari penelitian tersebut
2 METODOLOGI
adalah untuk membagi data ke dalam beberapa kelompok,
Bab ini menjelaskan berbagai tahapan yang dilakukan
berfokus pada produk yang paling diminati.
dalam melakukan penelitian, sehingga dapat sesuai
Tikmani, dkk (2015) melakukan penelitian untuk dengan tujuan penelitian. Adapun alur tahapan dalam
mengelompokkan pelanggan dan bagaimana algoritma k- metodologi penelitian ini ditunjukkan pada Gambar 1.
means dapat digunakan untuk membagi pelanggan
kedalam kelompok yang berbeda. Penelitian ini
menggambarkan mengenai segmentasi pelanggan dan
menjelaskan algoritma clustering secara rinci. Secara

tujuan mendapatkan data akurat yang akan digunakan

dalam penelitian guna menentukan hasil akhir yang baik
(Kurniawan & Windisani, 2017). Data yang digunakan
dalam penelitian ini diperoleh dari pihak UMS Store
sesuai kebutuhan data penelitian ini.
2.3 Analisa Data

Tahap ini dilakukan untuk menentukan kebutuhan data
dalam pengembangan aplikasi. Total keseluruhan data
yang diperoleh dari UMS Store sebanyak 9031 data. Data
yang akan digunakan dibatasi dengan hanya mengambil
Gambar 1. Tahapan metodologi penelitian
data pelanggan yang berstatus mahasiswa dan
2.1 Analisis Masalah menggunakan voucher saja dibulan Mei 2017, sehingga
Banyaknya transaksi pelanggan pada UMS Store diperoleh sampel data akhir sejumlah 357 untuk dilakukan
menjadikan data yang dimiliki semakin berlimpah setiap pengelompokan. Pembersihan data juga dilakukan agar
harinya. Data yang berlimpah ini apabila dibiarkan akan data sesuai dengan kebutuhan aplikasi, sehingga data
menjadi tumpukan data yang tersimpan saja. Sebenarnya nantinya tidak memiliki noise atau ketidakkonsistenan
data tersebut apabila digali akan memberikan informasi saat pengujian dilakukan.
yang berharga. Sehingga perlu dikembangkan sebuah
Variabel yang digunakan dalam proses
Aplikasi yang dapat digunakan untuk melakukan
pengelompokan ini dipilih berdasarkan tujuan penelitian
pengelompokan data di UMS Store. Penelitian ini
seperti yang tertera pada tabel 1.
dilakukan dengan tujuan melakukan pengelompokkan
Tabel 1. Daftar variabel yang digunakan
pelanggan potensial yang diambil dari data transaksi UMS
Store. Obyek penelitian ini dipilih karena transaksi Nama Tipe Deskripsi
Variabel Data
pelanggan didominasi oleh mahasiswa UMS. Hasil dari NIM Nominal Kode mahasiswa
penelitian ini digunakan untuk memberikan rekomendasi Tahun Numeric Tahun angkatan
Angkatan mahasiswa
pada UMS Store terhadap pelanggan potensial yang ada.
Discount Numeric Total diskon yang
Berdasarkan rekomendasi tersebut, UMS Store dapat diperoleh
Subtotal Numeric Total harga keseluruhan

memeberikan penanganan lebih lanjut pada kelompok
Total Numeric Total harga yang harus
potensial yang terbentuk berupa perlakuan istimewa atau Paid dibayarkan setelah
dipotong diskon
treatment belanja seperti memberikan diskon untuk
Total Item Numeric Jumlah barang yang
pembelian selanjutnya. Hal ini nantinya akan menambah dibeli
minat mahasiswa untuk berbelanja di UMS Store. Tanggal Date Tanggal transaksi
pembelian
Pengelompokan pada penelitian ini dibatasi pada data
2.4 Desain
transaksi mahasiswa dengan pembelian menggunakan
Pada tahap desain, dilakukan perancangan dari aplikasi
voucher UMS Store saja, sehingga proses pengklasteran
yang akan dibangun. Perancangan menggunakan metode
dapat lebih spesifik.
Unified Modeling Language (UML) dengan diagram
2.2 Pengumpulan Data usecase. Diagram usecase menggambarkan interaksi yang
Pengumpulan data dilakukan untuk memperoleh dapat dilakukan oleh pengguna di dalam aplikasi (Lihat
informasi serta data yang dibutuhkan agar dapat mencapai pada Gambar 2).
tujuan akhir penelitian. Pengumpulan data memiliki

3. Ulangi langkah berikut sampai anggota tidak

berubah, dimana tidak ada data pada setiap
cluster yang dapat berpindah ke cluster lain:
a. Tentukan nilai untuk centroid baru
b. Hitung jarak diatara setiap data dengan
centroid
Gambar 2. Usecase diagram aplikasi
c. Kelompokkan data berdasarkan jarak
Pada Gambar 2, terdapat sebuah aktor yang
terdekat dengan centroid
berperan didalam aplikasi yaitu user atau pengguna
aplikasi. Interaksi yang dapat dilakukan pengguna dalam Flowchart dari algritma k-means tersebut dapat
aplikasi yang pertama adalah pengolahan data, sebagai dilihat melalui Gambar 3.
contoh pengguna dapat menambah, mengubah,
menghapus data, dan melakukan upload data dalam
bentuk sebuah file csv. Selanjutnya pengguna dapat
melakukan proses pengelompokan K-means dengan
menjalankan fungsi proses. Selain itu pengguna juga
dapat melihat hasil akhir dari proses pengelompokan.
Aplikasi pengelompokan ini dibuat menggunakan
database Mysql dan bahasa pemrograman PHP dan
Mysqli untuk melakukan perancangan antarmuka aplikasi.
Gambar 3. Flowchart algoritma k-means
2.5 Implementasi
Salah satu algoritma yang dapat menyelesaikan K-means dapat membagi data menjadi beberapa
permasalahan dalam melakukan pengklasteran adalah kelompok, sehingga data yang mempunyai kesamaan
dengan menggunakan algorima K-means. Huruf k pada k- karakteristik akan dikelompokkan dalam satu cluster,
means mewakili jumlah kelompok yang dipilih. Dalam sedangkan data yang berbeda karakteristiknya
algoritma k-means setiap kumpulan data diperlakukan dikelompokkan pada cluster lain. Dalam membagi
sebagai objek yang memiliki beberapa lokasi. K-means kelompok tersebut digunakan persamaan Euclidean
menemukan partisi sehingga objek di dalam kelompok distance space (persamaan 1) yang digunakan untuk
cluster sangat dekat satu sama lain, dan sangat jauh dan menghitung jarak terpendek antara dua titik yang
berebeda dengan kelompok lain. (Tikmani, Tiwari, & diperhitungkan yaitu data dengan centroid (Nugroho &
Khedkar, 2015). K-means menggunakan pendekatan Haryati, 2015).
iteratif untuk meminimalkan jumlah jarak antara setiap

𝑝 2
objek dengan centroid. K-means digunakan secara luas 𝑑𝑖𝑗 = √∑𝑘=1(𝑥𝑖𝑘 − 𝑥𝑗𝑘 )
untuk melakukan analisis data dengan volume besar yang (1)
dihasilkan oleh berbagai sistem modern (Khandre & Alvi,
2016) Keterangan:
Berikut langkah pada algoritma k-means: 𝑑𝑖𝑗 : Euclidean distance, Jarak antara objek i dan j
1. Menentukan nomor cluster (jumlah Kelompok) p : Dimensi data yang digunakan

2. Menentukan nilai centroid awal pada setiap 𝑥𝑖𝑘 : Koordinat data ke-i
klaster (dipilih secara acak) 𝑥𝑗𝑘 : Koordinat centroid ke-j

Sedangkan untuk memperoleh titik centroid baru segi sistem, aplikasi ini memudahkan UMS Store dalam
dilakukan dengan cara menghitung nilai rata-rata dari data menentukan pelanggan potensial tanpa memerlukan
yang ada pada cluster yang sama menggunakan tenaga tambahan dalam melakukan analisa.
persamaan 2.
2.8 Kesimpulan
1 Pada tahap ini, penulis merumuskan suatu kesimpulan
𝐶𝑘 = ∑ 𝑑𝑖 (2)
𝑛𝑘
sesuai dengan penelitian dan hasil yang telah dilakukan
Dimana: dalam pembuatan tugas akhir ini.
𝑛𝑘 : Jumlah data dalam cluster 3 HASIL DAN PEMBAHASAN

3.1 Implementasi Hasil
𝑑𝑖 : Jumlah nilai jarak yang masuk dalam setiap cluster
Aplikasi pengelompokan pelanggan pada UMS Store
2.6 Pengujian telah selesai diimplementasikan. Aplikasi ini terdiri atas
Setelah aplikasi pengelompokan pelanggan selesai dibuat, beberapa halaman. Halaman utama merupakan tampilan
tahapan selanjutnya adalah pengujian. Pengujian ini awal dimana pengguna telah memasuki aplikasi, halaman
memiliki tujuan untuk mengetahui apakah aplikasi sudah ini berisi sedikit penjelasan mengenai aplikasi
berjalan dengan baik sesuai dengan penelitian. Pengujian pengelompokan. Terdapat beberapa menu yang dapat
dengan metode blackbox dilakukan terhadap aplikasi diakses pengguna antara lain menu Home, Project dan
pengelompokan untuk mengetahui apakah telah berfungsi About.
dengan baik ataukah belum. Pengujian tersebut memiliki
Gambar 4 menunjukkan Menu Project, menu ini
tujuan dalam menemukan fungsi yang gagal atau hilang,
merupakan menu yang berperan dalam melakukan proses
kesalahan struktur data, interface dan akses database
utama pada pengelompokan. Pada menu ini pengguna
(Prabiantissa, Ririd, & Asmara, 2017). Pengujian terhadap
dapat melihat tampilan data yang akan diproses serta
hasil pengelompokan juga dilakukan untuk membuktikan
melakukan pengolahan data seperti edit dan hapus
kebenaran hasil pengelompokan yang telah dilakukan
data.Terdapat beberapa button untuk melakukan proses
sebelumnya (Handoko, 2016). Metode pengujian terhadap
lain diantaranya input data, upload data dan proses K-
hasil pengelompokan dilakukan dengan cara
means.
membandingkan hasil yang pengelompokan aplikasi
dengan hasil pada software RapidMiner.
2.7 Analisis Hasil

Pada penelitian ini, aplikasi pengelompokan pelanggan
dengan menggunakan algoritma K-means setelah
diterapkan pada data UMS Store akan menghasilkan tiga
buah cluster. Berdasarkan hasil dari pengelompokan ini Gambar 4. Tampilan menu Project
akan diketahui anggota kelompok manakah yang menjadi
Button Input data yang berada pada bagian kiri
rekomendasi pelanggan potensial yang nantinya akan
memiliki fungsi untuk menambah data. Dan apabila
mendapatkan treatment lebih lanjut oleh UMS Store.
dijalankan maka akan ditampilkan sebuah form yang
Dilihat dari hubungan dengan pelanggan pengelompokan
digunakan untuk pengisian data yang akan ditambahkan,
ini dapat menentukan pelanggan potensial yang dimiliki
seperti pada Gambar 5. Data tersebut akan disimpan
oleh UMS Store, sehingga apabila ada suatu event atau
kedalam database.
diskon dapat melibatkan pelanggan tersebut. Dilihat dari

Halaman ini menampilkan tabel berisi keterangan anggota

kelompok beserta hasil cluster.
Gambar 5. Tampilan form pengisian data
Untuk mengupolad data yang berasal dari file

csv, pengguna dapat menjalankan button upload data yang
Gambar 8. Tampilan hasil cluster
apabila dijalankan nantinya akan menampilkan sebuah
form untuk memilih file dari komputer pengguna seperti Berdasarkan Gambar 8, untuk dapat melihat
pada Gambar 6. anggota dari setiap cluster tersedia button yang akan
menampilkan tabel sesuai dengan cluster yang dipilih.
Pembahasan
3.2 Pembahasan
Berdasarkan hasil penelitian yang telah dilakukan, dapat
diperoleh proses perhitungan menggunakan algoritma k-
Gambar 6. Tampilan upload data CSV means. Perhitungan ini sesuai dengan langkah -langkah
Pada bagian kanan menu Project terdapat button pada algoritma k-means yang telah dijelaskan
Proses Data yang digunakan untuk melakukan inisialisasi sebelumnya. Pertama ialah menentukan nilai centroid
proses. Apabila button dijalankan maka akan tampil awal yang diambil dari data secara random atau acak.
sebuah form, dimana pengguna diminta untuk Daftar centroid awal yang telah diproses dapat dilihat
memasukkan jumlah cluster dan jumlah maksimal iterasi pada tabel 2.
yang akan diproses pada form tersebut. Gambar 7 Tabel 2. Daftar centroid awal
menunjukkan tampilan hasil centroid yang diambil dari K Centroid
data secara acak. Kemudian centroid berikutnya diperoleh

A 2015 -100000 113000 13000 2 2
dari perhitungan nilai rata-rata dengan menggunakan
B 2015 -100000 116000 16000 2 2
persamaan yang telah dibahas pada bab 2.
C 2015 -100000 107000 7000 2 2
Langkah selanjutnya adalah menghitung jarak

terdekat antara setiap data dan centroid. Agar lebih mudah
diambil contoh data pertama pada data percobaan yang
dapat dilihat pada tabel 3.
Tabel 3. Data pertama pada data percobaaan
Gambar 7. Tampilan Centroid pada proses Tahun Sub Total Total Tang
Discount
Angkatan Total Paid Item gal
Kemudian untuk dapat melihat hasil akhir 10000
2013 -100000 0 2 2
0
pengelompokan tersebut, terdapat button Lihat Hasil
Cluster. Pengguna akan diarahkan menuju halaman Hasil
Cluster seperti yang ditunjukkan pada Gambar 8.

Dengan menggunakan persamaan euclidean baru dan lakukan langkah diatas sampai diperoleh hasil
distance space, diperoleh perhitungan jarak sebagai dengan jarak yang konstan dan anggota cluster tidak
berikut: mengalami perubahan.
3.3 Pengujian
Pengujian menggunakan metode blackbox dilakukan
untuk menemukan kesalahan dan ketidaksesuaian fungsi
dalam aplikasi, dimana pengujian dilakukan terhadap
setiap fungsi yang terdapat pada program. Fokus utama
pengujian ini adalah pada spesifikasi fungsional dalam
Jarak terdekat berdasarkan perhitungan diatas
aplikasi. Tabel 4 memperlihatkan hasil pengujian
adalah jarak pada centroid ketiga, sehingga data tersebut
blackbox yang menunjukkan bahwa aplikasi
menjadi anggota cluster 3. Demikian seterusnya hingga
pengelompokan pelanggan telah berjalan dengan baik.
setiap data selesai dihitung. Selanjutnya tentukan centroid
Tabel 4. Hasil pengujian blackbox aplikasi pengelompokan pelanggan
Fungsi Skenario Input Output Keterangan
Menambahkan data baru kedalam NIM, Discount, Subtotal, Data berhasil ditambahkan
Input Data Valid
database Total Item ke database
Mengunggah dokumen dengan format
Upload File Dokumen CSV Dokumen berhasil diunggah Valid
CSV kedalam database
Menghapus yang berada dalam
Hapus Data Klik Tombol Hapus Data berhasil dihapus Valid
database
Mengedit Data yang berada dalam
Edit Data Klik Tombol Edit Data berhasil di-edit Valid
database
Input Proses Memasukkan jumlah cluster dan jumlah Jumlah cluster dan jumlah Nilai tersimpan dalam
Valid
K-means iterasi untuk proses clustering iterasi variabel K dan Maxruns
Proses K- Data diproses,
means Mengelompokkan data kedalam cluster Klik tombol proses. menampilkan centroid Valid
clustering proses.
Lihat Hasil Menampilkan hasil pengelompokan Menekan Tombol Lihat Dta berhasil ditampilkan
Valid
Cluster keseluruhan. Hasil Cluster dalam tabel
Lihat Anggota Menekan Tombol Anggota Data berhasil ditampilkan
Menampilkan hasil untuk setiap cluster. Valid
Cluster Cluster dalam tabel
Pengujian kedua adalah untuk membuktikan

keakuratan hasil pengelompokan pelanggan dalam
aplikasi. Pengujian dilakukan dengan cara
membandingkan anggota cluster pengelompokan dari
aplikasi dengan hasil yang diperoleh dari software
RapidMiner.
Gambar 10. Tampilan Cluster Model pada RapidMiner
Gambar 9 dan Gambar 10 menunjukkan prroses

dan hasil dari pengelompokan menggunakan Software
Rapidminer. Berdasarkan hasil pengelompokan pelanggan
Gambar 9. Tampilan RapidMiner dengan proses K-means baik menggunakan aplikasi pengelompokan ini maupun

software Rapidminer pada akhirnya mendapatkan hasil Studio Sonyxtattoo Menggunakan Metode K-
Means Clustering. Semantik, 2(2), 75-86.
yang sama.
Ezenkwu, C. P., Ozuomba, S., & Kalu, C. (2015).
3.4 Interpretasi Hasil Application of K-Means Algorithm for Efficient
Customer Segmentation: A Strategy for Targeted
Pada penelitian ini, aplikasi pengelompokan pelanggan
Customer Services. IJARAI, 4(10), 40-44.
menggunakan algoritma k-means telah diimplementasikan doi:10.14569/IJARAI.2015.041007
pada data percobaan dan sesuai dengan yang diharapkan. Handoko, K. (2016). Penerapan Data Mining dalam
Meningkatkan Mutu Pembelajaran pada Instansi
Berdasarkan sampel sebanyak 357 data, setelah dilakukan
Perguruan Tinggi Menggunakan Metode K-Means
pengelompokan dengan jumlah kelompok sebanyak tiga Clustering (Studi Kasus di Program Studi TKJ
Akademi Komunitas Solok Selatan). TEKNOSI,
cluster diperoleh hasil sebagai berikut: anggota cluster 1
02(3), 31-40.
dengan titik centroid akhir (2013.967; -100000; doi:https://doi.org/10.25077/TEKNOSI.v2i3.2016.3
1-40
101687.741; 1687.741; 3.351; 7.429) berjumlah 310 data,
Jain, N., & Ahuja, V. (2014). Segmenting Online
cluster 2 dengan titik centroid (2014.270; -100000;
Consumers Using K-means Cluster Analysis.
125908.108; 25908.108; 1.891; 8.432) berjumlah 37 data International Journal of Logistics Economics and
Globalisation, 6(2), 161-178.
dan cluster 3 dengan titik centroid akhir (2014.500; -
doi:https://doi.org/10.1504/IJLEG.2014.068274
100000; 162390; 62390; 1.200; 6.600) berjumlah 10 data.
Khandre, A., & Alvi, A. S. (2016). Efficient Clustering
Sehingga dengan membandingkan nilai atribut dalam Algorithm with Improved Clusters Quality. IOSR-
JCE, 18(6), 15-19. doi:10.9790/0661-1806051519
setiap kelompok dapat diambil kesimpulan bahwa
kelompok pelanggan potensial berada dalam cluster 3. Kurniawan, Y. I., & Windisani, P. A. (2017). Sistem
Pendukung Keputusan untuk Penentuan Kelolosan
Kelompok inilah yang akan menjadi rekomendasi pada Beasiswa Sekolah Menengah Kejuruan (SMK)
Menggunakan Metode Fuzzy . Jurnal Teknik
UMS Store.
Elektro, 9(1).
4 PENUTUP Lanjewar, R., & Yadav, O. P. (2013). Understanding of
Customer Profiling and Segmentation Using K-
Berdasarkan hasil penelitian yang telah dilakukan dapat
Means Clustering Method for Raipur Sahkari
diambil beberapa kesimpulan diantaranya: Dugdh Sangh Milk Products. IJRCCT, 2(3), 103-
107.
1. Sistem pengelompokan pelanggan dengan
Nugroho, Y. S., & Haryati, S. N. (2015). Klasifikasi dan
menggunakan algoritma k-means berhasil dibuat
Klastering Penjurusan SMA Negeri 3 Boyolali.
untuk mengelompokkan pelanggan potensial. Khazanah Informatika, 1(1), 1-6.
doi:https://doi.org/10.23917/khif.v1i1.1175
2. Berdasarkan pengujian Blackbox aplikasi telah
Prabiantissa, C. N., Ririd, A. R., & Asmara, R. A. (2017).
berjalan dengan baik. Sedangkan pengujian hasil
Sistem Identifikasi Batik Alami dan Batik Sintetis
dengan menggunakan software RapidMiner juga Berdasarkan Karakteristik Warna Citra dengan
Metode K-Means Clustering. Jurnal Informatika
mendapatkan hasil yang sama dengan aplikasi
Polinema, 5(2), 26-31.
pengelompokan pelanggan.
Sumadikarta, I., & Abeiza, E. (2016). Penerapan
3. Pengelompokan yang dihasilkan berdasarkan Algoritma K=Means pada Data Mining Untuk
Memilih Produk dan Pelanggan Potensial (Studi
perhitungan jarak terdekat antara setiap data
Kasus : PT Mega Arvia Utama). Jurnal Satya
dengan centroid. Jumlah cluster dalam sistem Informatika, 1(1), 12-22.
dapat ditentukan sebanyak 3 cluster. Tikmani, J., Tiwari, S., & Khedkar, S. (2015). An
Approach To Consumer Classification Using K-
Means. IJIRCCE, 3(11), 10542-10549.
5. DAFTAR PUSTAKA doi:10.15680/IJIRCCE.2015.0311029
Bahar, A., Pramono, B., & Sagala, L. H. (2016).
Penentuan Strategi Penjualan Alat-Alat Tattoo di

IMPLEMENTASI DATA MINING DENGAN ALGORITMA APRIORI UNTUK
MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA
Irham Kurnawan, Fitri Marisa2, Dwi Purnomo3
wandk89@gmail.com, fitrimarisa@widyagama.ac.id, purnomo@widyagama.ac.id
Jurusan Teknik Informatika, Universitas Widyagama Malang
Abstract
Informatics Engineering Program University of Widyagama Malang has many volume of
student databases. When properly excavated, so can known patterns or knowledge for a
decision-making. Data that can be explored is the understanding of information about
graduation students. This research to predict the passing rate of students with more efficient
time, which can be known before the student graduated so that can be evaluated in their
studies, especially in Informatics Engineering University of Widyagama. In this case using
association methods and Apriori algorithm. This method calculates the support value that is
the supporting value of an item with big golden rule 60% of the data of course grade. The
results of this study to help universities improving the quality of education and help in knowing
the information about the graduation rate of students based on the value of the subjects and
achievement index obtained by students in Informatics Engineering course University of
Widyagama Malang.
Keywords: Data Mining, Apriori, Tingkat Kelulusan
I. PENDAHULUAN sehingga ditemukan suatu pola yang menarik yang

Berdasarkan hasil observasi pada Prodi Teknik sebelumnya tidak diketahui [2].
Informatika Universitas Widyagama Malang, Sedangkan definisi yang lain menerangkan bahwa,
permasalahan yang terjadi yaitu tidak sedikit data mining adalah suatu pencarian dan analisa dari
mahasiswa yang mengalami kendala dalam masa jumlah data yang sangat besar dan bertujuan untuk
perkuliahan. Peran dosen dalam mengarahkan mencari arti dari pola dan aturan [3].
mahasiswa yang memiliki beberapa kendala dalam C. Asssociation Rule
perkuliahan menjadi sangat penting dilakukan. Namun Association Rule Mining merupakan teknik data
dengan kuantitas mahasiswa yang sangat banyak dan mining untuk menemukan aturan asosiatif antara suatu
berbagai permasalahan yang berbeda menyebabkan kombinasi item atau untuk menemukan hubungan hal
fungsi konsultatif tersebut kurang efektif untuk tertentu dalam suatu transaksi data dengan hal lain di
dilakukan. dalam transaksi, yang digunakan untuk memprediksi
Dengan menggunakan algoritma apriori ini pola [4].
bertujuan untuk mengetahui nilai matakuliah yang Sedangkan definisi lain menyatakan, Association
paling dominan untuk memprediksi tingkat kelulusan Rule Mining terdiri dari itemset yang sering muncul.
mahasiswa. Peneliti berharap dapat membantu dalam Association Rule Mining dapat dianalisa lebih lanjut
mengetahui informasi tentang nilai mata kuliah dan untuk mengungkap aturan korelasi untuk
indeks prestasi kumulatif (IPK) yang dapat dijadikan menyampaikan korelasi statistik antara itemsets A dan
rekomendasi dalam menentukan tingkat kelulusan B [5].
mahasiswa pada program studi Teknik Informatika D. Algoritma Apriori
Universitas Widyagama Malang. Selain itu, sebagai Algoritma apriori adalah algoritma dasar yang
usaha untuk membantu perguruan tinggi dalam diusulkan oleh Agrawal dan Srikant pada tahun 1994
meningkatkan kuantitas mahasiswa pada tahun untuk penentuan frequent itemsets untuk aturan
berikutnya. asosiasi Boolean. Algoritma ini mengontrol
II. TINJAUAN PUSTAKA berkembangnya kandidat itemset dari hasil frequent
A. Tingkat Kelulusan itemsets dengan support-based pruning untuk
Tingkat kelulusan mahasiswa dapat dilihat dari menghilangkan itemset yang tidak menarik dengan
Indeks Prestasi Kumulatif (IPK) yang mencerminkan menetapkan minsup [6].
seluruh nilai yang diperoleh mahasiswa setiap Algoritma apriori juga dapat didefinisikan sebagai
semester yang sedang berjalan. IPK diperoleh dengan suatu proses untuk menemukan semua aturan apriori
menjumlahkan nilai dari semua mata kuliah yang telah yang memenuhi syarat minimum untuk support dan
diambil dan membaginya dengan total SKS (Satuan syarat minimum untuk confidence [7].
Kredit Semester) [1].
B. Data Mining III. ANALISIS DAN PERANCANGAN
Data mining adalah suatu teknik menggali A. Analisis Sistem
informasi berharga yang terpendam atau tersembunyi Masalah utama yang terjadi pada Program Studi
pada suatu koleksi data (database) yang sangat besar Teknik Informatika UniversitasWidyagama yaitu tidak
adanya sarana yang digunakan dalam

Irham Kurnawan, Fitri Marisa, Dwi Purnomo (2018) 204-209 205
mengetahui/memprediksi tingkat kelulusan mahasiswa. Pada tahap ini dilakukan pengelompokkan data
Oleh sebab itu, penelitian ini bertujuan untuk mata kuliah. Untuk matakuliah di bedakan menjadi 2
mengetahui nilai matakuliah yang paling dominan bagian, yaitu matakuliah jenis dan jenis2. Matakuliah
untuk memprediksi tingkat kelulusan mahasiswa jenis merupakan jenis matakuliah sesuai dengan SK
hingga dapat mengurangi jumlah kandidat yang harus Dikti pada program studi teknik informatika yang
dihitung support-nya sehingga sistem ini dapat dibedakan menjadi :
diterapkan dan hasil penelitian ini juga akan dirasakan a) Mata Kuliah Pengembangan Kepribadian (MPK).
manfaatnya pada program studi Teknik Informatika b) Mata kuliah Keilmuan dan Keterampilan (MKK).
Universitas Widyagama. c) Mata kuliah Keahlian Berkarya (MKB).
Dengan demikian, indeks prestasi kumulatif (IPK) d) Mata kuliah Perilaku Berkarya (MPB)
yang mencerminkan seluruh nilai yang diperoleh e) Mata kuliah Berkehidupan Bermasyarakat (MBB).
mahasiswa setiap semester yang menjadi tolak ukur Mata kuliah jenis2 merupakan kelompok mata
besarnya tingkat prestasi yang telah dicapai oleh kuliah yang lebih spesifik untuk jurusan Informatika,
mahasiswa dapat terus ditingkatkan. kelompok matakuliah jenis2, yaitu : Algoritma, Dasar
IT, Database, Desktop, Mobile, Pendukung, Sistem
B. Perancangan Sistem Informasi, dan Web.
Dalam mengatasi permasalahan pada Prodi
Teknik Informatika Universitas Widyagama yaitu 2. Nilai Item
dengan menggunakan teknik data mining dengan Nilai support sebuah item dapat kita peroleh dari
aturan asosisasi algoritma Apriori. Algoritma apriori rumus berikut :
bertujuan untuk menemukan semua aturan apriori 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴) =
yang memenuhi syarat minimum untuk support dan 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
( ) 𝑥 100% .....................
syarat minimum untuk confidence. Dalam perhitungan 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
algoritma apriori dilakukan perhitungan nilai tiap item ... (1)

data berdasarkan jenis dan nilai dari tiap mata kuliah.
Nilai tiap item digunakan dalam menentukan nilai Dari tabel 1, 2 dan 3 berikut, diperoleh
support item, dimana jika nilai support >= minimum pengelompokkan itemset menjadi 3 (tiga), yaitu :
item maka proses perhitungan dapat dilanjutkan untuk Tabel 1 : Tabel Nilai per item (1-itemset)
Nilai
menghitung nilai itemset. Item Jumlah
Nilai itemset yang diperoleh dilakukan A 23
penggabungan item sehingga diperoleh data itemset 1, B+ 18
itemset 2, hingga data itemset n+1. Kemudian B 6
menentukan nilai confidence, jika nilai confidence C+ 1
C 2
yang diperoleh >= confidence. Sehingga dari hasil
perhitungan dengan menggunkaan algoritma apriori
tersebut, dapat diperoleh prediksi tingkat keluluan Tabel 2 : Tabel Matakuliah Jenis per item (1-itemset)
Item Jumlah
mahasiswa. MPK 8
MKK 10
C. Flowchart Algoritma MKB 27
Berikut ini adalah tahapan alur (flowchart) MPB 3
perhitungan Algoritma Apriori : MBB 2
Tabel 3 : Tabel Matakuliah Jenis 2 per item (1-itemset)

Item Jumlah
Database 1
Dasar IT 4
Pendukung 5
Sistem Informasi 5
Web 4
Desktop 6
Algoritma 9
Mobile 1
3. Support Minimum
Dalam menghitung support minimum, yang di
gunakan dalam dalam pemilihan minimum frekuensi
Gambar 1: adalah minimal 60% dari jumlah total maksimal suatu
Flowchart alur perhitungan Apriori item. Nilai support dari 2 item berbeda dapat kita
peroleh dari rumus berikut :
1. Scan data

dapat terbentuk apabila terbentuknya kombinasi 3

𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴, 𝐵) = itemset.
∑ Transaksi mengandung A dan B Item = penggabungan nilai matakuliah dan jenis
∑
….............. (2)
Transaksi matakuliah
Support = nilai support dari itemset2 dan itemset3
4. Penggabungan itemset Confidence = nilai confidence itemset2 dan itemset3
Penggabungan itemset dilakukan dari tabel itemset
matakuliah jenis, matakuliah jenis 2 dan tabel itemset Tabel 6 : Final Association Rule
nilai, dan mengeluarkan data yang tidak kita butuhkan. Support x
Tahap ini memilih itemset pertama atau frequent ITEM Support Confidence Confidence
itemset. Untuk memilih frequent itemset membutuhkan
MKB , A 110% 40,74% 44.8%
minimum frekuensi kemunculan suatu item hingga
diperoleh data berikut: MKB, B+ 90% 33,33% 29,9%
Tabel 4 : Tabel per item (4-itemset) Algoritma, A 50% 55,55% 27,7%
Item Jumlah
Algoritma, B+ 20% 22,22% 4,4%
A, MKB, Algoritma 3
B+ , MKB, Algoritma 2 Algoritma, 70% 77,78% 54,4 %
Dari tabel di atas, dapat kita ketahui bahwa keempat MKB
item tersebut lebih sering muncul persamaan E. Flowchart Sistem
dibandingkan item-item yang lainnya. Terdapat item Flowchart (diagram alir) digunakan untuk
Nilai yang berbeda dari kombinasi 2 item tersebut, dan mempermudah dalam memahami sistem kerja pada
tidak kemungkinkan untuk melanjutkan ke itemset proses. Beriikut ini adalah flowchart sistem prediksi
selanjutnya. kelulusan mahasiswa :
5. Nilai Confidence
Setelah memilih item-item untuk peluang support,
selanjutnya kita gunakan untuk mencari peluang
confidence.
Rumus untuk mencari confidence adalah sebagai
berikut :
𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 𝑃(𝐵|𝐴) =
𝐽𝑢𝑚𝑙𝑎ℎ 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵
….......... (3)
𝐽𝑢𝑚𝑙𝑎ℎ 𝑚𝑒𝑛𝑔𝑎𝑑𝑢𝑛𝑔 𝐴
6. Minimum frekuensi
Minimum confidence yang digunakan dalam
pemilihan minimum frekuensi adalah minimal 60%
dari nilai confidence item. Jika nilai confidence > Gambar 2: Flowchart Sistem
minimum confidence maka akan diperoleh frekuensi Flowchart tersebut dimulai dengan input data yang
terkuat. dilakukan oleh user ketika melakukan login ke sistem.
Kemudian data yang di input tersebut akan di proses
7. Final Assosiation Rule oleh admin dalam melakukan perhitungan prediksi
Setelah diperoleh frekuensi minimum confidence, tingkat kelulusan mahasiswa.
Berikut ini tabel hasil perangkingan nilai berdasarkan E. Data Flow Diagram (DFD)
jenis matakuliah dan nilai. Berikut merupakan DFD yang menggambarkan
Tabel 5. : Frekuensi Tertinggi bagaimana sistem yang menggunakan metode asosiasi
ITEM C Rank algoritma Apriori ini berjalan.
Algoritma dan 77,78 1
MKB
ITEM = penggabungan nilai matakuliah dan jenis

matakuliah
C = nilai confidence yang diperoleh
Rank = urutan rangking nilai confidence yang
diperoleh
Gambar 3: DFD Level 0 sistem
Final association rule menjelaskan tentang support
dan confidence dari masing-masing kombinasi 2 H. Entity Relationship Diagram (ERD)
itemsets dan 3 itemset. Aturan final association rule ERD adalah gambar atau diagram yang
menunjukan informasi dibuat, disimpan dan digunakan
dalam sistem bisnis. Entitas biasanya menggambarkan

jenis informasi yang sama. Berikut ini adalah ERD Data nilai yang dapat diinput yaitu nim mahasiswa,
yang direkomendasikan pada Sistem Prediksi nama mahasiswa, nama matakuliah, serta nilai yang
Kelulusan: diperoleh mahasiswa. Nilai yang telah diinput tersebut
digunakan dalam melakukan perhitungan prediksi
kelulusan mahasiswa. Hanya admin yang dapat
mengakses menu ini.
C. Form Daftar Mahasiswa

Pada menu daftar mahasiswa merupakan menu
yang berisi rekap nilai IPK yang diperoleh tiap
mahasiswa selama masa studi dan total sks yang telah
ditempuh. Menu ini terdapat tombol proses yang
digunakan untuk mengetahui prediksi keluluan
mahasiswa. Pada kolom NB berisi daftar matakuliah
yang harus ditingkatkan oleh mahasiswa agar dapat
Gambar 4: ERD sistem meningkatkan nilai IPK pada semester berikutnya dan
dapat studinya tepat waktu.
IV. HASIL DAN PEMBAHASAN
Berikut ini pembahasan hasil implementasi Sistem
data mining menggunakan algoritma apriori untuk
memprediksi tingkat kelulusan mahasiswa.
A. Utama
Gambar 7 : Form Daftar Mahasiswa
D. Form Tambah Matakuliah
Gambar 5 : Form Utama
Menu utama diatas berisi nama mahasiswa

yangmelakukan login, nim, angkatan, daftar matauliah,
sks, dan nilai yang telah ditempuh, tahun lulus serta
nilai IPK mahasiswa tersebut.
B. Form Tambah Nilai
Gambar 8 : Form Tambah Matakuliah

Menu tambah matakuliah digunakan admin untuk
menambahkan kode matakuliah, nama matakuliah,
semester, sks, dan jenis matakuliah.
E. Form Apriori
Pada menu apriori dilakukan proses perhitungan
C1 yaitu penggabungan jumlah item dari jenis
matakuliah dan perolehan nilai dari matakuliah
tersebut. L1 merupakan nilai support dari itemset 1
Gambar 6 : Form Tambah Nilai yang diperoleh dari hasil perhitungan C1.
Menu tambah nilai digunakan untuk menambahkan
nilai tiap matakuliah yang telah ditempuh mahasiswa.

1) Sitem ini dibuat untuk membantu mengetahui nilai

matakuliah dan indeks prestasi kumulatif (IPK)
yang digunakan untuk memprediksi kelulusan
mahasiswa Teknik Informatika Uniersitas
Widyagama.
2) Hasil perhitungan dengan algoritma apriori
menunjukkan bahwa nilai itemset ke-3 dari data
matakuliah mahasiswa merupakan nilai matakuliah
dominan yang digunakan dalam meningkatkan
indeks prestasi kumulatif pada semester berikutnya.
Perolehan nilai tersebut dapat digunakan untuk
memprediksi tahun lulus mahasiswa. Tabel hasil
prediksi kelulusan adalah sebagai berikut :
Gambar 9 : Form Apriori Tabel 7 : Hasil Prediksi Kelulusan
NO NAMA IPK TAHUN

LULUS
1 Irham Kurniawan 3,55 2017
2 Vibyola Putri W 3,72 2018
3 Faruq Naufal Abdullah 3,15 2019
4 Muhammad Fahmi 3,20 2020
Imanda
B. Saran
1) Penelitian ini dapat digunakan sebagai acuan /
referensi untuk menentukan seberapa cepat
mahasiswa menyelesaikan studinya dan
mengetahui matakuliah mana yang menjadi
Gambar 10 : Form Lanjutan Apriori keunggulan dari mahasiswa tersebut.
2) Aplikasi ini hanya berjalan ketika mahasiswa
Setelah itu dilanjutkan dengan perhitungan nilai tersebut ada di atas semester 5, karena matakuliah
confidence. Sehingga diperoleh presentase nilai dari jenis 2 mulai semester 3.
confidence tiap matakuliah. Menu ini hanya dapat
diakses oleh admin. V. REFERENSI
[1] Hartanto, D., & Hansun, S. (2014).
F. Form Hasil Prediksi Kelulusan IMPLEMENTASI DATA MINING DENGAN
ALGORITMA C4.5 UNTUK MEMPREDIKSI
TINGKAT KELULUSAN MAHASISWA.
Jurnal ULTIMATICS , 1, 15-20. Dapat diakses
di :
[http://www.ejournals.umn.ac.id/index.php/TI/art
icle/view/327.html ].
[2] Wirdasari, D. & A.Calam,.Penerapan Data
Mining Untuk Mengolah Data Penempatan Buku
Di Perpustakaan Smk Ti Pab 7 Lubuk Pakam
Dengan Metode Association Rule. Jurnal
SAINTIKOM, 10 (2), 150, 2011. Dapat diakses
di :
[http://www.academia.edu/7489155/Penerapan_
Data_Mining_Untuk_Mengolah_Data_Penempat
an_Buku_Di_Perpustakaan_Smk_Ti_Pab_7_Lub
uk_Pakam_Dengan_Metode_Association_Rule].
[3] Linoff , G. S., & Berry, M. J. Data Mining
Gambar 11 : Form Hasil Prediksi Kelulusan
Techniques for Marketing, Sales, Customer
Relationship Management. 2011. United States
V. KESIMPULAN
of America: Wiley Publishing, Inc. Dapat diakses
A. Simpulan
di:
Dari hasil penelitian yang telah dilakukan di
[https://www.amazon.com/Data-Mining-
Program Studi Tentik Informatika Universitas
Techniques-Relationship-
Widyagama Malang maka dapat disimpulkan bahwa:
Management/dp/0470650931].

[4] David, Olson, & Yong, Shi. Introduction to [https://journal.budiluhur.ac.id/index.php?journal

Business Data Mining. 2011. International =teleinformatika&page=index].
Edision: Mc Graw Hill. [7] Syaifullah, M. A. Implementasi Data Mining
[5] Han, J., & Kamber, M. Data Mining: Concept Algoritma Apriori Pada Sistem Penjualan.
and Techniques. 2011. Waltham: Elsevier Inc. STMIK AMIKOM YOGYAKARTA. 2010.
[6] Sensuse, G.G., Penerapan Metode Data Mining Yogyakarta: Sekolah Tinggi Manajemen
Market Basket Analysis Terhadap Data Informatika dan Komputer Amikom. Dapat
Penjualan Produk Buku Dengan Menggunakan diakses di :
Algoritma Apriori Dan Frequent Pattern Growth [http://elearning.amikom.ac.id/index.php/karya/7
(Fp-Growth) : Studi Kasus Percetakan Pt. 52/mardalina,%20se/Implementasi%20data%20
Gramedia. Jurnal TELEMATIKA MKOM , 4 (1), mining%20algoritma%20apriori%20pada%20%2
118-132, 2012. Dapat diakses di : 0sistem%20penjualan].

APLIKASI KLASIFIKASI PENERIMA KARTU INDONESIA SEHAT
MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER
Aziz Abdul Rahman1), Yogiek Indra Kurniawan2)
1) 2)
, Program Studi Informatika, Fakultas Komunikasi dan Informatika
azizabduel@yahoo.com1), yogiek@ums.ac.id2)
Abstract
Along with the rapid development of information technology today, the cost to meet the needs of
life increasingly high, this is triggered by the amount of budget issued by the government to
solve economic problems in Indonesia, especially in terms of National Welfare Guarantee.
Kartu Indonesia Sehat is a card issued by the government and managed by the Badan
Penyelenggara Jaminan Sosial (BPJS) to alleviate the poor for health. Existing problems such
as in the distribution of the card has not been on target because of the amount of data obtained
so highly possible error happens in determining the recipient of Kartu Indonesia Sehat. The
concept of data mining is considered to solve the problems faced in determining the recipient
community or not the recipient of Kartu Indonesia Sehat. Classification methods are able to find
models that distinguish the concepts or data classes, with the spesific goal of determining the
class of an unknown object label. Therefore, the Naïve Bayes algorithm could predict future
opportunities based on prior experience by considering some variables such as age, last
education, occupation, monthly income and dependents of children that will determine the final
outcome of a decision. The result of this research is a system that will predict the people who
will receive Kartu Indonesia Sehat so that the government will distribute the card accurately to
the public and the acquired results from the test obtained an average accuracy rate of 94.78%,
98.86% precision and 90.98% recall.
Keywords— data mining, Kartu Indonesia Sehat , Kartu Indonesia Sehat classification, Naïve Bayes
I. PENDAHULUAN dikenakan tanggungan biaya administrasi setiap

Kartu Indonesia Sehat atau biasa disebut KIS bulannya, melainkan biaya tersebut ditanggung oleh
adalah salah satu program pemerintah yang pemerintah [2].
dicanangkan oleh bapak Joko Widodo dalam Zaman (2016) mengangkat permasalahan terkait
kampanye pemilihan calon presiden tahun 2014. Latar Penentuan Kelayakan Penerima Bantuan Rehabilitas
belakang munculnya KIS diharapkan dapat memenuhi Sosial Rumah Tidak Layak Huni. Zaman mengatakan
kemaslahatan/ hajat hidup orang banyak sehingga bahwa tingkat kesejahteraan dapat diukur berdasarkan
patut kita dukung dan realisasikan. KIS memberikan masalah sosial yang dihadapi oleh suatu rumah tangga.
jaminan kepada masyarakat terkait pelayanan Suatu rumah tangga dengan masalah sosial yang tinggi
kesehatan yang bermutu seperti yang telah dijalankan diharapkan mendapatkan bantuan rehabilitas sosial
pada Program Jaminan Kesehatan Nasional (JKN). rumah tidak layah huni. Namun, banyaknya data yang
KIS mulai diterapkan di Indonesia sejak 1 Maret 2015. diterima membuat panitia pelaksana sering kali terjadi
Hadirnya KIS diharapkan dapat membantu masyarakat kesalahan dalam pengambilan keputusan. Dengan
miskin untuk akses kesehatan yang lebih mudah. Algoritma C4.5, diharapkan hasil akhir dapat
Adapun keluarga miskin yang menjadi penerima membantu pihak yang berwenang dalam membuat
bantuan iuran JKN, yaitu sebanyak 86,4 jiwa akan kebijakan, sehingga kedepannya penerima bedah
tetap ditanggung dengan Kartu Indonesia Sehat. rumah ini tepat dengan sasarannya [6].
Program Jaminan Kesehatan Nasional (JKN) Sementara itu, Setyawan (2014) menjelaskan
merupakan program pelayanan kesehatan dengan terkait klasifikasi prestasi akademik mahasiswa
sistem asuransi dimana seluruh warga negara fakultas Komunikasi dan Informatika UMS dalam hal
Indonesia nantinya diharapkan mulai menggunakan memberikan rencana strategis bagi pihak fakultas
program ini sebagai bentuk kepedulian terhadap berdasarkan interpretasi hasil. Metode yang digunakan
kesehatan [1]. Peserta Bantuan Iuran (PBI) telah adalah metode Decision Tree dengan tujuan dapat
dijelaskan didalam Peraturan pemerintah Nomor 101 menghasilkan indeks prestasi mahasiswa yang
tahun 2012 tentang Penerimaan Bantuan Iuran memuaskan [7].
Jaminan Kesehatan bahwa masyarakat penerima Berdasarkan permasalahan diatas, dilakukan suatu
bantuan iuran adalah orang-orang yang tergolong fakir Teknik Mining untuk mencari probabilitas terbesar
miskin dan tidak mampu yang ditentukan oleh dari masyarakat untuk dapat menerima Kartu
pemerintah. Masyarakat yang ditetapkan oleh Indonesia Sehat. Algoritma Naïve Bayes Classifier
pemerintah sebagai Peserta Bantuan Iuran (PBI), merupakan algoritma yang dapat menjawab dari
Jaminan Kesehatan Nasional (JKN) tidak akan persoalan tersebut dimana pengklasifikasian dilakukan

Aziz Abdul Rahman, Yogiek Indra Kurniawan (2018) 210-216 211
dengan menghitung nilai probabilitas untuk setiap P(C│X) : Probabilitas hipotesis C berdasar kondisi X
kejadian dari atribut target pada setiap kasus. Tujuan (probabilitas posterior)
dari penelitian ini adalah untuk menghasilkan suatu P(C) : Probabailitas hipotesis C (probabilitas prior)
sistem yang dapat memberikan output berupa hasil P(X│C) : Probablitas X berdasarkan kondisi pada
perhitungan dari Algoritma Naïve Bayes Classifier hipotesis C
yaitu berupa hasil Penerima Kartu Indonesia Sehat. P(X) : Probabilitas X
Dengan adanya sistem tersebut diharapkan dapat
membantu dalam menyajikan informasi Penerima
Kartu Indonesia Sehat yang lebih akurat. Penerapan dengan algoritma Naïve Bayes
dimaksudkan untuk mencari probabilitas variabel dari
II. METODOLOGI PENELITIAN setiap kemungkinan untuk dapat dinyatakan sebagai
Metodologi penelitian yang digunakan dalam penerima Kartu Indonesia Sehat. Data pelatihan yang
penelitian ini memiliki tahapan yang harus dilalui, digunakan sebanyak 650 data masyarakat. Oleh karena
diantaranya seperti pada gambar 1 berikut: itu, perulangan pencarian confidence dilakukan
sebanyak dari data pelatihan yang telah diperoleh.
Gambar 2 merupakan Flowchart dari sistem yang
dibangun untuk mendapatkan hasil confidence
tertinggi pada variabel yang dicari yaitu penerima
Gambar 1. Tahapan Metodologi Penelitian Kartu Indonesia Sehat.
2.1 Identifikasi Masalah

Identifikasi masalah merupakan tahap awal dari
penelitian ini. Identifikasi masalah dilakukan untuk
mengidentifikasi permasalahan yang muncul seperti
dalam proses penentuan penerima Kartu Indonesia
Sehat dinilai belum optimal. Menanggapi
permasalahan tersebut, diperlukan suatu informasi
untuk membangun sistem klasifikasi penentuan
penerima Kartu Indonesia Sehat pada Dinas Sosial
Kabupaten Sukoharjo. Data yang digunakan sebagai
bahan pertimbangan penentuan penerima Kartu
Indonesia Sehat adalah usia, pendidikan terakhir,
pekerjaan, pendapatan per bulan dan tanggungan anak.
2.2 Studi Literature

Studi literature dilakukan dalam pencarian informasi Gambar 2. Flowchart Naïve Bayes dalam Sistem
terkait teori, konsep dan metode yang relevan dengan
identifikasi masalah. Berdasarkan permasalahan yang Keterangan
dihadapi, penulis melakukan Studi literature pada n : Jumlah keseluruhan data
buku yang membahas mengenai Data Mining, Naive m : Jumlah variabel independent
Bayes Classifier, Jurnal dan penelitian yang telah Yi : Variabel label i
dilakukan sebelumnya. Adapun penjelasan mengenai P(Yi) : Probabilitas dari Yi
studi literature yang penulis gunakan sebagai acuan Xij : Data uji i yang dilakukan
dalam pemecahan masalah adalah sebagai berikut: : pengujian pada setiap variabel j
Deng, et al (2014) mengemukakan bahwa Naïve P(Xij) : Probabilitas data uji i pada setiap
Bayes Classifier dikenal sebagai pengklasifikasi : variabel j
bayesian sederhana dan telah menjadi model
probabilistik yang penting dan telah berhasil dalam 2.3 Pengumpulan Data
praktiknya. Walaupun memiliki asumsi independensi Pengumpulan data merupakan tahap inti dari suatu
yang kuat, Naïve Bayes Classifier telah terbukti efektif penelitian dimana data ini akan menentukan
dalam klasifikasi teks, diagnosa medis dan manajemen probabilitas penerima Kartu Indonesia Sehat. Data
kinerja computer [8]. Teorema Bayes ditunjukkan yang digunakan dalam penelitian ini diperoleh dari
pada persamaan 1 berikut [9]: Dinas Sosial Kabupaten Sukoharjo. Data tersebut
dikumpulkan dan ditentukan oleh variabel-variabel
𝑃(𝑥|𝑐) . 𝑃(𝐶)
𝑃(𝐶 |𝑋) = (1) yang ada dalam hipotesis. Data yang digunakan
𝑃(𝑋)
sebagai bahan pertimbangan penentuan penerima
Kartu Indonesia Sehat untuk membantu dalam
Keterangan
pengembangan sistem seperti pada tabel 1 berikut:
X : Data dengan kelas yang belum diketahui
C : Hipotesis data X merupakan suatu kelas
Tabel 1. Variabel
spesifik

WIRASWAST
39 SLTP RENDAH 2 YA
A
Tipe
No Variabel Value KARYAWAN
Data 58 SLTP CUKUP 2 YA
SWASTA
a) A1 : Usia < 20 DIPLOMA IV/ PEGAWAI SANGAT
Tahun 52 3 TIDAK
STRATA I NEGERI SIPIL TINGGI
b) A2 : Usia 20 –
40 Tahun AKADEMI/
69 PENSIUNAN TINGGI 0 TIDAK
Polyno c) A3 : Usia 40 – DIPLOMA III
1 Usia
mial 60 Tahun BURUH
d) A4 : Usia 60 – 32 SLTA HARIAN RENDAH 1 YA
80 Tahun LEPAS
e) A5 : Usia > 80 AKADEMI/ KARYAWAN
39 CUKUP 0 TIDAK
Tahun DIPLOMA III SWASTA
Tidak/ Belum Sekolah,
DIPLOMA IV/ PEGAWAI
Belum Tamat SD, 31
STRATA I NEGERI SIPIL
TINGGI 2 TIDAK
Tamat SD, SLTP,
Pendidikan Polyno
2 SLTA, Diploma I/II, WIRASWAST
Terakhir mial 50 SLTP RENDAH 2 YA
Akademi/ Diploma III, A
Diploma IV/ Strata I,
Strata II, Strata III
Karyawan Swasta,
Wiraswasta, Buruh
Harian Lepas, Tukang
Tabel 3. Data Uji
Polyno
3 Pekerjaan Batu, Tukang Jahit,
mial
Guru, Pegawai Negeri PENDIDIKA
USI PENDAPATA T TERIMA
Sipil, Karyawan BUMN, N PEKERJAAN
A N A KIS?
Dosen, dll TERAKHIR
a) Kurang dari Rp. KARYAWAN
44 SLTA CUKUP 2 ?
500.000  SWASTA
Sangat Rendah
b) Rp. 500.000 –
Rp. 999.999  Hasil dari penelitian ini, sistem melakukan
Rendah perhitungan dengan menggunakan Naive Bayes dan
c) Rp. 1.000.000 –
4
Pendapatan Polyno
Rp. 1.499.999
menghasilkan nilai confidence pada setiap variabel Y
per Bulan mial untuk setiap variabel. Masyarakat penerima Kartu
 Sedang
d) Rp. 1.500.000 – Indonesia Sehat dikeluarkan oleh sistem berdasarkan
Rp. 1.999.999
 Tinggi nilai terbesar. Apabila diberikan sebuah masukan data
e) Lebih dari Rp. uji baru seperti pada tabel 3, maka perhitungan dapat
2.000.000 
Sangat Tinggi dijabarkan sebagai berikut:
Tanggunga Polyno 1) Menghitung probabilitas kelas (Y)
5
n Anak mial
0, 1, 2, 3, 4, 5, > 5
5
𝑃 (𝑌 = 𝑌 ) = = 0.5
6 Terima KIS Label YA, TIDAK 10
5
𝑃(𝑌 = 𝑇𝐼𝐷𝐴𝐾 ) = = 0.5
10
2.4 Pengolahan Data
2) Menghitung probabilitas Xi dimana i = 1,2,3,4,5
Pengolahan data merupakan tahapan yang harus
terhadap variabel Y
dilewati setelah data berhasil diperoleh. Pada tahap ini 3
dilakukan Pembersihan Data atau Data Cleansing. 𝑃(𝑈𝑆𝐼𝐴 = 𝐴3 | 𝑌 = 𝑌𝐴) = = 0.6
5
Pembersihan Data atau Data Cleansing merupakan 1
suatu proses yang harus dilakukan untuk 𝑃(𝑈𝑆𝐼𝐴 = 𝐴3 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) = = 0.2
5
menghilangkan noise dari data-data yang telah diambil 1
𝑃(𝑃𝐸𝑁𝐷𝐼𝐷𝐼𝐾𝐴𝑁 𝑇𝐸𝑅𝐴𝐾𝐻𝐼𝑅 = 𝑆𝐿𝑇𝐴 | 𝑌 = 𝑌𝐴) =
sebelumnya. Data Cleansing digunakan untuk 5
menyeragamkan data-data kedalam bentuk format = 0.2
yang sama sehingga dapat menghasilkan hasil mining 𝑃(𝑃𝐸𝑁𝐷𝐼𝐷𝐼𝐾𝐴𝑁 𝑇𝐸𝑅𝐴𝐾𝐻𝐼𝑅 = 𝑆𝐿𝑇𝐴 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾)
1
yang akurat. Setelah selesai Data Cleansing, dilakukan = = 0.2
5
perhitungan dari data yang telah penulis peroleh. 𝑃(𝑃𝐸𝐾𝐸𝑅𝐽𝐴𝐴𝑁 = 𝐾𝐴𝑅𝑌𝐴𝑊𝐴𝑁 𝑆𝑊𝐴𝑆𝑇𝐴 | 𝑌 = 𝑌𝐴)
Tabel 2 merupakan potongan dari data pelatihan yang 2
digunakan dalam penelitian ini dan data tabel 3 adalah = = 0.4
5
sampel data uji. 𝑃(𝑃𝐸𝐾𝐸𝑅𝐽𝐴𝐴𝑁 = 𝐾𝐴𝑅𝑌𝐴𝑊𝐴𝑁 𝑆𝑊𝐴𝑆𝑇𝐴 | 𝑌
1
= 𝑇𝐼𝐷𝐴𝐾) = = 0.2
Tabel 2. Data Pelatihan 5
1
𝑃(𝑃𝐸𝑁𝐷𝐴𝑃𝐴𝑇𝐴𝑁 = 𝐶𝑈𝐾𝑈𝑃 | 𝑌 = 𝑌𝐴) = = 0.2
PENDIDIKA 5
USI
N PEKERJAAN
PENDAPATA T TERIM
1
A
TERAKHIR
N A A KIS?
𝑃(𝑃𝐸𝑁𝐷𝐴𝑃𝐴𝑇𝐴𝑁 = 𝐶𝑈𝐾𝑈𝑃 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) =
5
58 TAMAT SD
KARYAWAN
SWASTA
RENDAH 0 YA = 0.2
3
𝑃(𝑇𝐴𝑁𝐺𝐺𝑈𝑁𝐺𝐴𝑁 𝐴𝑁𝐴𝐾 = 2 | 𝑌 = 𝑌𝐴) = = 0.6
63 SLTA PENSIUNAN TINGGI 1 TIDAK 5

1
𝑃(𝑇𝐴𝑁𝐺𝐺𝑈𝑁𝐺𝐴𝑁 𝐴𝑁𝐴𝐾 = 2 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) =
5 Sedangkan Recall merupakan model perhitungan
= 0.2 untuk mencari hasil proporsi kasus positif yang
diidentifikasi dengan benar. Rumus untuk perhitungan
3) Menghitung probabilitas akhir nilai recall seperti pada persamaan 4 berikut:
𝑃(𝐾𝐿𝐴𝑆𝐼𝐹𝐼𝐾𝐴𝑆𝐼 = 𝑌𝐴)
= 𝑃(𝑋 | 𝑌 = 𝑌𝐴) . 𝑃(𝑌 = 𝑌𝐴) 𝑇𝑃
3 1 2 1 3 5 𝑅𝑒𝑐𝑎𝑙𝑙 = (4)
𝑇𝑃+𝐹𝑁
= x x x x x
5 5 5 5 5 10 Keterangan:
= 0.00288 TP : True Positive FP : False Positive
𝑃(𝐾𝐿𝐴𝑆𝐼𝐹𝐼𝐾𝐴𝑆𝐼 = 𝑇𝐼𝐷𝐴𝐾) TN : True Negative FN : False Negative
= 𝑃(𝑋 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) . 𝑃(𝑌
= 𝑇𝐼𝐷𝐴𝐾)
1 1 1 1 1 5 2.8 Kesimpulan
= x x x x x Pada tahap kesimpulan ini, penulis menyimpulkan
5 5 5 5 5 10
= 0.00016 bahwa sudahkah tujuan yang diharapkan telah tercapai
dalam implementasi sistemnya.
Dari perhitungan diatas, terlihat bahwa nilai
probabilitas terbesar adalah pada 3 HASIL DAN PEMBAHASAN
P(KLASIFIKASI=YA). Maka dapat disimpulkan Penelitian ini berhasil mengumpulkan 2 jenis data
bahwa data yang telah dimasukkan sebagai uji coba diantaranya data pelatihan dan data uji dengan
adalah masyarakat penerima Kartu Indonesia variabel: Usia, Pendidikan Terakhir, Pekerjaan,
SehatDari perhitungan diatas, terlihat bahwa nilai Pendapatan per Bulan serta Tanggungan Anak.
probabilitas terbesar adalah pada Penelitian ini menghasilkan suatu sistem yang dapat
P(KLASIFIKASI=YA). Maka dapat disimpulkan melakukan perhitungan dengan menggunakan
bahwa data yang telah dimasukkan sebagai uji coba algoritma Naive Bayes dan menghasilkan nilai
adalah masyarakat penerima Kartu Indonesia Sehat. confidence pada setiap variabel Y untuk setiap
variabel Masyarakat penerima Kartu Indonesia Sehat.
2.5 Pembuatan Aplikasi Sistem tersebut nantinya dapat mengklasifikasikan
Aplikasi yang dirancang oleh penulis berbasis website. masyarakat penerima Kartu Indonesia Sehat
Bahasa Pemrograman yang digunakan dalam berdasarkan nilai peluang terbesar.
pembuatan aplikasi adalah PHP dan Sublime Text 3.1 Tampilan Aplikasi
sebagai editornya. sedangkan MYSQL digunakan 3.1.1 Halaman Utama
untuk membangun database dari aplikasi. Tampilan halaman utama merupakan tampilan awal
ketika user pertama kali membuka sistem. Pada
2.6 Pengujian halaman awal terdapat penjelasan singkat mengenai
Pada tahap ini, aplikasi yang telah dibuat dilakukan sistem dan menu untuk login. Menu login digunakan
pengujian accuracy, precision dan recall. Pengujian oleh admin untuk dapat masuk kedalam sistem dengan
ini dilakukan untuk mengetahui tingkat accuracy, memasukkan Username dan Password yang telah
precision dan recall terhadap output yang dihasilkan terdaftar.
oleh aplikasi. 3.1.2 Halaman Beranda
Setelah admin masuk ke dalam sistem, terdapat
2.7 Analisa Hasil beberapa menu dalam sistem, diantaranya seperti
Pada Analisa hasil ini dilakukan perhitungan tingkat menu Data Total, Data Training, Data Testing, Data
accuracy, precision dan recall untuk menguji tingkat Prediksi, Analisa Hasil, Ubah Password dan Logout.
accuracy aplikasi yang telah dibangun. Accuracy 3.1.3 Halaman Ubah Password
adalah perhitungan untuk mendapatkan hasil dari Menu Ubah Password merupakan menu untuk
proporsi jumlah prediksi yang benar [10]. Rumus mengganti password user.
untuk perhitungan nilai accuracy seperti pada 3.1.4 Halaman Data Total
persamaan 2 berikut: Menu Data Total merupakan menu yang berisi
keseluruhan data yang diambil dari sumber data.
𝑇𝑃+𝑇𝑁 Didalam menu Data Total terdapat fitur import untuk
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = (2)
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 memasukkan data dalam jumlah besar sekaligus.
Selain itu, fitur pencarian juga tersedia dalam menu ini
untuk memudahkan dalam pencarian data yang lebih
Kemudian Precision adalah perhitungan untuk spesifik. Gambar 3 merupakan tampilan dari Data
mencari hasil proporsi kasus dengan hasil diagnosa Total.
positif. Rumus untuk perhitungan nilai precision
seperti pada persamaan 3 berikut:
𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃+𝐹𝑃 (3)

dapat melihat dan mencetak hasil perhitungan yang

dilakukan oleh sistem.
3.1.8 Halaman Analisa Hasil
Sementara itu, Menu Analisa Hasil merupakan menu
untuk mengetahui tingkat accuracy, precision maupun
recall terhadap penilaian yang dilakukan oleh sistem.
Gambar 5 menunjukkan tampilan dari menu Analisa
Hasil.
Gambar 3. Tampilan Data Total Sistem
3.1.5 Halaman Data Training

Menu Data Training merupakan menu yang berisi
data-data pelatihan untuk menganalisa data-data yang
dilatihkan. Didalam menu Data Taining, terdapat fitur
import, dimana fitur tersebut dapat memasukkan data
dari file excel dalam jumlah yang besar sekaligus. Hal Gambar 5. Tampilan Hasil Analisa Sistem
ini tentu memudahkan admin dalam memasukkan data
dalam jumlah yang besar. Selain itu, fitur pencarian 3.2 Pengujian Sistem
juga tersedia dalam menu ini. 3.2.1 Pengujian Black Box
3.1.6 Halaman Data Testing Pengujian black box dilakukan untuk menguji
Menu Data Testing merupakan menu yang berisi data- operasional dari sistem yang telah dibuat. Pengujian
data masyarakat yang akan atau telah dilakukan ini bertujuan untuk mengetahui fungsionalitas dari
pengujian. Data-data tersebut nantinya dapat sistem. Secara keseluruhan, hasil yang didapatkan dari
menginformasikan kepada admin terkait masyarakat aplikasi telah berjalan dengan baik. Tabel 4
yang akan menerima Kartu Indonesia Sehat. Selain merupakan rincian fungsionalitas dari sistem.
melihat hasil perhitungan, fitur Cetak juga tersedia
dalam sistem ini untuk mencetak dalam bentuk hard Tabel 4. Hasil Pengujian Black Box
copy yang telah tersimpan dalam format PDF. Gambar
4 merupakan tampilan dari perhitungan yang Menu Input
Hasil Yang
Kesimpulan
Diharapkan
dilakukan oleh sistem. Memasukkan
Menampilkan
Username dan
Login Halaman Valid
Password yang
Beranda
benar
Tombol Memasukkan Data Menampilkan
Valid
Import Data Dari File Excel Pesan Sukses
Menampilkan
Memasukkan Data
Form-Form Untuk
Tombol Prediksi Yang
Masukan Data
Tambah Bertujuan Untuk Valid
Yang Akan
Prediksi Mengetahui Hasil
Dilakukan
Klasifikasi
Prediksi
Menampilkan
Tombol Memasukkan Data Pesan Sukses
Valid
Simpan Yang Telah Terisi dan Pop Up Hasil
Perhitungan
Klik Icon Lihat
Perhitungan Untuk
Tombol Menampilkan
Melihat Hasil
Lihat Halaman Hasil Valid
Perhitungan Yang
Perhitungan Perhitungan
Dilakukan Oleh
Sistem
Menampilkan
Klik Tombol Hitung Pesan Sukses
Tombol
Prediksi untuk dan
Gambar 4. Tampilan Hasil Perhitungan Oleh Sistem Hitung
menghitung prediksi Mengaktifkan
Valid
Prediksi
3.1.7 Halaman Data Prediksi dari data testing Button Analisa
Hasil
Menu Data Prediksi adalah menu yang berisi data-data Menampikan
masyarakat yang telah dilakukan prediksi apakah Klik Tombol Analisa Hasil
masyarakat tersebut berhak atau tidak menerima Kartu Tombol Hasil Untuk Melihat Perhitungan
Analisa Hasil Perhitungan Tingkat Valid
Indonesia Sehat. Selain itu, admin juga dapat melihat Hasil Yang Dilakukan Accuracy,
hasil perhitungan yang dilakukan oleh sistem dengan Oleh Sistem Precision dan
Recall
cara klik icon “Lihat” pada kolom Lihat Perhitungan. Klik Tombol Cetak
Sama seperti pada menu Data Testing, admin juga Menampilkan
Tombol Untuk Mencetak
Hard Copy Hasil Valid
Cetak Hasil Perhitungan
Perhitungan
Yang Dilakukan

Oleh Sistem telah dilakukan, didapatkan kedua hasil baik dari

perhitungan secara manual maupun perhitungan yang
Keluar Dari
Tombol
Klik Menu Logout
Sistem Dan dilakukan oleh sistem menghasilkan nilai yang sama.
Untuk Keluar Dari Valid
Logout
Sistem
Menampilkan Dengan begitu, sistem yang telah dibangun
Halaman Login
sebelumnya dapat dipertanggungjawabkan hasil
perhitungannya.
3.2.2 Pengujian Algoritma Naïve Bayes 3.2.3 Pengujian Accuracy, Precision dan Recall
Pada pengujian Algoritma Naïve Bayes, dilakukan Pada penelitian ini, peneliti melakukan percobaan
suatu pengujian terhadap hasil yang dilakukan oleh pengujian data testing sebanyak 13 kali percobaan
sistem. Pengujian ini dilakukan perhitungan secara dengan data testing yang diambil secara acak. Dari
manual untuk menguji apakah hasil perhitugan dari pengujian tersebut menghasilkan nilai accuracy,
sistem sama dengan hasil perhitungan yang dilakukan precision serta recall. Adapun hasil pengujian
secara manual. Pada pengujian ini, kami dijelaskan pada tabel 5 berikut:
menggunakan sampel data training sebanyak 10 data
dan 3 data sebagai data uji. Dari hasil pengujian yang
Tabel 5. Hasil Pengujian Accuracy, Precision dan Recall
Data Training Data Testing Data

Data
No Kegiatan Yang Yang Tidak Nilai Accuracy Nilai Precision Nilai Recall
Sesuai
Digunakan Digunakan Sesuai
1 Uji Coba 1 50 619 531 88 85.78% 98.79% 74.16%
2 Uji Coba 2 100 569 533 36 93.67% 98.21% 89.84%
3 Uji Coba 3 150 519 484 35 93.26% 98.04% 89.29%
4 Uji Coba 4 200 469 433 36 92.32% 97.80% 87.75%
5 Uji Coba 5 250 419 396 23 94.51% 99.03% 90.67%
6 Uji Coba 6 300 369 358 11 97.02% 98.95% 95.43%
7 Uji Coba 7 350 319 311 8 97.49% 98.79% 96.45%
8 Uji Coba 8 400 269 262 7 97.40% 98.58% 96.53%
9 Uji Coba 9 450 219 212 7 96.80% 98.17% 95.54%
10 Uji Coba 10 500 169 163 6 96.45% 98.82% 94.38%
11 Uji Coba 11 550 119 114 5 95.80% 100% 92.19%
12 Uji Coba 12 600 69 66 3 95.65% 100% 91.67%
13 Uji Coba 13 650 19 18 1 96% 100% 88.89%
RATA-RATA 94.78% 98.86% 90.98%
3.3 Analisa Hasil Terakhir, Pekerjaan, Pendapatan per Bulan serta

Analisa hasil dimaksudkan untuk menganalisa hasil Tanggungan Anak. Sebelum admin dapat melakukan
terkait fungsionalitas dari iystem yang telah dirancang klasifikasi, seorang admin harus memasukkan data
sebelumnya. Seorang admin dapat melakukan terlebih dahulu seperti Username dan Password yang
klasifikasi masyarakat penerima atau bukan penerima telah terdaftar untuk dapat masuk kedalam sistem.
kartu Indonesia sehat dengan memasukkan data-data Setelah admin masuk kedalam sistem, terdapat
pribadi setiap individu seperti Usia, Pendidikan beberapa fitur dalam sistem seperti import data,

pencarian data secara spesifik, lihat hasil perhitungan, Puskesmas Kokop Kecamatan Kokop Kabupaten
ubah password hingga cetak hasil perhitungan tersedia Bangkalan," Ilmu Administrasi Negara, vol. 4,
dalam sistem untuk memudahkan seorang admin no. 1, 2016.
dalam mengolah data. [3] D. M. Agustina, "Analisis Perbandingan
Pada pengujian black box terlihat fungsionalitas Algoritma ID3 Dan C4.5 Untuk Klasifikasi
sistem dapat berjalan dengan baik, begitu juga dengan Penerima Hibah Pemasangan Air Minum Pada
hasil perhitungan yang dilakukan secara manual PDAM Kabupaten Kendal," Journal of Applied
dengan hasil perhitungan oleh sistem menghasilkan Intelligent System, vol. 1, no. 3, pp. 234-244,
hasil yang sama sehingga sistem tersebut dapat 2016.
dipertanggungjawabkan kebenaran hasilnya. Selain itu,
pengujian tingkat accuracy, precision dan recall yang [4] Y. I. Kurniawan, H. Nugroho and H. N. Prasetyo,
dilakukan sebanyak 13 kali percobaan menghasilkan "Sistem Pendukung Keputusan untuk Pemberian
rata-rata nilai accuracy sebesar 94.78%, precision Beasiswa dengan Metode Simple Additive
98.86% dan recall 90.98%. Tingkat accuracy yang Weighting Studi Kasus: Politeknik Telkom," in
telah dilakukan sebanyak 13 kali percobaan cenderung Konferensi Nasional ICT-M Politeknik Telkom
meningkat karena dengan adanya data pelatihan yang (KNIP), Bandung, 2012.
banyak tentu akan mengdapatkan hasil yang akurat. [5] Mulyadi, "Penerapan Algoritma Naive Bayes
Selain itu tingkat precision juga terlihat meningkat Untuk Klasifikasi Penerima Beasiswa Prestasi,"
karena semakin banyak data pelatihan semakin tinggi Jurnal Sistem Informasi Stmik Antar Bangsa, vol.
pula tingkat ketepatan antara data pelatihan dan data 5, no. 2, pp. 139-145, 2016.
testing yang diujikan. Begitu juga tingkat recall [6] K. Zaman, "Penerapan Data Mining
diperoleh hasil yang tidak stabil diakibatkan tingkat Menggunakan Algoritma C4.5 Untuk
keberhasilan sistem dalam menemukan kembali Menentukan Kelayakan Penerima Bantuan
sebuah informasi. Rehabilitas Sosial Rumah Tidak Layak Huni
(Studi Kasus Di Pemerintahan Kabupaten Solok
4 KESIMPULAN Selatan)," UPI YPTK Jurnal KomTekInfo, vol. 3,
Berdasarkan hasil penelitian, beberapa kesimpulan no. 2, pp. 12-24, 2016.
yang dapat diambil yaitu: [7] Setyawan, "Klasifikasi Prestasi Akademik
1. Aplikasi Klasifikasi ini dapat membantu seorang Mahasiswa FKI UMS Menggunakan Metode
admin dalam menentukan klasifikasi masyarakat Decision Tree," 2014.
penerima atau bukan penerima Kartu Indonesia
Sehat [8] H. Deng, Y. Sun, Y. Chang and J. Han,
2. Hasil klasifikasi Penerima Kartu Indonesia Sehat "Probabilistic Models for Classification," in Data
dapat dilihat berdasarkan confidence tertinggi Classification: Algorithms and Applications, 1
yang dihasilkan dari perhitungan setiap variabel ed., Minnesota, Chapman and Hall/CRC, 2014, p.
yang telah ditentukan. 67.
3. Berdasarkan pengujian data testing sebanyak 13 [9] D. Dahri, F. Agus and D. M. Khairina, "Metode
kali percobaan menghasilkan rata-rata nilai Naive Bayes Untuk Penentuan Penerima
accuracy sebesar 94.78%, precision 98.86% dan Beasiswa Bidikmisi Universitas Mulawarman,"
recall 90.98%. Jurnal Informatika Mulawarman, vol. 11, no. 2,
pp. 29-36, 2016.
5. DAFTAR PUSTAKA [10] T. Vafeiadis, K. Diamantaras, G. Sarigiannidis
[1] Q. Sabrina, "Pelaksanaan Program Jaminan and K. Chatzisavvas, "A Comparison of Machine
Kesehatan Nasional (JKN) Dalam Peningkatan Learning Techniques for Customer," Simulation
Kualitas Pelayanan Kesehatan Di RSU Haji Modelling Practice and Theory, vol. 55, pp. 1-9,
Surabaya," Kebijakan dan Manajemen Publik, 2015.
vol. 3, no. 2, pp. 54-62, 2015.
[2] U. Hasanah, "Implementasi Program Jaminan
Kesehatan Nasional Pemberian Bantuan Iuran Di

APLIKASI KLASIFIKASI PENENTUAN PENGAJUAN KARTU KREDIT
MENGGUNAKAN METODE NAIVE BAYES DI BANK BNI SYARIAH SURABAYA
Monika Antaristi 1), Yogiek Indra Kurniawan 2)

1), 2)
Program Studi Informatika, Fakultas Komunikasi dan Informatika
monika.antaristi11@gmail.com1), yogiek@ums.ac.id 2)
Abstract
Bank is one of which are engaged in financial services, which one of services is giving credit cards to
customers with certain conditions that had been determined by the bank. Problems arising from the
provision of credit cards to bank customers is difficulty analyst credit cards in determining the
appropriate credit card to the customers. This research is conducted in order to help analyst credit cards
in classifying customers to get a credit card that right. Implementation of naive bayes method in this
research to classify prospective credit card customers to get the best and best results by utilizing
customer data of BNI Syariah Bank Surabaya. The naive bayes method is used to find the pattern of
customers who have been accepted in credit card application with the variables obtained from factors
used are sex, home status, status, the number of dependents, profession, and income every year. The
results of this research shows that an average of the value of precision of 100%, the value of recall of
95%, and the value of accuracy of 98,67%. Thus, this application is effective to help analyst credit cards
in classifying customers to get credit card proper, that would give a credit card best appropriate criteria.
Keywords: application, data mining, classification, naive bayes, the determination of a credit card
1. PENDAHULUAN mempermudah dalam menentukan pengambilan

Bank merupakan salah satu lembaga yang keputusan untuk penetuan penerima beasiswa dalam
bergerak dalam bidang jasa keuangan, yang salah satu studi kasusnya.
pelayanannya adalah pemberian kartu kredit kepada Pujianto, Wahyudi, & Wibawa (2016)
para nasabah dengan syarat tertentu yang sudah mengungkapkan bahwa metode naive bayes dapat
ditentukan oleh pihak bank. Permasalahan yang timbul digunakan untuk membantu menyelesaikan
dari adanya pemberian kartu kredit kepada nasabah permasalahan kebanyakan mahasiswa, yang
bank tersebut adalah sulitnya analis kartu kredit dalam kebingungan pada saat memilih lokasi praktik industri.
menentukan jenis kartu kredit yang sesuai untuk Penelitian ini menghasilkan sistem rekomendasi yang
nasabah. Berdasarkan permasalahan tersebut, merupakan sistem pendukung keputusan yang
diperlukan sebuah aplikasi klasifikasi guna membantu dirancang untuk membantu menyelesaikan
bagian analis kartu kredit dalam mengklasifikasikan permasalahan pemilihan kategori perusahaan
jenis kartu kredit yang sesuai untuk nasabah. menggunakan metode naive bayes.
Metode naive bayes telah banyak digunakan Deepa & Vijayarani (2014) mengatakan bahwa
untuk memprediksi sebuah kasus tertentu di dalam menggunakan metode naive bayes dapat membantu
berbagai penelitian. Seperti Kurniawan & Kristanto mengklasifikasikan urutan protein yang berpenyakit
(2016) menyatakan menggunakan metode naive bayes dimana teknik analisis data yang masih tradisional.
pada penelitiannya untuk meminimalisir kerugian Hasil dari penelitian ini mampu memberikan
pihak BMT Beringharjo. Penelitian ini menghasilkan informasi yang berguna tentang klasifikasi urutan
sebuah aplikasi sebagai alat bantu untuk protein yang berpenyakit ke dalam beberapa penyakit
memprediksikan resiko kelayakan kredit yang diantaranya sickle cell anemia, mild hemolytic
memperkirakan layak atau tidaknya nasabah untuk symptom, haemophilia, cystic fibrosis, dan
diberikan kredit. thalasemia.
Sementara itu, menurut Saleh (2015) Berdasarkan analisis diatas, metode naive bayes
implementasi metode klasifikasi naive bayes dapat dapat digunakan untuk membuat aplikasi klasifikasi
memprediksi besarnya penggunaan listrik rumah dalam beberapa kasus. Oleh sebab itu, metode naive
tangga agar memudahkan saat mengatur bayes dalam penelitian ini digunakan untuk klasifikasi
penggunaannya. Khairina, Dahri & Agus (2016) penentuan pengajuan kartu kredit. Penelitian ini
mengatakan bahwa dengan menggunakan metode menggunakan sampel yang diambil dari Bank BNI
naive bayes menghasilkan sebuah sistem pendukung Syariah Surabaya yang digunakan sebagai data
keputusan untuk penentuan penerima beasiswa pelatihan untuk mengklasifikasi jenis kartu kredit
bidikmisi yang dapat membantu pihak penyeleksi yang akan diterima oleh nasabah atau pemohon. Naive
beasiswa bidikmisi dalam membuat keputusan bayes dimanfaatkan untuk mencari pola nasabah yang
penerima beasiswa. Kurniawan dan Windiasani (2017) sudah diterima dalam pengajuan kartu kredit dengan
juga mengatakan dengan adanya sebuah sistem dapat variabel yang didapat dari faktor-faktor

Monika Antaristi, Yogiek Indra Kurniawan (2018) 217-223 218
pendukungnya. Faktor yang digunakan adalah jenis X4 : Jumlah Polynomial 0, 0 < anak ≤ 2, dan
kelamin, status rumah, status, jumlah tanggungan, Tanggungan anak > 2.
X5 : Profesi Polynomial PNS, BUMN, dan
profesi, dan penghasilan per tahunnya. Tujuan SWASTA.
penelitian ini adalah untuk menghasilkan sebuah X6 : Polynomial Rendah, Sedang, Tinggi
aplikasi berbasis web yang dapat membantu pihak Penghasilan dan Sangat Tinggi.
analis kartu kredit dalam mengklasifikasikan nasabah per tahun
Y : Kartu Polynomial Tidak diterima, Classic,
untuk mendapatkan kartu kredit yang tepat, sehingga Kredit Gold, dan Platinum.
dapat memberikan kartu kredit yang terbaik yang 2.4 Desain
sesuai kriteria. Desain bertujuan untuk menggambarkan bagaimana
proses dari sebuah aplikasi yang dibuat secara
2. METODOLOGI keseluruhan menggunakan metode naive bayes. Pada
Metodologi yang digunakan pada penelitian ini, dapat gambar 2 dibawah ini, adalah use case dari aplikasi.
digambarkan sebagai berikut:
Gambar 2.2 Use Case Aplikasi

2.4.1 Pengolahan Data Master
Pada pengolahan data master ini, admin dapat
memasukkan data training satu per-satu ke dalam
aplikasi atau dengan mengunggah file berekstensi
excel untuk data yang besar. Selain itu, pada
pengolahan data master ini admin dapat meng-update
dan menghapus data yang telah dimasukkan.
2.4.2 Pengujian Naive Bayes
Pengujian naive bayes ini bertujuan untuk menghitung
Gambar 2.1 Tahapan Metodologi Penelitian seberapa akurat hasil dari sistem, dengan memasukkan
2.1 Analisis Masalah beberapa data testing dengan jumlah yang berbeda-
Pada tahap analisis masalah ini digunakan untuk beda. Dari data yang dimasukkan, maka dapat
mengetahui permasalahan-permasalahan yang muncul dihitung precision, recall, dan accuracy dari aplikasi
pada adanya pemberian kartu kredit kepada nasabah. tersebut.
Berdasarkan permasalahan yang ada, maka 2.4.3 Klasifikasi Naive Bayes
dibutuhkan untuk membangun sebuah aplikasi Pada tahap ini, aplikasi memunculkan hasil klasifikasi
klasifikasi penentuan pengajuan kartu kredit sebagai dari data testing yang telah diinputkan. Hasil
alat bantu analis kartu kredit dalam mengklasifikasi klasifikasi berupa kartu kredit yang sesuai untuk
jenis kartu kredit yang sesuai untuk setiap nasabah. nasabah berdasarkan perhitungan menggunakan
2.2 Pengumpulan Data metode naive bayes.
Data yang digunakan dalam penelitian ini yaitu data 2.5 Implementasi
nasabah kartu kredit dari Bank BNI Syariah Surabaya Pada tahap ini aplikasi mulai dibangun dengan
yang berjumlah 290 sebagai data training. Sedangkan mengimplementasikan desain yang sudah dibuat.
data testing menggunakan sampel yang didapatkan Aplikasi yang dibuat berbasis web dengan
dari data training. menggunakan bahasa pemgrograman PHP dan
2.3 Analisis Data Sublime Text sebagai editornya. Sedangkan
Data yang telah diperoleh, kemudian dianalisis untuk penyimpanan database menggunakan MySQL, dan
menentukan variabel-variabel yang apa saja digunakan menggunakan metode nave bayes.
dari data nasabah kartu kredit untuk diterapkan ke Naive Bayes menurut Patil & Sherekar (2013)
dalam aplikasi. Variabel yang dibutuhkan dalam merupakan sebuah metode pengklasifikasian
penelitian ini, yaitu: probabilistik sederhana yang menghitung sekumpulan
Tabel 2.1 Variabel Penelitian probabilitas. Dengan cara menjumlahkan frekuensi
Variabel Tipe Value dan kombinasi nilai dari dataset yang diberikan.
X1 : Jenis Binomial Laki-laki, dan Metode ini merupakan salah satu metode sederhana
Kelamin perempuan.
yang dapat digunakan untuk klasifikasi berdasarkan
X2 : Status Polynomial Milik Sendiri, Milik
Rumah Keluarga, dan Sewa. teorema Bayes. Bustami (2013) mengemukakan
X3 : Status Binomial Belum Kawin, dan bahwa teorema Bayes dikemukakan oleh ilmuwan
Kawin. Inggris bernama Thomas Bayes, yaitu memprediksi

peluang di masa depan berdasarkan pengalaman di P(H|X) : Probabilitas hipotesis H berdasar kondisi X
masa sebelumnya. (posteori probabilitas)
Metode naive bayes dari teorema Bayes adalah: P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H).P(H)
P(H|X) = ............................................ (1) P(X|H) : Probabilitas X berdasarkan kondisi pada
P(X) hipotesis H
Dimana: P(X) : Probabilitas X
X : Data dengan class yang belum diketahui Berdasarkan rumus metode naive bayes diatas,
H : Hipotesis data merupakan suatu class berikut ini merupakan contoh perhitungan klasifikasi
spesifik dari 10 data acak yang diambil dari data training yang
ada sebagai berikut:
Tabel 2.2 Data Training

No Jenis Kelamin Status Rumah Status Jumlah Profesi Penghasilan Kartu Kredit
Tanggungan per-tahun
1 Pria Milik sendiri Kawin Anak > 2 BUMN Tinggi Gold
2 Wanita Milik keluarga Kawin 0 SWASTA Sedang Classic
3 Pria Sewa Kawin Anak > 2 PNS Tinggi Tidak diterima

4 Pria Milik sendiri Belum Kawin 0 SWASTA Tinggi Gold
5 Pria Milik sendiri Kawin 0 < anak ≤ 2 SWASTA Sangat tinggi Platinum
6 Pria Milik sendiri Kawin Anak > 2 SWASTA Sedang Tidak diterima
7 Wanita Milik sendiri Kawin 0 PNS Tinggi Gold
8 Wanita Milik keluarga Kawin 0 SWASTA Sangat tinggi Platinum

9 Wanita Sewa Kawin 0 BUMN Sangat tinggi Tidak diterima
10 Wanita Milik keluarga Belum kawin 0 BUMN Sedang Classic
Tabel 2.3 Data Testing yang Digunakan

No Jenis Kelamin Status Rumah Status Jumlah Profesi Penghasilan Kartu
Tanggungan per-tahun Kredit
1 Wanita Milik Sendiri Belum 0 BUMN Tinggi ?
Kawin
Perhitungan klasifikasi nasabah kartu kredit dapat P(Jumlah Tanggungan=0 | Y=Platinum) = 1/ 2 = 0,5
dihitung sebagai berikut: P(Jumlah Tanggungan=0 | Y=Tidak diterima) = 1/3 =
1. Menghitung jumlah class: 0,333
P(Y=Classic) = 2/10 = 0,2
P(Y=Gold) = 3/10 = 0,3 P(Profesi=BUMN | Y=Classic) = 1/ 2 = 0,5
P(Y=Platinum) = 2/10 = 0,2 P(Profesi=BUMN | Y=Gold) = 1/3 = 0,333
P(Y=Tidak diterima) = 3/10 = 0,3 P(Profesi=BUMN | Y=Platinum) = 1/ 2 = 0,5
2. Menghitung kasus yang sama dengan class yang P(Profesi=BUMN | Y=Tidak diterima) = 1/3 = 0,333
sama
P(Jenis Kelamin=Wanita | Y=Classic) = 2/2 = 1 P(Penghasilan per-tahun=Tinggi | Y=Classic) = 0/2 =
P(Jenis Kelamin=Wanita | Y=Gold) = 1/ 3 = 0,333 0
P(Jenis Kelamin=Wanita | Y=Platinum) = 1/ 2 = 0,5 P(Penghasilan per-tahun=Tinggi | Y=Gold) = 3/3 = 1
P(Jenis Kelamin=Wanita | Y=Tidak diterima) = 1/3 P(Penghasilan per-tahun=Tinggi | Y=Platinum) = 0/2
=0,333 =0
P(Penghasilan per-tahun=Tinggi | Y=Tidak diterima)
P(Status Rumah=Milik Sendiri | Y=Classic) = 0/2 = 0 = 1/3 = 0,333
P(Status Rumah=Milik Sendiri | Y=Gold) = 3/3 = 1
P(Status Rumah=Milik Sendiri | Y=Platinum) = 1/ 2 = HMAP dari keadaan ini dapat dihitung dengan:
0,5 P(Wanita | Classic) * P(Milik Sendiri | Classic) *
P(Status Rumah=Milik Sendiri | Y=Tidak Diterima) = P(Belum Kawin | Classic) * P(0 | Classic) * P(BUMN
1/3 = 0,333 | Classic) * P(Tinggi | Classic) * P(Classic)
2 0 1 2 1 0 2
= 2 × 2 × 2 × 2 × 2 × 2 × 10 = 0
P(Status=Belum Kawin | Y=Classic) = 1/ 2 = 0,5
P(Status=Belum Kawin | Y=Gold) = 1/3 = 0,333
P(Wanita | Gold) * P(Milik Sendiri | Gold) * P(Belum
P(Status=Belum Kawin | Y=Platinum) = 0/2 = 0
Kawin | Gold) * P(0 | Gold) * P(BUMN | Gold) *
P(Status=Belum Kawin | Y=Tidak diterima) = 0/3 = 0
P(Tinggi | Gold) * P(Gold)
1 3 1 2 1 3 3
P(Jumlah Tanggungan=0 | Y=Classic) = 2/2 =1 = × × × × × × = 0,007389
3 3 3 3 3 3 10
P(Jumlah Tanggungan=0 | Y=Gold) = 2/3 = 0,667

P(Wanita | Platinum) * P(Milik Sendiri | Platinum) * metode naive bayes, serta menghitung presentase
P(Belum Kawin | Platinum) * P(0 | Platinum) * kesalahan dari aplikasi.
P(BUMN | Platinum) * P(Tinggi | Platinum) * 2.8 Kesimpulan
P(Platinum) Pada tahap kesimpulan, diberikan simpulan hasil
1 1 0 1 0 0 2
= 2 × 2 × 2 × 2 × 2 × 2 × 10 = 0 semua proses yang dibuat hingga menjadi sebuah
aplikasi yang bermanfaat dalam penelitian tugas akhir
ini.
P(Wanita | Tidak diterima) * P(Milik Sendiri | Tidak
diterima) * P(Belum Kawin | Tidak diterima) * P(0 |
3. HASIL DAN PEMBAHASAN
Tidak diterima) * P(BUMN | Tidak diterima) *
3.1 Implementasi Aplikasi
P(Tinggi | Tidak diterima) * P(Tidak diterima)
1 1 0 1 1 1 3 Implementasi aplikasi merupakan sebuah tahap
= 3 × 3 × 3 × 3 × 3 × 3 × 10 = 0 sebagai wujud realisasi dari sebuah rancangan aplikasi
yang dibuat, untuk mengetahui hasil dari rancangan
3. Bandingkan hasil HMAP dari class Classic, Gold, yang telah dibuat. Hasil dari penenelitian ini adalah
Platinum, dan Tidak diterima sebuah aplikasi klasifikasi penentuan pengajuan kartu
Dari hasil perhitungan di atas, terlihat bawah nilai kredit menggunakan metode naive bayes di Bank BNI
probabilitas tertinggi ada pada kelas (P|Gold). Dapat Syariah Surabaya.
disimpulkan bahwa nasabah tersebut dapat Aplikasi tersebut terdapat beberapa menu yaitu
diklasifikasikan mendapat kartu kredit Gold. Home, menu Data Training, menu Data Testing, dan
menu Pengujian yang hanya dapat diakses oleh pihak
2.6 Pengujian analis kartu kredit saja sebagai administrator dalam
Tahap pengujian ini bertujuan untuk mengetahui aplikasi. Aplikasi ini, dapat diakses apabila admin
aplikasi yang telah selesai dibuat sesuai dengan desain sudah melakukan login terlebih dahulu.
yang direncanakan, menguji fungsi-fungsi yang ada 3.1.1 Halaman Utama
sesuai bagaimana semestinya, serta membandingkan Halaman utama dari aplikasi ini adalah halaman form
hasil perhitungan manual dengan hasil perhitungan login. Dimana untuk masuk ke dalam aplikasi, admin
menggunakan aplikasi untuk menghitung nilai diharuskan memasukkan username dan password
precision, recall, dan accuracy. Menurut Han, terlebih dahulu sesuai data yang dimasukkan ke dalam
Kamber dan Pei (2012) perhitungan akurasi database.
menggunakan tabel confusion matrix: 3.1.2 Halaman Home
Tabel 2.4 Panduan Menghitung Precision, Recall, Halaman home akan muncul apabila admin sudah
dan Accuracy berhasil login. Halaman ini menjelaskan secara
Kelas Prediksi singkat tentang aplikasi, dan terdiri dari beberapa
Kelas menu lain seperti menu Data Training, Data Testing,
Sebenarnya 1 0 Pengujian, Prediksi, dan Logout admin yang memiliki
TP (True FN (False fungsi berbeda-beda pada setiap menunya.
1 3.1.3 Halaman Data Training
Positive) Negative)
FP (False TN (True Menu data training berfungsi untuk menampilkan
0 daftar data training nasabah yang telah diinputkan.
Positive) Negative)
Pada halaman data training, terdapat tombol tambah
Nilai precission, recall, dan accuracy maka dapat
data untuk menambahkan data nasabah secara satu-
dihitung dengan rumus sebagai berikut:
𝑇𝑃 persatu maupun dengan cara import file excel. Data
Precission = 𝐹𝑃+𝑇𝑃 ......................................... (2) training yang telah di diinputkan, dapat di edit dan
𝑇𝑃
Recall = 𝑇𝑃+𝑇𝑁 ........................................ (3) dihapus apabila admin kurang teliti atau salah saat
𝑇𝑃+𝑇𝑁 memasukkan data training. Berikut ini pada Gambar
Accuracy = 𝑇𝑃+𝐹𝑁+𝐹𝑃+𝑇𝑁 ............................. (4) 3.1 merupakan halaman data training.
Dalam hal ini dapat dijelaskan bahwa :
TP = jumlah dari data yang terklasifikasi di kelas
yang benar.
TN = jumlah dari data yang terklasifikasi di kelas
sebaliknya yang benar.
FP = jumlah data yang dianggap berada di kelas
yang benar oleh sistem padahal seharusnya data
tersebut berada di kelas yang sebaliknya.
FN = jumlah data yang dianggap berada di kelas
yang sebaliknya oleh sistem padahal seharusnya data
Gambar 3.1 Halaman data training
tersebut berada di kelas yang benar. 3.1.4 Halaman Data Testing
2.7 Analisa Hasil Menu data testing berfungsi untuk menampilkan
Analisa hasil dilakukan dengan membandingkan hasil daftar data testing yang telah diinputkan. Pada
perhitungan manual dengan hasil perhitungan halaman data training, terdapat tombol tambah data
menggunakan aplikasi yang telah dibuat menggunakan

untuk menambahkan data nasabah baru secara satu- Gambar 3.3 Halaman pengujian
persatu maupun dengan cara import file excel. Data 3.1.6 Halaman Prediksi
testing yang telah diinputkan dapat di edit dan dihapus Menu prediksi merupakan halaman pengisian form
apabila admin kurang teliti atau salah saat calon nasabah untuk mengklasifikasikan kartu kredit
memasukkan data testing. yang akan diterima, berdasarkan hasil perhitungan
Pada Gambar 3.2 di bawah ini, merupakan tampilan sistem dari satu data yang diinputkan oleh admin.
halaman data testing. Calon nasabah kartu kredit akan diklasifikasikan ke
dalam kartu kredit Classic, Gold, Platinum atau Tidak
diterima yang disertai dengan perhitungan dari hasil
prediksi. Halaman prediksi dapat dilihat pada Gambar
3.4.
Gambar 3.2 Halaman data testing

3.1.5 Halaman Pengujian
Menu pengujian berfungsi menampilkan data testing
yang telah disertai dengan prediksi kartu kredit hasil
dari perhitungan sistem, serta hasil. Pada kolom hasil Gambar 3.4 Halaman prediksi
ini, berisi kecocokan antara kartu kredit dari data 3.2 Pengujian
testing dengan prediksi kartu kredit dari hasil 3.2.1 Pengujian Blackbox
perhitungan menggunakan sistem. Kecocokan hasil Pengujian blackbox bertujuan untuk mengetahui
akan ditampilkan dengan kata “benar”, dan kata apakah aplikasi sesuai dengan rencana atau tidak serta
“salah” untuk menampilkan ketidakcocokannya. untuk mengetahui baik tidaknya dari sebuah aplikasi
Halaman pengujian dapat dilihat pada Gambar 3.3. yang dibuat. Dimana pengujian ini untuk mencari
kesalahan yang ada di dalam aplikasi dengan tujuan
apabila menemukan kesalahan saat pengujian, dapat
dilakukan perbaikan aplikasinya untuk menjamin
kualitas dari aplikasi itu sendiri. Tabel 3.1 berikut ini
merupakan hasil pengujian blackbox yang
menunjukkan aplikasi dapat berjalan dengan baik.
Tabel 3.1 Hasil Pengujian Blackbox

No Menu / Fitur Test Case Harapan Hasil
1. Login Masuk ke aplikasi dengan username Muncul notifikasi gagal login. Valid
dan password tidak sesuai.
2. Login Masuk ke aplikasi dengan username Muncul halaman home. Valid
dan password sesuai dengan
database.
3. Logout Keluar dari aplikasi. Muncul halaman login. Valid
4. Home Klik menu home. Menampilkan halaman home. Valid
5. Data Training Klik menu data training. Menampilkan halaman data Valid
training.
6. Tambah Data (pada Klik tambah data. Menampilkan form pengisian Valid
menu Data Training/ tambah data secara satu
Data Testing). persatu/ import file excel.
7. Edit Data (pada Klik edit data. Menampilkan form pengisian Valid
menu Data Training/ edit data.
Data Testing).
8. Data Testing Klik menu data testing. Menampilkan halaman data Valid
testing.
9. Pengujian Klik menu pengujian. Menampilkan data testing Valid
beserta prediksi dan hasil
kecocokannya.
10. Prediksi Klik menu prediksi. Menampilkan form pengisian Valid
data yang akan di prediksi
11. Prediksi Klik prediksi setelah pengisian form Menampilkan data, Valid
data prediksi perhitungan dan kesimpulan
hasil prediksi.
3.2.2 Pengujian Algortima Naive Bayes Pengujian algoritma naive bayes ini telah diuji dengan
memasukkan 10 data training dan 5 data testing,

kemudian membandingkan hasil yang didapatkan dari oleh sistem padahal seharusnya sebaliknya adalah 0,
perhitungan manual dengan menggunakan sistem. maka nilai precision dapat mencapai 100%.
Dari hasil perbandingan tersebut, didapatkan hasil Sedangkan recall tidak mencapai 100% karena nilai
bahwa klasifikasi yang dilakukan oleh sistem dan true negative (TN) saat menghitung recall lebih dari 0,
perhitungan manual adalah sama. Hal ini maka hal itu menyebabkan nilai recall tidak mencapai
membuktikan bahwa aplikasi yang dibangun telah 100%. Jika nilai accuracy tidak dapat mencapai 100%,
menerapkan algoritma naive bayes dengan benar. karena nilai accuracy dihasilkan dari kedekatan antara
3.2.3 Pengujian Precision, Recall, dan Accuracy nilai precision dan recall.
Tabel 3.2 di bawah ini merupakan hasil perhitungan
precision, recall, dan accuracy yang didapatkan dari 4. KESIMPULAN DAN SARAN
aplikasi dengan beberapa data uji: 4.1 Kesimpulan
Tabel 3.2 Hasil Precision, Recall, dan Accuracy Berdasarkan hasil penelitian dapat disimpulkan
Jumlah Jumlah bahwa:
Data Data Precision Recall Accuracy
Training Testing 1. Metode naive bayes dapat digunakan untuk
50 240 97,33 % 87,67 % 94,67 %
membantu klasifikasi penentuan pengajuan kartu
kredit
100 190 98 % 90,67 % 96,33 % 2. Berdasarkan pengujian 3 kali pada setiap jumlah
data training maupun testingnya, didapatkan nilai
150 140 98,67 % 91,67 % 96,67 %
rata-rata maksimal dari nilai precision sebesar
200 90 100 % 91,67 % 97,33 % 100%, nilai recall sebesar 95%, dan nilai accuracy
sebesar 98,67%.
250 40 100 % 95 % 98,67 % 3. Semakin banyak data training yang digunakan
3.3 Analisa Hasil maka nilai precision, recall, dan accuracy juga
Aplikasi klasifikasi penentuan pengajuan kartu kredit semakin meningkat.
menggunakan metode naive bayes yang dibangun 4.2 Saran
memiliki satu administrator (analis kartu kredit) Untuk memperoleh hasil yang lebih baik lagi, maka
sebagai aktor dalam aplikasi. Admin di dalam aplikasi diperlukan saran dari berbagai pihak. Adapun saran
ini, memiliki seluruh hak akses yang ada di dalam yang dapat dijadikan pertimbangan untuk penelitian
aplikasi yaitu mengelola (input, update, delete) data berikutnya yaitu:
training, mengelola data testing, melakukan 1. Bagi pengembang berikutnya, disarankan agar
pengujian, dan melakukan prediksi. Pengujian pada menggunakan metode yang berbeda. Serta
aplikasi ini dilakukan dengan 3 cara, yaitu dengan membandingkannya dengan aplikasi yang
pengujian blackbox, pengujian algoritma naive bayes sebelumnya, untuk mengetahui metode manakah
dan pengujian precision, recall, dan accuracy. yang sesuai dan paling efisien dalam menangani
Pengujian blackbox bertujuan untuk mengetahui kasus klasifikasi penentuan pengajuan kartu kredit.
seluruh fitur dapat berjalan sesuai yang diharapkan,
pengujian algoritma naive bayes berfungsi untuk 5. DAFTAR PUSTAKA
membuktikan bahwa aplikasi yang dibangun telah Bustami. (2014). Penerapan Algoritma Naive Bayes
menerapkan algoritma naive bayes dengan benar, dan Untuk Mengklasifikasi Data Nasabah Asuransi.
pengujian precision, recall, dan accuracy untuk Jurnal Informatika, 8, 884-898.
mengetahui hasil nilai precision, recall dan accuracy Deepa, S., & Vijayarani, S. (2014). Naive Bayes
berdasarkan hasil data training dan data testing testing Classification for Predicting Disease in
yang dimasukkan dengan jumlah yang berbeda-beda. Haemoglobin Protein Sequences. International
Sedangkan prediksi, dapat dilakukan dengan Journal of Computational Intelligence and
memasukkan data nama, jenis kelamin, status rumah, Informatics, 3, 278-283.
status, jumlah tanggungan, profesi, dan penghasilan Han, J., & Kamber, M., &Pei, J. (2012). Data Mining
per-tahun. Concepts & Techiques (3nd Ed.). Waltham:
Analisa hasil aplikasi dari pengujian precision, Elsevier.
recall, dan accuracy didapatkan hasil bahwa semakin Khairina, Dyna. M., Dahri, Diasrina., & Agus, Fahrul.
banyaknya data training yang digunakan di dalam (2016). Metode Naive Bayes Untuk Penentuan
aplikasi, maka nilai precision, recall, dan accuracy Penerima Beasiswa Bidikmisi Universitas
yang diperoleh juga semakin meningkat. Hal ini telah Mulawarman. Jurnal Informatika Mulawarman,
dibuktikan berdasarkan pengujian 3 kali pada setiap 11, 29-36.
jumlah data training maupun testingnya pada Kurniawan, D., & A. Kriestanto, D. (2016). Penerapan
pengujian precision, recall, dan accuracy, yang Naive Bayes Untuk Prediksi Kelayakan Kredit.
didapatkan nilai rata-rata maksimal dari nilai precision Jurnal Informatika dan Komputer (JIKO), 1, 19-
sebesar 100%, nilai recall sebesar 95%, dan nilai 23.
accuracy sebesar 98,67%. Nilai precision mencapai Kurniawan, Y. I., & Windiasani, P. A. (2017). Sistem
100% karena nilai false positive (FP) yang merupakan Pendukung Keputusan untuk Penentuan
jumlah data yang dianggap berada di kelas yang benar Kelolosan Beasiswa Sekolah Menengah

Kejuruan (SMK) Menggunakan Metode Fuzzy.

Jurnal Teknik Elektro, 9, 13-17.
Patil, T. R., & Sherekar, M. S. (2013). Performance
Analysis of Naive Bayes and J48 Classification
Algorithm for Data Classification. International
Journal of Computer Science and Applications,
6, 256-261.
Pujianto, Utomo., Wahyudi, Robi., & Wibawa, Aji. P.
(2016). Rancangan Sistem Rekomendasi
Kategori Perusahaan Praktik Industri
Menggunakan Algoritma Naive Bayes. Seminar
Nasional Teknologi Informasi dan Multimedia,
Yogyakarta: STMIK AMIKOM Yogyakarta.
Saleh, Alfa. (2015). Implementasi Klasifikasi Naive
Bayes Dalam Memprediksi Besarnya
Penggunaan Listrik Rumah Tangga. Citec
Journal, 2, 207-217.

APLIKASI PREDIKSI KELAYAKAN CALON ANGGOTA KREDIT MENGGUNAKAN
ALGORITMA NAÏVE BAYES
Diky Alfian Kurniawan1*, Yogiek Indra Kurniawan1

1
Program Studi Informatika, Fakultas Komunikasi dan Informatika
*
dikyalfian19@gmail.com, yogiek@ums.ac.id
Abstrak
Sebagai lembaga keuangan selain bank konvensional, koperasi mempuyai peran serta dalam
mengatasi perekonomian masyarakat didaerah-daerah. Kegiatan tersebut juga dilakukan oleh
Koperasi Simpan Pinjam Pembiayaan Syariah Baitul Maal wa Tamwil (KSPPS BMT) “Arta Jiwa
Mandiri” Wonogiri yang bergerak dalam bidang usaha kredit simpan pinjam dan pembiayaan yang
berlandaskan syariah. Pada proses bidang usaha kredit simpan pinjam koperasi memiliki ketentuan
dalam memilih calon anggota yang layak untuk mendapatkan modal. Hal tersebut bertujuan untuk
mengatasi adanya permasalahan seperti anggota macet dalam pembayaran cicilan. Sehingga hal
tersebut perlu adanya suatu aplikasi yang dapat meprediksi calon anggota kredit yang layak untuk
mendapatkan pinjaman dari pihak koperasi dengan teknik data mining. Algoritma Naïve Bayes
dimanfaatkan dalam kasus ini untuk memprediksi kelayakan calon anggota kredit simpan pinjam
yang nantinya termasuk kategori lancar, kurang lancar atau macet waktu peminjaman. Hasil
penelitian ini mendapatkan nilai Accuracy sebesar 75%, nilai Precision sebesar 84% dan nilai Recall
sebesar 86%. Maka dari itu aplikasi ini dapat membantu pihak koperasi dalam mempertimbangkan
calon anggota kredit yang layak untuk mendapatkan modal.
Kata Kunci: data mining, naïve bayes, simpan pinjam, koperasi.
PENDAHULUAN pembelajaran siswa menggunakan machine learning.

Meningkatnya perekonomian saat ini membuat Tujuan dari penelitian ini untuk memprediksi keberhasilan
banyaknya pengeluaran yang harus ditanggung oleh setiap siswa dalam pembelajaran menngunakan machine
orang yang ada dimuka bumi ini. Kebutuhan yang learning. Hasilnya akan diketahui siswa tersebut lulus
semakin hari semakin banyak dan membuat setiap orang atau gagal dalam metode pembelajaran tersebut. Tujuan
membutuhkan biaya dalam mencukupi kebutuhan sehari- adanya aplikasi tersebut yaitu sebagai panduan dan
hari maupun biaya untuk menjalankan usahanya agar tetap evaluasi kinerja dimasa yang akan datang.
berjalan terus. Semua permasalahan tersebut dapat diatasi Octabriyantiningtyas dalam penelitiannya pada
oleh lembaga koperasi yang dapat membantu dalam Bank Tabungan Negara (BTN) mengenai pengambilan
memberikan pinjaman. Lembaga koperasi memiliki keputusan dalam pemberian kredit [3]. Tujuan penelitian
banyak bidang usaha yaitu salah satunya kredit simpan yaitu untuk menganalisa dan menentukan nasabah yang
pinjam. Koperasi simpan pinjam mendapatkan modal dari layak mendapatkan kredit. Metode yang diterapkan dalam
hasil pemupukan simpanan dari anggotanya, dan nantinya penelitian yaitu menggunakan algoritma C4.5 sebagai
akan dipinjamkan kembali kepada anggota yang proses perhitungannya. Kesimpulan yang diperoleh yaitu
membutuhkan modal [1]. dengan menggunakan algoritma C4.5 dapat
Adapun Koperasi Simpan Pinjam dan menyelesaikan masalah dalam menentukan calon nasabah
Pembiayaan Syariah Baitul Maal wa Tamwil (KSPPS kredit yang berhak mendapatkan kredit dari BTN dengan
BMT) “Arta Jiwa Mandiri” Wonogiri, merupakan suatu output berupa pohon keputusan dengan informasi layak
lembaga koperasi yang bergerak dalam pelayanan kredit atau tidak layak. Rata-rata nilai akurasi yang diperoleh
simpan pinjam berbasis syariah. Pada proses menjalankan 65,50 % dan nilai deviasi 5,126.
usaha kredit simpan pinjam koperasi memiliki aturan yang Jumadi, dkk pada penelitiannya membahas
sudah ditetapkan dalam menentukan calon anggota kredit mengenai sistem pendukung keputusan pemberian kredit
simpan pinjam. Aturan tersebut bertujuan untuk rumah sejahtera pada nasabah Bank Pembangunan Daerah
mengurangi adanya permasalahan seperti penunggakan (BPD) Kalimantan Timur [4]. Penelitian ini menggunakan
dalam pelunasan cicilan. Berdasarkan permasalahan metode Technique For Order Preference by Similitary To
tersebut diperlukan suatu aplikasi yang dapat Ideal Solution (TOPSIS). Kesimpulan dari penelitian
memprediksi calon anggota kredit yang layak tersebut yaitu menggunakan metode TOPSIS dapat
mendapatkan modal usaha. menentukan nasabah yang berhak mendapatkan kredit
Penggunaan algoritma Naïve Bayes telah banyak rumah sejahtera yang tepat dan sesuai dengan kriteria dari
digunakan dalam berbagai kasus penelitian untuk pihak Bank. Dengan memperhitungkan solusi ideal positif
memprediksi suatu permasalahan. Mahboob, dkk dan nilai terjauh solusi negatif.
menggunakan berbagai metode data mining dalam Kurniawan mengembangkan suatu aplikasi
penelitianya dan salah satunya menggunakan algoritma pendukung keputusan dengan menggunakan metode
Naïve Bayes [2]. Penelitian ini membahas mengenai Simple Additive Weighting (SAW) yang berfokus pada

Diky Alfian Kurniawan, Yogiek Indra Kurniawan (2018) 224-231 225
permasalahan mengenai penyeleksian beasiswa yang ada

di perguruan tinggi [5]. Tujuan penelitian ini yaitu saat
penyeleksian beasiswa di perguruan tinggi agar hasil
seleksi yang diperoleh tidak bersifat subjective.
Berdasarkan analisa dari penelitian terdahulu
maka terdapat perbedaan dalam penggunaan metode pada
penelitian ini. Penelitian yang dilakukakan pada KSPPS
BMT “Arta Jiwa Mandiri” Wonogiri mengenai aplikasi
prediksi kelayakan calon anggota kredit simpan pinjam
yaitu menggunakan metode data mining dengan algoritma
Naïve Bayes. Data yang digunakan dalam penelitian ini
keseluruhannya diperoleh dari riwayat anggota kredit
simpan pinjam di koperasi tersebut. Tujuan adanya
aplikasi ini untuk membantu pihak koperasi dalam
menganalisa calon anggota kredit yang mengajukan
pinjaman dengan mengetahui hasil output dari aplikasi Gambar 1. Bagan tahapan penelitian
berupa kategori lancar, kurang lancar dan macet. Menurut 2.1 Analisis Masalah
Nugroho penggunaan algoritma Naïve Bayes dapat Tahap analisis masalah pada penelitian ini yaitu mengenai
memprediksi suatu permasalahan dengan membandingkan calon anggota kredit simpan pinjam yang mengajukan
nilai probabilitas pada data training [6]. permohonan pinjaman. Pihak koperasi harus memilih
METODE PENELITIAN calon anggota kredit yang layak untuk mendapatkan
2.1 Metodologi Penelitian pinjaman dan calon anggota kredit tersebut nantinya tidak
Metodologi penelitian yang digunakan dalam memiliki potensi penunggakan dalam pelunasan cicilan.
penelitian ini menggunakan beberapa tahapan mulai dari Kesimpulan dari analisis masalah tersebut maka
analisis masalah, pengumpulan data, desain, diperlukan suatu aplikasi yang dapat memprediksi
implementasi, pengujian, analisis hasil sampai ke tahap kelayakan calon anggota kredit simpan pinjam yang
kesimpulan dan saran, seperti gambar 1 berikut: sesuai dengan ketentuan dari pihak koperasi.
2.2 Pengumpulan Data
Penelitian ini menggunakan data dari kantor pusat KSPPS
BMT “Arta Jiwa Mandiri” Wonogiri. Data pada penelitian
dibagi menjadi 2 kelompok sesuai dengan pembagiannya.
2.2.1 Kebutuhan Data
Proses dalam menentukan kebutuhan data diperlukan
dalam metode data mining ini. Pada Data training dan
testing datanya dikelompokkan menurut nilai atribut yang
sesuai dengan kebutuhan penelitian agar hasil yang
diperoleh sesuai dengan yang diharapkan. Pengelompokan
atribut-atribut sesuai dengan yang disajikan pada tabel 1
berikut:
Tabel 1. Atribut dalam prediksi calon anggota kredit simpan pinjam

Atribut Tipe Keterangan Variabel
Jenis Kelamin Binomial Laki-Laki (L) dan Perempuan (P) X1
Umur Polinomial 19 – 24 X2
25 – 30
31 – 36
37 – 42
43 – 48
49 – 54
55 – 60
Jenis Pekerjaan Polinomial Wiraswasta, Swasta, Ibu rumah tangga, dan PNS X3
Jumlah Pinjaman Polinomial 1.000.000 – 1.999.999 X4

2.000.000 – 2.999.999
3.000.000 – 4.999.999
5.000.000 – 6.999.999
7.000.000 – 9.999.999
10.000.000 – 12.999.999

13.000.000 – 14.999.999
15.000.000 – 19.999.999
20.0000.0000 – 24.999.999
25.000.000 – 29.999.999
30.000.000 – 49.000.000
50.000.000 – 79.999.999
80.000.000 – 109.000.000
110.000.000 – 139.999.999
140.000.000 – 169.999.999
170.000.000 – 200.000.000
Jangka Waktu Polinomial 1 sampai dengan 12 bulan = Pendek X5

Pengembalian
13 sampai dengan 36 bulan = Menengah
Lebih dari 36 bulan = Panjang
Jaminan Polinomial BPKP Motor, BPKB Mobil, Sertivikat X6
Penghasilan Polinomial 1 – 5 Juta, 6 – 10 Juta, dan Lebih dari 11 Juta X7
Kategori Label Lancar, Kurang Lancar, dan Macet Y
2.2.2 Pembersihan Data Implementasi merupakan proses penerapan terhadap hasil

Sebelum melakukan proses pengolahan data mining maka analisis masalah yang akan diselesaikan. Pada proses
diperlukan pembersihan data terlebih dahulu, pembersihan implementasi penelitian ini, akan diterapkan dalam
tersebut bertujuan untuk menyesuaikan data dengan pembuatan suatu aplikasi.
kebutuhan aplikasi. Pada proses pembersihan data maka 2.4.1 Penerapan Algoritma Naïve Bayes
data disesuaikan dengan atribut-atribut yang akan Jadhav dalam penelitiannya berpendapat tentang Naïve
dibutuhkan dalam pemrosesan pada aplikasi, sehingga Bayes Classifier yaitu suatu model independen yang
terhindar dari ketidakkonsistenan data. membahas mengenai klasifikasi sederhana berdasarkan
2.4 Desain teorema Bayes [7]. Naïve Bayes merupakan suatu
Untuk menjelaskan fungsi kebutuhan aplikasi yang dibuat algoritma yang dapat mengklasifikasikan suatu variable
maka akan digambarkan suatu rancangan aplikasi secara tertentu dengan menggunakan metode probabilitas dan
menyeluruh berupa use case diagram. Keseluruhan fungsi statistic menurut Haryati [8]. Secara garis besar algoritma
yang dapat digunakan pada aplikasi ini meliputi: Naïve Bayes menurut Bustami [9] seperti persamaan (1).
pengguna dapat menambahkan data testing maupun
training, menghapus data, melihat data ataupun pengguna
dapat mengubah informasi data. Use case dapat dilihat
seperti gambar 2. (1)
Keterangan:
R : Data yang belum diketahui kelasnya
S : Hipotesis pada data R yang merupakan class
khusus
P(R|S) : Nilai probabilitas pada hipotesis R yang
berdasarkan kondisi S
P(R) : Nilai probabilitas pada hipotesi R
P(S|R) : Nilai probabilitas S yang berdasarkan dengan
kondisi hipotesis R
P(S) : Nilai probabilitas pada
Algoritma Naïve Bayes digunakan menghitung
perbandingan probabilitas dari masing-masing atribut
pada setiap data training. Tabel 2 dan 3 berikut
merupakan contoh perhitungan menggunakan algoritma
Naïve Bayes dengan mengambil 10 data sebagai data
training dan 1 data sebagai data testing.
Gambar 2. Use case diagram pengguna
2.4 Implementasi

Tabel 2. Contoh data training
Tabel 3. Contoh data testing
Perhitungan algoritma Naïve Bayes pada tabel 3 sebagai berikut.

P (Y = Lancar) = 7/10 = 0,7
P (Y = Kurang Lancar) = 1/10 = 0,1 Kesimpulan hasil yang diperoleh dari perhitungan
P (Y = Macet) = 2/10 = 0,1 menunjukan bahwa masukan pada tabel 3 menghasilkan
(P = Lancar) dengan hasil probabilitas tertinggi.
Mencari nilai probabilitas pada tiap atribut
P (Jenis Kelamin = P | Y = Lancar) = 3/7 = 0,428 2.5 Pengujian
P (Umur = 55-60 | Y = Lancar) = 2/7 = 0,285 Pengujian yang dilakukan pada implementasi
P (Jenis Pekerjaan = Wiraswasta | Y = Lancar) = 3/7 = aplikasi dengan memperhitungkan tingkat precision,
0,428 recall, dan accuracy [10]. Maka dijelaskan seperti
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Lancar) persamaan (2), (3) dan 4 sebagai berikut:
= 1/7 = 0,142
P (Jangka waktu pengembalian = Menengah | Y = Lancar) Pengujian precision digunakan dalam mencari
= 5/7 = 0,714 nilai proporsi kasus positif yang benar, rumus persamaan
P (Jaminan = Sertivikat | Y = Lancar) = 3/7 = 0,428 (2).
P (Penghasilan = <5 Juta | Y = Lancar) = 6/7 = 0,857
P (Jenis Kelamin = L | Y = Kurang Lancar) = 1/1 = 1
P (Umur = 55-60 | Y = Kurang Lancar) = 0/1 = 0 (2)
P (Jenis Pekerjaan = Wiraswasta | Y = Kurang Lancar) = Pengujian recall digunakan dalam mencari nilai
0/1 = 0 proporsi kasus positif yang teridentifukasi benar, rumus
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Kurang persamaan (3).
Lancar) = 0/1 = 0
P (Jangka waktu pengembalian = Menengah | Y = Kurang
Lancar) = 1/1 = 1
P (Jaminan = Sertivikat | Y = Kurang Lancar) = 1/1 = 1 (3)
P (Penghasilan = <5 Juta | Y = Kurang Lancar) = 1/1 = 1
P (Jenis Kelamin = L | Y = Macet) = 3/2 = 1,5 Pengujian accuracy digunakan dalam mencari nilai
P (Umur = 55-60 | Y = Macet) = 0/2 = 0 proporsi jumlah yang benar, rumus persamaan (4).
P (Jenis Pekerjaan = Wiraswasta | Y = Macet) = 0/2 = 0
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Macet) =
0/2 = 0 (4)
P (Jangka waktu pengembalian = Menengah | Y = Macet)
= 2/2 = 1 Keterangan:
P (Jaminan = Sertivikat | Y = Macet) = 0/2 = 0 TP : True Positive
P (Penghasilan = <5 Juta | Y = Macet) = 2/2 = 1 TN : True Negative
FP : False Positive
Menghitung hasil dari atribut lancar, kurang lancar, dan FN : False Negative
macet
P (Kategori = Lancar) * P (Y = Lancar) = 0,00135 HASIL DAN PEMBAHASAN
P (Kategori= Kurang Lancar) * P (Y = Kurang Lancar ) = 3.1 Hasil Implementasi
0 Tahap ini merupakan tahap dimana aplikasi yang dibuat
P (Kategori = Macet) * P (Y = Macet) = 0 telah selesai dibuat, untuk menjalankan aplikasi ini
menggunakan server local di komputer untuk mengetahui
hasilnya.

3.1.1 Halaman login training. Pada form ini data harus diisi semua dan jika ada
Saat membuka aplikasi prediksi kelayakan calon anggota data tidak terisi maka data tidak akan bisa disimpan.
kredit maka pengguna wajib memasukkan username dan
password bertujuan untuk masuk dalam aplikasi, maka
tampilan awal seperti yang dilihat pada gambar 3.
Gambar 5. Halaman tambah data training
3.1.5 Halaman data testing

Data testing merupakan masukkan yang akan dicari
hipotesisnya atau pada aplikasi ini data testing digunakan
Gambar 3. Halaman login pengguna
untuk memprediksi calon anggota kredit simpan pinjam
3.1.2 Halaman beranda
dengan berdasarkan pada data training. Fitur edit dan
Halaman ini akan tampil setelah pengguna melakukan
hapus terdapat pada setiap data. Gambar 6 menampilkan
proses login, pada halaman ini pengguna dapat memilih
antar muka halaman data testing.
beberapa menu yang dapat langsung diakses berupa menu
data training, menu data testing dan pengguna dapat
langsung logout dari sistem.
Gambar 6. Halaman data testing

3.1.6 Halaman tambah data training
Gambar 3. Halaman beranda
Halaman ini pengguna mengisi form untuk memasukkan
data testing dan bertujuan untuk mengetahui hasil prediksi
3.1.3 Halaman data training
yang berdasarkan data training.
Data training sangat dibutuhkan pada metode data mining
dimana data tersebut digunakan sebagai dasar
pembanding pada masukan didata testing. Pada halaman
data training setiap datanya terdapat fitur edit dan hapus.
Gambar 4 menunjukkan antarmuka halaman data training.
Gambar 7. Halaman tambah data testing
3.1.7 Halaman lihat prediksi

Gambar 4. Halaman data training Algoritma Naïve Bayes digunakan pada penelitian ini
untuk memprediksi suatu permasalahan dan akan
3.1.4 Halaman tambah data training menghasilkan hipotesis atau kesimpulan. Pada aplikasi ini
Halaman ini yaitu pengguna diharuskan mengisi form proses tersebut dapat langsung diketahui rincian
yang lengkap sesuai dengan kebutuhan data pada data perhitungannya. Halaman ini akan tampil jika pengguna
sebelumnya memasukkan data training dan data testing

maka halaman lihat prediksi akan dapat diketahui hasil 3.1.8 Halaman lihat performance
prediksinya seperti gambar 7. Pada halaman tersebut Halaman lihat performance yang muncul setelah
setiap data terdapat fitur detail yang berfungsi untuk pengguna memilih fitur lihat prediksi. Pada halaman ini
melihat urutan perhitungan sesuai dengan algoritma Naïve yaitu menampilkan hasil accuracy, precision dan recall
Bayes seperti gambar 8. dari keseluruhan data yang ada pada data testing.
Pengguna dapat langsung melihat jumlah True Positive
(TP), False Positive (FP), False Negative (FN), True
Negative (TN), False Negative (FN) yang ada pada data
testing.
Gambar 7. Halaman lihat prediksi
Gambar 9. Halaman Lihat Performance

3.2 Pengujian
3.2.1 Pengujian Blackbox
Pengujian blackbox ini bertujuan untuk pengetesan pada
setiap fitur yang ada pada aplikasi prediksi kelayakan
calon anggota kredit simpan. Berikut merupkan hasil
pengetesan seperti tabel 4 berikut:
Gambar 8. Halaman detail perhitungan Naïve Bayes
Tabel 4. Pengujian blackbox

Menu Yang Pengujian Input Output Keterangan
Diuji
Form login Username Memasukkan Halaman menu awal aplikasi Sesuai
username dan muncul
Password password
Menu Utama Data Training Klik data training Masuk data training Sesuai
Data Testing Klik data testing Masuk data testing Sesuai
Logout Klik logout Keluar dari aplikasi Sesuai

Data Training Tambah Klik Tambah Masuk form tambah data Sesuai
Import Klik Import Halaman upload data set Sesuai
Hapus Klik Hapus data Data terhapus Sesuai

Data Testing Tambah Klik Tambah Masuk form tambah data Sesuai
Import Klik Import Halaman upload data set Sesuai
Hapus Klik Hapus data Data terhapus Sesuai
Lihat Prediksi Klik lihat prediksi Muncul halaman prediksi Sesuai

Lihat Prediksi Detail Klik detail Tampil hasil perhitungan Sesuai
Lihat Performance Klik lihat Tampil hasil precision, Sesuai

performance accuracy, dan recall.

3.2.2 Pengujian Algoritma 4. KESIMPULAN DAN SARAN

Hasil yang didapat dengan memasukkan 10 data sebagai 4.1 Kesimpulan
data training dan 5 data sebagai data testing memperoleh Hasil analisis dari aplikasi prediksi kelayakan calon
hasil yang sama saat pengujian dengam membandingkan anggota kredit simpan pinjam dapat diambil kesimpulan
perhitungan manual ataupun dengan perhitungan aplikasi diantaranya:
yang dibuat pada penelitian ini. Hasil menunjukkan 1) Aplikasi ini memiliki nilai precision sebesar
bahwa aplikasi yang dibuat sudah menerapkan algoritma 84%, nilai accuracy sebesar 75% dan nilai
Naïve Bayes dengan benar. recall sebesar 86%. Maka aplikasi yang telah
Pengujian dengan memperhitungkan nilai precision, dibangun menggunakan algoritma Naïve Bayes
accuracy maupun recall dengan beberapa tahapan seperti telah dapat digunakan.
yang ditunjukkan pada tabel 5. 2) Telah dapat dibangun sebuah aplikasi untuk
memprediksi kelayakan calon anggota kredit
Tabel 5. Pengujian precision, accuracy, dan recall simpan pinjam dengan menggunakan Naïve
Data Data Precision Accuracy Recall Bayes.
Training Testing 3) Proses pengujian pada aplikasi menggunakan 3
50 422 65 % 46 % 55 %
metode antara lain: pengujian blackbox
pengujian algoritma dan pengujian precision,
100 372 65 % 52 % 67 %
accuracy maupun recall.
150 372 65 % 55 % 72 %
200 272 60 % 57 % 89 %
4.2 Saran
250 222 70 % 58 % 71 %
Saran dari aplikasi prediksi kelayakan calon anggota
300 172 73 % 69 % 92 %
kredit simpan pinjam yaitu untuk penelitian selanjutnya
350 122 81 % 74 % 88 %
diharapkan dalam menggunakan data training harus
472 45 84 % 75 % 86 %
diperbanyak untuk mendapatkan hasil yang lebih akurat.
Pengujian dengan memperhitungkan tingkat ketepatan DAFTAR PUSTAKA

dapat diketahui bahwa nilai precision, accuracy dan recall [1] K. Ma’wa, “Analisis Perbandingan Antara
cenderung meningkat. Koperasi Simpan Pinjam Dengan Koperasi Jasa
Keuangan Syariah Baitul Maal Wa Tamwil,” J.
3.2.3 Analisis Hasil Mhs. Fak. Huk., 2013.
Pada aplikasi prediksi kelayakan calon anggota [2] T. Mahboob, S. Irfan, and A. Karamat, “A
kredit simpan pinjam dengan menggunakan algoritma machine learning approach for student
Naïve Bayes hanya memiliki 1 aktor yaitu pengguna atau assessment in E-learning using Quinlan’s C4.5,
admin koperasi. Pada aplikasi ini pengguna diwajibkan Naive Bayes and Random Forest algorithms,”
untuk login terlebih dahulu untuk dapat mengakses Proc. 2016 19th Int. Multi-Topic Conf. INMIC
aplikasi. Pengguna dapat melakukan penambahan data, 2016, 2017.
perubahan data dan penghapusan data pada data training [3] D. Octabriyantiningtyas, “Adln - perpustakaan
maupun data testing. Data yang dimasukkan pada aplikasi airlangga,” 2016.
ini diantaranya nama, jenis kelamin, umur, jenis [4] A. Jumadi, Z. Arifin, and D. Marisa, “Sistem
pekerjaan, jumlah pinjaman, jangka waktu pengembalian, Pendukung Keputusan Pemberian Kredit Rumah
jaminan, penghasilan, dan kategori. Jika pengguna ingin Sejahtera Pada Nasabah Bank Pembangunan
memprediksi maka pengguna harus melengkapi data-data Daerah Kalimantan Timur dengan Metode
tersebut agar mendapatkan hasil prediksinya. Hasil TOPSIS,” vol. 3, pp. 156–163, 2014.
prediksi yang ditampilkan bersama dengan proses [5] Y. I. Kurniawan, U. M. Surakarta, and C. Java,
perhitungannya. “Decision Support System for Acceptance
Pengujian yang dilakukan pada aplikasi dengan 2 Scholarship With Simple Additive,” pp. 99–108,
cara, yaitu pengujian blackbox dan pengujian tingkat 2015.
precision, accuracy, dan recall. Pada pengujian blackbox [6] Y. S. Nugroho, “Aplikasi Pemrediksi Masa Studi
hasilnya semua fitur yang terdapat pada aplikasi tersebut dan Predikat Kelulusan Mahasiswa Informatika
dapat berjalan sesuai yang diharapkan pada penelitian ini. Universitas Muhammadiyah Surakarta
Sedangkan pada pengujian tingkat precision memperoleh Menggunakan Metode Naive Bayes,” Khazanah
hasil 84%, tingkat ketepatan accuracy memperoleh hasil Inform., vol. I, no. 1, pp. 29–34, 2015.
75% dan tingkat recall memperoleh hasil 86%, hasil yang [7] A. Jadhav, A. Pandita, A. Pawar, and V. Singh,
diperoleh dari perhitungan tersebut cenderung meningkat. “Classification of Unstructured Data using Naïve
Memperolehnya hasil perhitungan tingkat precision, Bayes Classifier and Predictive Analysis for RTI
accuracy maupun recall yang semakin meningkat Application,” ABHIYANTRIKI An Int. J. Eng.
dikarenakan semakin banyak data training yang Technol., vol. 3, no. 6, pp. 1–6, 2016.
digunakan maka data pembanding semakin banyak dan [8] Y. S. Haryanti, Syarifah Nur , Nugroho,
hasil yang diperoleh akan semakin akurat. “Perbandingan 3 Metode Dalam Data Mining
Untuk Penjurusan Siswa Di SMA N 3 Boyolali,”

2015.
[9] Bustami, “Penerapan Algoritma Naive Bayes,” J.
Inform., vol. 8, no. 1, pp. 884–898, 2014.
[10] V. S and D. S, “Data Mining Classification
Algorithms for Kidney Disease Prediction,” Int.
J. Cybern. Informatics, vol. 4, no. 4, pp. 13–25,
2015.

Jurnal Vol 4 Jtmi 2018

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Jurnal Vol 4 Jtmi 2018

Diunggah oleh

Hak Cipta:

Format Tersedia

ISSN (print):1693-6604

Jurnal Teknologi dan Manajemen Informatika

Volume 4, Nomor 1, Tahun 2018

FAKULTAS TEKNOLOGI INFORMASI

Volume 4, Nomor 1, Tahun 2018

Redaksi menerima kiriman artikel yang relevan dengan pengembangan ilmu

Volume 4, Nomor 1, Tahun 2018

Aplikasi Klasifikasi Penerima Kartu Indonesia Sehat............................... 210-216

Aplikasi Klasifikasi Penentuan Pengajuan Kartu Kredit.......................... 217-223

Yoki Firmansyah [1],Udi[2]

Keywords: Pembuatan Sistem Akademik, Pesantren Al-habib Sholeh, Berbasis Web

1. PENDAHULUAN pengelolaan manajemen lembaga dan untuk

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

2. TINJAUAN PUSTAKA 2.4 Model Pengembangan Waterfall

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

4.2. Tahap Desain

- Spesifikasi File Siswa

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Alamat_wali Ala- Varchar 100 2 Id_wali_kela Id_wali_kela Var- 10 Foreign key

1 Id_informasi Id_informasi Int 10 Primary key

- Spesifikasi File Wali_Kelas

1 Id_wali_kelas Id_wali_kelas Int 10 Primary key

- Spesifikasi File Informasi_Wali_Kelas

1 Id_informasi Id_informasi Int 10 Primary Key

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Gambar 13. Implementasi Halaman Ruang

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Prasojo Diat, Lantip., Dan Riyanto. 2011. Teknologi

Kadir, Abdul., Dan Triwahyuni Ch, Terra, 2013.

Saputra Agus. 2012, Sistem Informasi Nilai

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

𝐀𝐝𝐡𝐢 𝐏𝐫𝐚𝐬𝐢𝐝𝐡𝐚𝐭𝐚𝐦𝐚[𝟏], 𝐊𝐫𝐢𝐬𝐭𝐢𝐞𝐧 𝐌𝐚𝐫𝐠𝐢 𝐒𝐮𝐫𝐲𝐚𝐧𝐢𝐧𝐠𝐫𝐮𝐦[𝟐]

Teknik Informatika, Fakultas Teknik dan Desain, Universitas Bunda Mulia

1. PENDAHULUAN Setiono tahun 2002, Nazief & Adriani tahun 1996,

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Perbandingan Algoritma Nazief & Adriani dengan

3. HASIL DAN PEMBAHASAN Gambar 2. Hasil stemming Nazief & Adriani

Gambar 3. Hasil stemming Idris

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Pada gambar 3 menampilkan hasil dari Harimau &

Setelah dilakukan pengujian, maka diperoleh

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Keywords: Clustering, Data Mining, K-Means, UMS Store

sulit dan rumit, khususnya dalam hal kepentingan

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

tujuan mendapatkan data akurat yang akan digunakan

2.3 Analisa Data

Subtotal Numeric Total harga keseluruhan

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

3. Ulangi langkah berikut sampai anggota tidak

Khedkar, 2015). K-means menggunakan pendekatan Haryati, 2015).

iteratif untuk meminimalkan jumlah jarak antara setiap

1. Menentukan nomor cluster (jumlah Kelompok) p : Dimensi data yang digunakan

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018

Dimana: dalam pembuatan tugas akhir ini.

𝑛𝑘 : Jumlah data dalam cluster 3 HASIL DAN PEMBAHASAN

2.7 Analisis Hasil

Jurnal Teknologi & Manajemen Informatika – Vol. 4 No.1 2018