ISSN (on-line):2580-8044
Jurnal Teknologi dan Manajemen Informatika adalah publikasi ilmiah dari Fakultas
Teknologi Informasi Universitas Merdeka Malang berupa artikel yang diterbitkan secara
berkala dan berkesinambungan. Publikasi ilmiah ini dimaksudkan sebagai wadah
pertukaran gagasan, telaah dan hasil-hasil penelitian dan pengembangan keilmuan di
bidang ilmu komputer yang mencakup teknologi informasi, sistem informasi, dan
manajemen informatika. Jurnal Teknologi dan Manajemen Informatika ini mempublikasikan
karya ilmiah hasil penelitian dari kalangan ahli, akademisi maupun praktisi di bidang
komputer. Artikel yang dipublikasiakan telah melalui proses review dan penyuntingan
oleh penerbit tanpa mengubah substansi artikel. Tulisan yang dipublikasikan
merupakan tanggung jawab pribadi penulis dan bukan mencerminkan pendapat
penerbit.
Jurnal Teknologi dan Manajemen Informatika terbit dua kali dalam setahun, yaitu Bulan
Januari dan Juli. Terbit pertama Juni 2015.
Alamat:
Fakultas Teknologi Informasi Universitas Merdeka Malang
Jl. Terusan Raya Dieng No. 62-64 Malang, 65146
Telp.: 0341-568395 Psw. 500
E-mail: jurnal.fti@unmer.ac.id
http://jurnal.unmer.ac.id/index.php/jtmi
Teknologi dan
Manajemen Informatika
ISSN (print):1693-6604
ISSN (on-line):2580-8044
JURNAL
TEKNOLOGI DAN MANAJEMEN INFORMATIKA
E-mail: jm_tmi@unmer.ac.id
http://jurnal.unmer.ac.id/index.php/jtmi/
Teknologi dan
Manajemen Informatika
Penanggung Jawab
Dekan Fakultas Teknologi Informasi
Ketua Penyunting
Dr. Mardiana Andarwati, S.E., M.Si., Universitas Merdeka Malang
Penyunting Pelaksana
Devita Maulina Putri, S.ST., M.Pd., Universitas Merdeka Malang
Kukuh Yudhistira, S.Kom., M.Kom., Universitas Merdeka Malang
Bambang Nurdewanto, S.Kom., M.Kom., Universitas Merdeka Malang
Drs. Anis Zubair, M.Kom., Universitas Merdeka Malang
Ronald David MAngero, S.Kom., M.Kom., Universitas Merdeka Malang
Aditya Galih Pramaditya, S.Kom., M.Kom., Universitas Merdeka Malang
Ahmad Rofiqul Muslikh, S.Kom., M.Kom., Universitas Merdeka Malang
Penyunting Ahli
Prof. Ir. Agus Suprapto, M.Sc., PhD., Universitas Merdeka Malang
Prof. Dr. Grahita Chandrarin, SE., MSi Ak.CA., Universitas Merdeka Malang
Dr. Boge Triatmanto, Universitas Merdeka Malang
Prof. Ir. Respati Wikantiyoso, MSA., Ph. D., Universitas Merdeka Malang
Reviewer
Prof. Ir. M.Sc., P.hD Arif Djunaidy, Institut Teknologi Sepuluh November Surabaya,
Indonesia
Dr. ST., MT Apol Pribadi Subriadi, Institut Teknologi Sepuluh November Surabaya,
Indonesia
Dr. Eng, ST., MT Anik Nur Handayani, (SCOPUS ID: 57193701633), Universitas
Negeri Malang
Dr.Eng, ST., MT Rosa Andrie Asmara, (SCOPUS ID: 55315476100), Politeknik
Negeri Malang, Indonesia
Syaiful Anam, S.Si., MT., P.hD (SCOPUS ID: 55702010900), Universitas
Brawijaya, Indonesia
Aji Prasetya Wibawa, ST., MMT., P.hD (SCOPUS ID: 56012410400), Universitas
Negeri Malang, Indonesia
Dr. S.Si., M.Kom Kiswara Agung Santoso, Universitas Jember, Indonesia
Saide Saide, S.Kom., M.Kom., M.I.M (SCOPUS ID: 57188873069), Universitas
Islam Negeri Sultan Syarif Kasim Riau, Indonesia
Haviluddin Haviluddin, S.Kom., M.Kom., P.hD., Universitas Mulawarman
Syahroni Wahyu Iriananda, S.Kom, MT., Universitas Widyagama Malang,
Indonesia
DAFTAR ISI
Penerapan Metode SDLC Waterfall Dalam Pembuatan........................... 184-191
Sistem Informasi Akademik Berbasis Web Studi Kasus Pondok
Pesantren Al-Habi Sholeh Kabupaten Kubu Raya, Kalimantan Barat
Yoki Firmansyah, Udi
Perbandingan Algoritma Nazief & Adriani Dengan................................ 192-195
Algoritma Idris Untuk Pencarian Kata Dasar
Adhi Prasidhatama, Kristien Margi Suryaningrum
Aplikasi Pengelompokan Pelanggan Pada Ums Store.............................. 196-203
Menggunakan Algoritma K-Means
Muhammad Abdul Ghofar, Yogiek Indra Kurniawan
Implementasi Data Mining Dengan Algoritma Apriori Untuk................ 204-209
Memprediksi Tingkat Kelulusan Mahasiswa
Irham Kurnawan, Fitri Marisa, Dwi Purnomo
Abstract
Academic Information System is one of the information that is needed by educational institutions as one As
reference for the development and achievement of teaching and learning activities. Academic information sys-
tems can also spur teachers to be more transparent in delivering learning outcomes to students and also spur
students in improving learning outcomes, so that has more meaning as a communication between teachers and
students. This system will also spur all to know the development of boarding school because the existing infor-
mation system at Al-habib Pondok Pesantren Sholeh Bin Alwi Alhaddad, Currently, Alhabib use the manual
system to data processor ex stundents, assessment and processing of academic information. With the existence
of this academic information system it will facilitate the admin to provide academic information, facilitate the
teacher in providing assessments of students didiknya more easily and transparently, facilitate students and
parents learn mngetahui student development. The website also has feature facilitate all obtain information
relating to boarding school and will further spur all in using the internet by accessing the academic website of
Pesantren Al-habib sholeh Bin Alwi Al-haddad.
1.4. Maksud dan Tujuan nangani database, MySQL adalah database Server
Adapun maksud dan tujuan adalah sebagai yang sangat populer dan banyak digunakan untuk
berikut; menangani data yang disajikan di halaman web.”
- Mempelajari dan menerapkan sistem Menurut Sibero (2013:112) “cascading style
terkomputerisasi dalam pengolahan data guru, sheet” dikembangkan untuk menata gaya pengaturan
siswa, nilai, dan informasi pada madrasah aliyah halaman web. terdiri dari Selector properti dan nilai
pondok pesantren Al Habib Sholeh Bin Alwi Al seperti halnya HTML atau PHP dan bahasa pemo-
Haddad yang selama ini masih menggunakan graman lainnya.”
pencatatan yang di simpan ke buku induk dan
seringnya pencatan data yang berulang 2.3 Sistem Informasi Akademik
- Kesulitan dalam hal penyampaian informasi Menurut Prasojo dan Riyanto (2011:152)
perkembangan siswa kepada orang tua siswa. Sistem adalah elemen-elemen yang terintegrasi dan
- Memberikan wadah komunikasi santri dan orang saling berhubungan untuk mencapai suatu tujuan
tua santri tentang informasi dan kegiatan santri. yang diinginkan
- Dapat memberikan solusi yang lebih baik dari Menurut Pratama (2014:9) “informasi adalah
setiap permasalahan yang dialami Madrasah merupakan hasil pengolahan data dari satu atau
Aliyah Pondok Pesantren Al Habib Sholeh Bin berbagai sumber yang kemudian diolah, sehingga
Alwi Al Haddad. memberikan nilai, arti dan manfaat.” Sedangkan
menurut Kadir dan Triwahyuni(2013:384)
1.5. Ruang Lingkup “informasi merupakan salah satu sumber daya
Bersadarkan Rumusan Masalah yang telah penting dalam suatu organisai dalam pengambilan
penulois identifikasi maka didapatlah ruang lingkup keputusan”
pada penelitian ini yaitu hanya membahas Menurut Agus Saputra (2012:11) “Sistem
pemograman Web Sistem Informasi Akademik yang Akademik merupakan sistem yang diciptakan dan
menggunakan metodologi waterfall Meliputi digunakan untuk memenuhi kebutuhan manajemen
Pendataan Guru, Pendataan Santri, Pendataan Nilai kampus.” sistem informasi akademik adalah
Dan Informasi Akademik pada Madrasah Aliyah perangkat lunak yang digunakan untuk menyajikan
Pondok Pesantren Al Habib Sholeh Bin Alwi Al informasi dan penata administrasi yang berhubungan
haddad. Yang dimana Sistem ini hanya dapat dengan penggunaan perangkat lunak seperti kegiatan
gunakan oleh Admin, Guru, wali kelas MA dan administrasi akademik dapat dikelola dengan baik
Santri MA. Tetapi Sistem informasi akademik ini dan informasi yang di perlukan dapat diperoleh
tidak di kususkan untuk MI dan MTs. dengan mudah dan cepat (Satoto, 2008)
Pada penelitian ini selain menggunakan metode - Admin membutuhkan Username dan Password
penulisan, penulis juga menggunakan metode untuk bisa Login.
pengembangan perangkat lunak untuk mengem- - Menambahkan Admin, Untuk menambahkan
bangkan Sistem Informasi Akademik berbasis Web data admin user membutuhkan Nama Admin,
Ini, adapun metode yang digunakan adalah SDLC Username, Password dan Foto untuk di simpan
Waterfall yang disadur dari buku Sukamto dan ke database.
Shalahuddin tahun 2013. Adapun penjelasan dari - Menambahkan Data guru, Untuk menambahkan
metode ini adalah sebagai berikut : data Guru user membutuhkan kode guru, Nip,
nama guru, jenis kelamin, Alamat, telepon,
status, foto, password dan mata pelajaran yang
di ambil agar bisa di simpan ke database.
Sistem/Rekayasa - Menambahkan Data wali kelas, Untuk
Informasi
menambahkan data wali kelas user
Analisis Desain Pengodean Pengujian
membutuhkan nama guru, kelas, username dan
password agar bisa di simpan ke database.
- Menambahkan Data siswa, Untuk
menambahkan data siswa user membutuhkan
Sumber :Sukamto dan Shalahuddin (2013:29) kode siswa, nama siswa, nis, nik, jenis kelamin,
Gambar 1. Kerangka Penelitian tempat lahir, tanggal lahir, alamat siswa, no
telpon, foto, nama ayah, nama ibu, alamat ortu,
- Analisis pekerjaan ayah, pekerjaan ibu, no telpon, nama
- Dalam tahap ini penulis mulai menganalisa apa wali dan alamat wali agar bisa di simpan ke
saja kebutuhan dari system, mulai dari kebutuhan database.
fungsional system maupun kebutuhan non - Menambahkan Data Mata Pelajaran, Untuk
fungsional dari sistem menambahkan data mata pelajaran admin
- Desain membutuhkan kode pelajaran, nama pelajaran,
Tahap desain merupakan tahapan lanjut dari kelas dan keterangan agar bisa di simpan ke
tahap analisis dimana dalam tahap ini disajikan database.
desain desain dari aplikasi seperti desain antar - Membberikan Informasi Akademik, Saat admin
muka, dan desain data base yang akan diterapkan menambahkan informasi maka akan tampil
kedalam system Informasi Akademik yang akan nama admin sebagai penanggung jawab agar
dibuat dapat di simpan ke database dan akan di
- Pengkodean tampilkan kehalaman utama sistem akademik
Pada tahap ini penulis menerapkan desai data 2. Guru
base serta desain antar muka kedalam bahasa Untuk mengisi nilai siswa Guru harus login
pemrograman, dimana bahasa pemrograman terlebih dahulu, dengan menggunakan Username
yang dipakai adalah menggunakan bahasa PHP Dan Password yang teleh di perolehnya dari Admin
untuk website setelah itu guru akan masuk sistem kehalaman Guru,
- Pengujian yang di dalam halaman guru terdapat menu masukan
Tahap uji merupakan tahap akhir dalam metode nilai untuk mengisi nilai sesuai kebutuhan Guru.
waterfall dimana dalam tahap pengujian ini 3. Siswa
digunakan teknik pengujian blackbox testing Untuk mengetahui nilai dan informasi siswa
harus login terlebih dahulu menggunakan NIS
4. PEMBAHASAN sebagai Username dan Tanggal lahir sebagai
4.1. Tahap Analisis Kebutuhan Perangkat Lu- password agar dapat masuk ke sistem siswa, setelah
nak login siswa dapat melihat informasi yang dikirimkan
Dalam penelitian ini penulis akan membahas tentang oleh masing-masing wali kelas siswa dan siswa
Sistem Informasi Akademik Berbasis Web pada dapat melihat nilai masing mata pelajaran atau
Pondok Pesantren Alhabib Sholeh Bin Alwi seluruh mata pelajaran, siswa juga dapat mencetak
Alhaddad menggunakan metode SDLC Waterfall nilai siswa keseluruhan sesuai yang telah disediakan
dimana tahap pertamanya adalah tahap analisa, ada- sistem.
pun hasil analisa kebutuhan yang dilakukan yaitu 4. Wali Kelas
sebagai berikut : Untuk memasuki sistem wali kelas membutukan
- Kebutuhan Fungsional username dan pasword untuk dapat masuk ke
Tahap keutuhan fungsional ini di perlukan halaman wali kelas, setelah login wali kelas hanya
untuk mengindifikasi apa saja yang dibutuhkan dan dapat memberikan informasi yang dapat tampil di
di inginkan oleh pengguna dari Aplikasi Sistem setiap masing-masing halaman beranda siswa setelah
Informasi Akademik pada Pondok Pesantren Al- siswa melakukan login sesuai status wali kelas.
habib Sholeh in Alwi Al-haddad adapun kebutuhan - Kebutuhan Non Fungsional
Fungsional adalah sebagai berikut: Dalam Tahapan kebutuhan Non fungsional ini
1. Admin penulis mengindifikasi apa saja yang dibutuhkan
oleh pengguna untuk menjalankan Aplikasi Sistem
Informasi Akademik pada Pondok Pesantren Al- Tabel 1. Spesifikasi File Admin
Habib Sholeh in Alwi Al-haddad. No Elemen Data Nama Field Type Size Keterangan
1. Spesifikasi Perangkat Keras
1 Id_Admin Id_Admin Int 10 Primary Key
Server
CPU Intel Core i3-5005U (2.0 GHz, 3 MB L3
Cache), RAM 4 GB, Harddisk 500 Gb, Mouse, 2 Nama_Admin Nama_Admin Varchar 25
Keyboard, Monitor Dengan Resolusi Layar Mini- 3 Username Username Varchar 25
mum 1366 X 768, Kecepatan Internet 1 Mbps 4 Password Password Varchar 50
Client
CPU, Intel Core i3-5005U (2.0 GHz, 3 MB L3 5 Foto Foto Varchar 100
Cache), RAM 4 GB, Harddisk 500 GB, Mouse ,
Keyboard, Monitor Dengan Resolusi Layar Mini- - Spesifikasi File Guru
mum 1366 X 768, Kecepatan Internet 1 Mbps, Tabel 2. Spesifikasi File Guru
2. Spesifikasi Perangkat Lunak
Server
Paket Hosting, Domain Ponpes-Alhaddad.Ac.Id,
Microsoft Windows 7, Google Chrome, Mozila Fire-
fox, Opera
Client
Microsoft Windows 7, Google Chrome, Mozila
Firefox, Opera
Abstract
Stemming is a process used to search root words. Stemming can be implemented as
preprocessing in text processing. There are many stemming algorithms, one of them is Nazief &
Adriani and Idris. Nazief & Adriani algorithm is an algorithm created by Bobby Nazief and
Mirna Adriani to find the root word of Bahasa Indonesia. While the Idris algorithm is an
algorithm created by Norisma Idris to find the root words of Malay language. Indonesian and
Malay have similar language styles, so researchers want to find out whether the Idris algorithm
can be used as one of the Indonesian stemming algorithms. To know which algorithm is better,
then in this research will be explained about process speed and accuracy of result of each of
those algorithm. After knowing the result of comparison of stemming algorithm, hopefully can
help you in choosing which algorithm will be used for find root word of Bahasa Indonesia.
Keywords: Perbandingan, Nazief & Adriani, Idris, Stemming
preprocessing terdiri dari beberapa langkah yaitu : 6. Jika semua langkah telah selesai tetapi tidak juga
case floding, tokenization, filtering dan stemming.[5] berhasil maka kata awal diasumsikan sebagai
kata dasar lalu proses diakhiri.
Pada proses case floding karakter selain huruf
dihilangkan dan semua huruf diubah menjadi Algoritma Stemming Idris
lowercase. Tokenization adalah proses dimana sebuah Berikut tahapan-tahapan mengenai stemming
kalimat dipotong untuk menghasilkan kata-kata yang menggunakan algoritma Idris adalah sebagai
akan digunakan untuk proses selanjutnya. berikut.[4]
Pengambilan kata-kata penting dari hasil tokenization
merupakan proses yang dilakukan dalam filtering. 1. a. Kata yang belum di-stemming dicari pada
Proses filtering memiliki dua teknik yaitu stop list kamus umum atau Kamus Besar Bahasa
(membuang kata yang kurang penting) dan word list Indonesia (KBBI). Jika kata itu langsung
(menyimpan kata yang penting). Setelah mendapatkan ditemukan, berarti kata tersebut adalah kata
kata-kata yang dirasa penting, selanjutnya dilakukan dasar. Kata tersebut dikembalikan dan algoritma
proses stemming. Proses pada tahap stemming ialah dihentikan.
melakukan pengolahan dan pencarian kata dasar dari b. Kata yang belum di-stemming dicari pada
hasil filtering atau sekumpulan kata-kata yang sudah kamus lokal. Jika kata itu langsung ditemukan,
dianggap penting. berarti kata tersebut adalah kata dasar. Kata
tersebut dikembalikan dan algoritma dihentikan.
Algoritma Stemming Nazief & Adriani Kamus lokal digunakan karena algoritma Idris
Algoritma yang dibuat oleh Bobby Nazief dan dibuat untuk stemming bahasa melayu, yang
Mirna Adriani memiliki tahapan sebagai berikut.[2] dimana kamus lokal berisi kata-kata dasar
1. Cari kata yang akan distem dalam kamus. Jika bahasa melayu. Sedangkan stemming bahasa
ditemukan maka diasumsikan bahwa kata Indonesia tidak memerlukan kamus lokal.
tesebut adalah kata dasar. Maka algoritma 2. Menghilangkan turunan awalan. Langkah ini
berhenti. terus dilakukan sampai tidak ada lagi turunan
2. Infleksi akhiran (“-lah”, “-kah”, “-ku”, “-mu”, awalan. Jika tidak ada lagi, maka lanjutkan ke
atau “-nya”) dibuang. Jika berupa partikel (“- langkah berikutnya. Untuk beberapa kombinasi
lah”, “-kah”, “-tah” atau “-pun”) maka langkah imbuhan, dilakuan penghilangan awalan terlebih
ini diulangi lagi untuk menghapus kata ganti dahulu. Yaitu pada kombinasi imbuhan “ber-
posesif (“-ku”, “-mu”, atau “-nya”), jika ada. lah”, “ber-an”, “men-i”, “di-i”, “pe-i”, “ter-i”.
3. Hapus penurunan akhiran (“-i”, “-an” atau “- 3. Hilangkan ifleksi akhiran terlebih dahulu. Jika
kan”). Jika kata ditemukan di kamus, maka hal ini berhasil dan akhiran adalah partikel (“-
algoritma berhenti. Jika tidak maka ke langkah lah”, ”-pun” dan ”-kah”), langkah ini dilakukan
3a. lagi untuk menghilangkan kata ganti akhiran
a. Jika “-an” telah dihapus dan huruf terakhir posesif (“ku”, “mu” atau ”nya”).
dari kata tersebut adalah “-k”, maka “-k” 4. Hilangkan turunan akhiran. Langkah ini terus
juga ikut dihapus. Jika kata tersebut dilakukan sampai tidak ada lagi penurunan
ditemukan dalam kamus maka algoritma akhiran. Jika tidak ada lagi, maka lanjutkan ke
berhenti. Jika tidak ditemukan maka lakukan langkah berikutnya.
langkah 3b. 5. Setelah setiap penghilangan imbuhan dilakukan,
b. Akhiran yang dihapus (“-i”, “-an” atau “- maka lakukan pengecekan menggunakan kamus.
kan”) dikembalikan, lanjut ke langkah 4. Jika kata ditemukan, maka algoritma berhenti
4. Hapus penurunan awalan. Jika pada langkah 3 dan tidak perlu dilakukan pengecekan terhadap
ada akhiran yang dihapus maka pergi ke imbuhan lainnya. Jika sampai selesai
langkah 4a, jika tidak pergi ke langkah 4b. penghilangan imbuhan masih belum menemukan
a. Periksa tabel kombinasi awalan akhiran yang kata dasar, maka dilakukan recoding.
tidak diizinkan. Jika ditemukan maka 6. Jika semua langkah sudah dilakukan termasuk
algoritma berhenti, jika tidak pergi ke recoding dan tidak juga ditemukan dalam
langkah 4b. kamus, maka algoritma ini akan manganggap
b. Pada langkah ini dilakukan perulangan kata semula sebagai kata dasar.
sebanyak tiga kali. Tentukan tipe awalan
2. METODE PENELITIAN
kemudian hapus awalan. Jika kata dasar
belum juga ditemukan lakukan langkah 5,
Metode pengembangan sistem yang digunakan
jika sudah maka algoritma berhenti. Catatan:
adalah model watefall. Berikut merupakan jabaran
jika awalan kedua sama dengan awalan
mengenai metode pengembangan sistem model
pertama algoritma berhenti.
waterfall.[3]
5. Melakukan Recoding.
1. Analisis Kebutuhan
Dalam tahapan ini penulis menentukan
kebutuhan-kebutuhan pada sistem Analisa
Objek pengujian untuk mengetahui kecepatan Pada gambar 2 menampilkan hasil dari
proses dan akurasi dari algoritma Nazief & Adriani pengolahan algoritma Nazief & Adriani. Atribut yang
dan Idris adalah berupa wacana berupa teks. Berikut ditampilkan pada hasil stemming Nazief & Adriani
merupakan tampilan dari laman masukkan pengujian berupa durasi pemrosesan, jumlah kata yang
dengan wacana berjudul “Legenda Danau Toba” dihasilkan, data kata dari hasil stemming, dan jumlah
dengan jumlah kata 520. kata salah. Jumlah kata salah merupakan jumlah dari
kata yang dihasilkan dari stemming namun tidak
sesuai dengan kata dasarnya.
4. KESIMPULAN
Abstract
UMS Store is an official trading business unit owned by Muhammadiyah University of Surakarta that
provides various categories of books, journals, office stationery and official marchandise. UMS Store is
also a voucher exchange center for students. Of the many voucher redemption transactions and cash
purchases, UMS Store has abundant data and will continue to grow over time. The abundant data if left
unchecked would be a pile of only stored data. Actually, if the data is excavated will produce valuable
information. UMS Store need a customer grouping application that will be used to provide continuous
treatment such as giving discounts or vouchers to their best customers. This research is done to create the
application, where application can make customer grouping with UMS Store data and can give
recommendation through potential group that formed. This application was developed by utilizing K-
means algorithm, which is one of clustering method in data mining technique. Groupings made in the
application are limited to 3 large groups of data with restrictions using only student data using UMS Store
vouchers. Variables used consist of NIM, year force, discount, sub total, total paid, total item and date.The
results of this study is an application used to classify customers using K-means method. The results of this
study indicate that if the application is used to create three groups, it will form three clusters, ie clusters of
potential customers, normal customers and unlikely customer clusters.
Data mining merupakan sekumpulan proses yang khusus juga menggambarkan penggunaan teknik k-means
dilakukan dalam menemukan dan menggali nilai tambah clustering dan menjelaskan penggunaanya dalam
dari sekumpulan data yang selama ini sulit diketahui segmentasi pelanggan perusahaan televisi berdasarkan
secara manual. Kata mining dalam pengertiannya berarti berbagai variabel. Hasil simulasi menunjukkan pembagian
usaha untuk mendapatkan sedikit pengetahuan berharga delapan puluh pelanggan televisi ke dalam empat
dari sejumlah besar material dasar. Dengan demikian data kelompok. Pada penelitian serupa, Lanjewar, dkk (2013)
mining yang diterapkan memiliki tujuan yaitu untuk menguraikan teknik pengelompokan data untuk
mengungkap dan menggali pola tersembunyi dari sejumah melakukan segmentasi pelanggan pada perusahaan produk
data. Proses data mining sangat diperlukan, terutama susu. Proses klastering dapat membantu untuk
untuk mengolah data dalam jumlah yang besar demi mengidentifikasi kebutuhan dan perilaku pelanggan dan
memberikan informasi strategis yang akurat (Bahar, meningkatkan layanan demi kepuasan pelanggan. Dalam
Pramono, & Sagala, 2016). Data mining dilakukan untuk industri apapun langkah pertama untuk menemukan dan
mengekstrak informasi berharga dari sebuah dataset dan menghasilkan pelanggan yang menguntungkan ialah
kemudian memaparkannya dalam format yang mudah dengan pengelompokan. Hasil dari sistem tersebut
dimengerti oleh manusia dengan tujuan untuk mengambil memberikan profil dan pemahaman yang lebih baik
sebuah keputusan (Ezenkwu, Ozuomba, & Kalu, 2015) terhadap pelanggan. Dalam penelitian serupa, Jain, dkk
(2014) mengelompokkan konsumen berdasarkan perilaku
Dalam penelitian sebelumnya Sumadikarta, dkk
belanja konsumen. Data yang dikumpulkan dari 1014
(2016) mengembangkan sebuah aplikasi dengan konsep
responden dilakukan pengelompokan dengan metode k-
data mining menggunakan algoritma k-means yang
means dan menghasilakn empat buah kelompok
berfungsi untuk mengelompokkan data pelanggan serta
pelanggan. Mengelompokkan pelanggan kedalam segmen
data produk pada PT Mega Arvia Utama. Hasil dari
tertentu dapat membantu pemasaran dalam penargetan
sistem ini adalah membentuk klaster yang digunakan
konsumen dengan lebih terfokus.
sebagai bahan pertimbangan dalam menentukan strategi
penjualan perusahaan yaitu, dengan menghilangkan Berdasarkan latar belakang tersebut, maka
produk yang menempati klaster terbawah dan penelitian ini akan mengembangkan sebuah aplikasi
memeberikan reward kepada pelanggan poternsial yang klastering dengan teknik data mining menggunakan
menempati klaster teratas. Bahar, dkk (2016) juga algoritma K-means. Aplikasi ini dibuat untuk melakukan
mengembangkan sistem penentuan strategi yang dibuat pengelompokan pelanggan pada UMS Store untuk
untuk menerapkan metode data mining dengan menemukan kelompok pelanggan potensial, yang
menggunakan algoritma K-Means Clustering, yaitu nantinya akan digunakan untuk memberikan rekomendasi
dengan cara melakukan pembagian data yang ada menjadi berupa treatment dan penanganan lebih lanjut.
satu atau lebih cluster. Tujuan dari penelitian tersebut
2 METODOLOGI
adalah untuk membagi data ke dalam beberapa kelompok,
Bab ini menjelaskan berbagai tahapan yang dilakukan
berfokus pada produk yang paling diminati.
dalam melakukan penelitian, sehingga dapat sesuai
Tikmani, dkk (2015) melakukan penelitian untuk dengan tujuan penelitian. Adapun alur tahapan dalam
mengelompokkan pelanggan dan bagaimana algoritma k- metodologi penelitian ini ditunjukkan pada Gambar 1.
means dapat digunakan untuk membagi pelanggan
kedalam kelompok yang berbeda. Penelitian ini
menggambarkan mengenai segmentasi pelanggan dan
menjelaskan algoritma clustering secara rinci. Secara
minat mahasiswa untuk berbelanja di UMS Store. Tanggal Date Tanggal transaksi
pembelian
Pengelompokan pada penelitian ini dibatasi pada data
2.4 Desain
transaksi mahasiswa dengan pembelian menggunakan
Pada tahap desain, dilakukan perancangan dari aplikasi
voucher UMS Store saja, sehingga proses pengklasteran
yang akan dibangun. Perancangan menggunakan metode
dapat lebih spesifik.
Unified Modeling Language (UML) dengan diagram
2.2 Pengumpulan Data usecase. Diagram usecase menggambarkan interaksi yang
Pengumpulan data dilakukan untuk memperoleh dapat dilakukan oleh pengguna di dalam aplikasi (Lihat
informasi serta data yang dibutuhkan agar dapat mencapai pada Gambar 2).
tujuan akhir penelitian. Pengumpulan data memiliki
permasalahan dalam melakukan pengklasteran adalah kelompok, sehingga data yang mempunyai kesamaan
dengan menggunakan algorima K-means. Huruf k pada k- karakteristik akan dikelompokkan dalam satu cluster,
means mewakili jumlah kelompok yang dipilih. Dalam sedangkan data yang berbeda karakteristiknya
algoritma k-means setiap kumpulan data diperlakukan dikelompokkan pada cluster lain. Dalam membagi
sebagai objek yang memiliki beberapa lokasi. K-means kelompok tersebut digunakan persamaan Euclidean
menemukan partisi sehingga objek di dalam kelompok distance space (persamaan 1) yang digunakan untuk
cluster sangat dekat satu sama lain, dan sangat jauh dan menghitung jarak terpendek antara dua titik yang
berebeda dengan kelompok lain. (Tikmani, Tiwari, & diperhitungkan yaitu data dengan centroid (Nugroho &
Berikut langkah pada algoritma k-means: 𝑑𝑖𝑗 : Euclidean distance, Jarak antara objek i dan j
Sedangkan untuk memperoleh titik centroid baru segi sistem, aplikasi ini memudahkan UMS Store dalam
dilakukan dengan cara menghitung nilai rata-rata dari data menentukan pelanggan potensial tanpa memerlukan
yang ada pada cluster yang sama menggunakan tenaga tambahan dalam melakukan analisa.
persamaan 2.
2.8 Kesimpulan
1 Pada tahap ini, penulis merumuskan suatu kesimpulan
𝐶𝑘 = ∑ 𝑑𝑖 (2)
𝑛𝑘
sesuai dengan penelitian dan hasil yang telah dilakukan
pada Gambar 6. anggota dari setiap cluster tersedia button yang akan
menampilkan tabel sesuai dengan cluster yang dipilih.
Pembahasan
3.2 Pembahasan
Berdasarkan hasil penelitian yang telah dilakukan, dapat
diperoleh proses perhitungan menggunakan algoritma k-
Gambar 6. Tampilan upload data CSV means. Perhitungan ini sesuai dengan langkah -langkah
Pada bagian kanan menu Project terdapat button pada algoritma k-means yang telah dijelaskan
Proses Data yang digunakan untuk melakukan inisialisasi sebelumnya. Pertama ialah menentukan nilai centroid
proses. Apabila button dijalankan maka akan tampil awal yang diambil dari data secara random atau acak.
sebuah form, dimana pengguna diminta untuk Daftar centroid awal yang telah diproses dapat dilihat
yang akan diproses pada form tersebut. Gambar 7 Tabel 2. Daftar centroid awal
Dengan menggunakan persamaan euclidean baru dan lakukan langkah diatas sampai diperoleh hasil
distance space, diperoleh perhitungan jarak sebagai dengan jarak yang konstan dan anggota cluster tidak
berikut: mengalami perubahan.
3.3 Pengujian
Pengujian menggunakan metode blackbox dilakukan
untuk menemukan kesalahan dan ketidaksesuaian fungsi
dalam aplikasi, dimana pengujian dilakukan terhadap
setiap fungsi yang terdapat pada program. Fokus utama
pengujian ini adalah pada spesifikasi fungsional dalam
Jarak terdekat berdasarkan perhitungan diatas
aplikasi. Tabel 4 memperlihatkan hasil pengujian
adalah jarak pada centroid ketiga, sehingga data tersebut
blackbox yang menunjukkan bahwa aplikasi
menjadi anggota cluster 3. Demikian seterusnya hingga
pengelompokan pelanggan telah berjalan dengan baik.
setiap data selesai dihitung. Selanjutnya tentukan centroid
Menambahkan data baru kedalam NIM, Discount, Subtotal, Data berhasil ditambahkan
Input Data Valid
database Total Item ke database
Mengunggah dokumen dengan format
Upload File Dokumen CSV Dokumen berhasil diunggah Valid
CSV kedalam database
Menghapus yang berada dalam
Hapus Data Klik Tombol Hapus Data berhasil dihapus Valid
database
Mengedit Data yang berada dalam
Edit Data Klik Tombol Edit Data berhasil di-edit Valid
database
Input Proses Memasukkan jumlah cluster dan jumlah Jumlah cluster dan jumlah Nilai tersimpan dalam
Valid
K-means iterasi untuk proses clustering iterasi variabel K dan Maxruns
Proses K- Data diproses,
means Mengelompokkan data kedalam cluster Klik tombol proses. menampilkan centroid Valid
clustering proses.
Lihat Hasil Menampilkan hasil pengelompokan Menekan Tombol Lihat Dta berhasil ditampilkan
Valid
Cluster keseluruhan. Hasil Cluster dalam tabel
Lihat Anggota Menekan Tombol Anggota Data berhasil ditampilkan
Menampilkan hasil untuk setiap cluster. Valid
Cluster Cluster dalam tabel
software Rapidminer pada akhirnya mendapatkan hasil Studio Sonyxtattoo Menggunakan Metode K-
Means Clustering. Semantik, 2(2), 75-86.
yang sama.
Ezenkwu, C. P., Ozuomba, S., & Kalu, C. (2015).
3.4 Interpretasi Hasil Application of K-Means Algorithm for Efficient
Customer Segmentation: A Strategy for Targeted
Pada penelitian ini, aplikasi pengelompokan pelanggan
Customer Services. IJARAI, 4(10), 40-44.
menggunakan algoritma k-means telah diimplementasikan doi:10.14569/IJARAI.2015.041007
pada data percobaan dan sesuai dengan yang diharapkan. Handoko, K. (2016). Penerapan Data Mining dalam
Meningkatkan Mutu Pembelajaran pada Instansi
Berdasarkan sampel sebanyak 357 data, setelah dilakukan
Perguruan Tinggi Menggunakan Metode K-Means
pengelompokan dengan jumlah kelompok sebanyak tiga Clustering (Studi Kasus di Program Studi TKJ
Akademi Komunitas Solok Selatan). TEKNOSI,
cluster diperoleh hasil sebagai berikut: anggota cluster 1
02(3), 31-40.
dengan titik centroid akhir (2013.967; -100000; doi:https://doi.org/10.25077/TEKNOSI.v2i3.2016.3
1-40
101687.741; 1687.741; 3.351; 7.429) berjumlah 310 data,
Jain, N., & Ahuja, V. (2014). Segmenting Online
cluster 2 dengan titik centroid (2014.270; -100000;
Consumers Using K-means Cluster Analysis.
125908.108; 25908.108; 1.891; 8.432) berjumlah 37 data International Journal of Logistics Economics and
Globalisation, 6(2), 161-178.
dan cluster 3 dengan titik centroid akhir (2014.500; -
doi:https://doi.org/10.1504/IJLEG.2014.068274
100000; 162390; 62390; 1.200; 6.600) berjumlah 10 data.
Khandre, A., & Alvi, A. S. (2016). Efficient Clustering
Sehingga dengan membandingkan nilai atribut dalam Algorithm with Improved Clusters Quality. IOSR-
JCE, 18(6), 15-19. doi:10.9790/0661-1806051519
setiap kelompok dapat diambil kesimpulan bahwa
kelompok pelanggan potensial berada dalam cluster 3. Kurniawan, Y. I., & Windisani, P. A. (2017). Sistem
Pendukung Keputusan untuk Penentuan Kelolosan
Kelompok inilah yang akan menjadi rekomendasi pada Beasiswa Sekolah Menengah Kejuruan (SMK)
Menggunakan Metode Fuzzy . Jurnal Teknik
UMS Store.
Elektro, 9(1).
4 PENUTUP Lanjewar, R., & Yadav, O. P. (2013). Understanding of
Customer Profiling and Segmentation Using K-
Berdasarkan hasil penelitian yang telah dilakukan dapat
Means Clustering Method for Raipur Sahkari
diambil beberapa kesimpulan diantaranya: Dugdh Sangh Milk Products. IJRCCT, 2(3), 103-
107.
1. Sistem pengelompokan pelanggan dengan
Nugroho, Y. S., & Haryati, S. N. (2015). Klasifikasi dan
menggunakan algoritma k-means berhasil dibuat
Klastering Penjurusan SMA Negeri 3 Boyolali.
untuk mengelompokkan pelanggan potensial. Khazanah Informatika, 1(1), 1-6.
doi:https://doi.org/10.23917/khif.v1i1.1175
2. Berdasarkan pengujian Blackbox aplikasi telah
Prabiantissa, C. N., Ririd, A. R., & Asmara, R. A. (2017).
berjalan dengan baik. Sedangkan pengujian hasil
Sistem Identifikasi Batik Alami dan Batik Sintetis
dengan menggunakan software RapidMiner juga Berdasarkan Karakteristik Warna Citra dengan
Metode K-Means Clustering. Jurnal Informatika
mendapatkan hasil yang sama dengan aplikasi
Polinema, 5(2), 26-31.
pengelompokan pelanggan.
Sumadikarta, I., & Abeiza, E. (2016). Penerapan
3. Pengelompokan yang dihasilkan berdasarkan Algoritma K=Means pada Data Mining Untuk
Memilih Produk dan Pelanggan Potensial (Studi
perhitungan jarak terdekat antara setiap data
Kasus : PT Mega Arvia Utama). Jurnal Satya
dengan centroid. Jumlah cluster dalam sistem Informatika, 1(1), 12-22.
dapat ditentukan sebanyak 3 cluster. Tikmani, J., Tiwari, S., & Khedkar, S. (2015). An
Approach To Consumer Classification Using K-
Means. IJIRCCE, 3(11), 10542-10549.
5. DAFTAR PUSTAKA doi:10.15680/IJIRCCE.2015.0311029
Bahar, A., Pramono, B., & Sagala, L. H. (2016).
Penentuan Strategi Penjualan Alat-Alat Tattoo di
Abstract
Informatics Engineering Program University of Widyagama Malang has many volume of
student databases. When properly excavated, so can known patterns or knowledge for a
decision-making. Data that can be explored is the understanding of information about
graduation students. This research to predict the passing rate of students with more efficient
time, which can be known before the student graduated so that can be evaluated in their
studies, especially in Informatics Engineering University of Widyagama. In this case using
association methods and Apriori algorithm. This method calculates the support value that is
the supporting value of an item with big golden rule 60% of the data of course grade. The
results of this study to help universities improving the quality of education and help in knowing
the information about the graduation rate of students based on the value of the subjects and
achievement index obtained by students in Informatics Engineering course University of
Widyagama Malang.
mengetahui/memprediksi tingkat kelulusan mahasiswa. Pada tahap ini dilakukan pengelompokkan data
Oleh sebab itu, penelitian ini bertujuan untuk mata kuliah. Untuk matakuliah di bedakan menjadi 2
mengetahui nilai matakuliah yang paling dominan bagian, yaitu matakuliah jenis dan jenis2. Matakuliah
untuk memprediksi tingkat kelulusan mahasiswa jenis merupakan jenis matakuliah sesuai dengan SK
hingga dapat mengurangi jumlah kandidat yang harus Dikti pada program studi teknik informatika yang
dihitung support-nya sehingga sistem ini dapat dibedakan menjadi :
diterapkan dan hasil penelitian ini juga akan dirasakan a) Mata Kuliah Pengembangan Kepribadian (MPK).
manfaatnya pada program studi Teknik Informatika b) Mata kuliah Keilmuan dan Keterampilan (MKK).
Universitas Widyagama. c) Mata kuliah Keahlian Berkarya (MKB).
Dengan demikian, indeks prestasi kumulatif (IPK) d) Mata kuliah Perilaku Berkarya (MPB)
yang mencerminkan seluruh nilai yang diperoleh e) Mata kuliah Berkehidupan Bermasyarakat (MBB).
mahasiswa setiap semester yang menjadi tolak ukur Mata kuliah jenis2 merupakan kelompok mata
besarnya tingkat prestasi yang telah dicapai oleh kuliah yang lebih spesifik untuk jurusan Informatika,
mahasiswa dapat terus ditingkatkan. kelompok matakuliah jenis2, yaitu : Algoritma, Dasar
IT, Database, Desktop, Mobile, Pendukung, Sistem
B. Perancangan Sistem Informasi, dan Web.
Dalam mengatasi permasalahan pada Prodi
Teknik Informatika Universitas Widyagama yaitu 2. Nilai Item
dengan menggunakan teknik data mining dengan Nilai support sebuah item dapat kita peroleh dari
aturan asosisasi algoritma Apriori. Algoritma apriori rumus berikut :
bertujuan untuk menemukan semua aturan apriori 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴) =
yang memenuhi syarat minimum untuk support dan 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
( ) 𝑥 100% .....................
syarat minimum untuk confidence. Dalam perhitungan 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
3. Support Minimum
Dalam menghitung support minimum, yang di
gunakan dalam dalam pemilihan minimum frekuensi
Gambar 1: adalah minimal 60% dari jumlah total maksimal suatu
Flowchart alur perhitungan Apriori item. Nilai support dari 2 item berbeda dapat kita
peroleh dari rumus berikut :
1. Scan data
5. Nilai Confidence
Setelah memilih item-item untuk peluang support,
selanjutnya kita gunakan untuk mencari peluang
confidence.
Rumus untuk mencari confidence adalah sebagai
berikut :
𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 𝑃(𝐵|𝐴) =
𝐽𝑢𝑚𝑙𝑎ℎ 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵
….......... (3)
𝐽𝑢𝑚𝑙𝑎ℎ 𝑚𝑒𝑛𝑔𝑎𝑑𝑢𝑛𝑔 𝐴
6. Minimum frekuensi
Minimum confidence yang digunakan dalam
pemilihan minimum frekuensi adalah minimal 60%
dari nilai confidence item. Jika nilai confidence > Gambar 2: Flowchart Sistem
minimum confidence maka akan diperoleh frekuensi Flowchart tersebut dimulai dengan input data yang
terkuat. dilakukan oleh user ketika melakukan login ke sistem.
Kemudian data yang di input tersebut akan di proses
7. Final Assosiation Rule oleh admin dalam melakukan perhitungan prediksi
Setelah diperoleh frekuensi minimum confidence, tingkat kelulusan mahasiswa.
Berikut ini tabel hasil perangkingan nilai berdasarkan E. Data Flow Diagram (DFD)
jenis matakuliah dan nilai. Berikut merupakan DFD yang menggambarkan
Tabel 5. : Frekuensi Tertinggi bagaimana sistem yang menggunakan metode asosiasi
ITEM C Rank algoritma Apriori ini berjalan.
Algoritma dan 77,78 1
MKB
jenis informasi yang sama. Berikut ini adalah ERD Data nilai yang dapat diinput yaitu nim mahasiswa,
yang direkomendasikan pada Sistem Prediksi nama mahasiswa, nama matakuliah, serta nilai yang
Kelulusan: diperoleh mahasiswa. Nilai yang telah diinput tersebut
digunakan dalam melakukan perhitungan prediksi
kelulusan mahasiswa. Hanya admin yang dapat
mengakses menu ini.
A. Utama
E. Form Apriori
Pada menu apriori dilakukan proses perhitungan
C1 yaitu penggabungan jumlah item dari jenis
matakuliah dan perolehan nilai dari matakuliah
tersebut. L1 merupakan nilai support dari itemset 1
Gambar 6 : Form Tambah Nilai yang diperoleh dari hasil perhitungan C1.
Menu tambah nilai digunakan untuk menambahkan
nilai tiap matakuliah yang telah ditempuh mahasiswa.
B. Saran
1) Penelitian ini dapat digunakan sebagai acuan /
referensi untuk menentukan seberapa cepat
mahasiswa menyelesaikan studinya dan
mengetahui matakuliah mana yang menjadi
Gambar 10 : Form Lanjutan Apriori keunggulan dari mahasiswa tersebut.
2) Aplikasi ini hanya berjalan ketika mahasiswa
Setelah itu dilanjutkan dengan perhitungan nilai tersebut ada di atas semester 5, karena matakuliah
confidence. Sehingga diperoleh presentase nilai dari jenis 2 mulai semester 3.
confidence tiap matakuliah. Menu ini hanya dapat
diakses oleh admin. V. REFERENSI
[1] Hartanto, D., & Hansun, S. (2014).
F. Form Hasil Prediksi Kelulusan IMPLEMENTASI DATA MINING DENGAN
ALGORITMA C4.5 UNTUK MEMPREDIKSI
TINGKAT KELULUSAN MAHASISWA.
Jurnal ULTIMATICS , 1, 15-20. Dapat diakses
di :
[http://www.ejournals.umn.ac.id/index.php/TI/art
icle/view/327.html ].
[2] Wirdasari, D. & A.Calam,.Penerapan Data
Mining Untuk Mengolah Data Penempatan Buku
Di Perpustakaan Smk Ti Pab 7 Lubuk Pakam
Dengan Metode Association Rule. Jurnal
SAINTIKOM, 10 (2), 150, 2011. Dapat diakses
di :
[http://www.academia.edu/7489155/Penerapan_
Data_Mining_Untuk_Mengolah_Data_Penempat
an_Buku_Di_Perpustakaan_Smk_Ti_Pab_7_Lub
uk_Pakam_Dengan_Metode_Association_Rule].
[3] Linoff , G. S., & Berry, M. J. Data Mining
Gambar 11 : Form Hasil Prediksi Kelulusan
Techniques for Marketing, Sales, Customer
Relationship Management. 2011. United States
V. KESIMPULAN
of America: Wiley Publishing, Inc. Dapat diakses
A. Simpulan
di:
Dari hasil penelitian yang telah dilakukan di
[https://www.amazon.com/Data-Mining-
Program Studi Tentik Informatika Universitas
Techniques-Relationship-
Widyagama Malang maka dapat disimpulkan bahwa:
Management/dp/0470650931].
Abstract
Along with the rapid development of information technology today, the cost to meet the needs of
life increasingly high, this is triggered by the amount of budget issued by the government to
solve economic problems in Indonesia, especially in terms of National Welfare Guarantee.
Kartu Indonesia Sehat is a card issued by the government and managed by the Badan
Penyelenggara Jaminan Sosial (BPJS) to alleviate the poor for health. Existing problems such
as in the distribution of the card has not been on target because of the amount of data obtained
so highly possible error happens in determining the recipient of Kartu Indonesia Sehat. The
concept of data mining is considered to solve the problems faced in determining the recipient
community or not the recipient of Kartu Indonesia Sehat. Classification methods are able to find
models that distinguish the concepts or data classes, with the spesific goal of determining the
class of an unknown object label. Therefore, the Naïve Bayes algorithm could predict future
opportunities based on prior experience by considering some variables such as age, last
education, occupation, monthly income and dependents of children that will determine the final
outcome of a decision. The result of this research is a system that will predict the people who
will receive Kartu Indonesia Sehat so that the government will distribute the card accurately to
the public and the acquired results from the test obtained an average accuracy rate of 94.78%,
98.86% precision and 90.98% recall.
Keywords— data mining, Kartu Indonesia Sehat , Kartu Indonesia Sehat classification, Naïve Bayes
dengan menghitung nilai probabilitas untuk setiap P(C│X) : Probabilitas hipotesis C berdasar kondisi X
kejadian dari atribut target pada setiap kasus. Tujuan (probabilitas posterior)
dari penelitian ini adalah untuk menghasilkan suatu P(C) : Probabailitas hipotesis C (probabilitas prior)
sistem yang dapat memberikan output berupa hasil P(X│C) : Probablitas X berdasarkan kondisi pada
perhitungan dari Algoritma Naïve Bayes Classifier hipotesis C
yaitu berupa hasil Penerima Kartu Indonesia Sehat. P(X) : Probabilitas X
Dengan adanya sistem tersebut diharapkan dapat
membantu dalam menyajikan informasi Penerima
Kartu Indonesia Sehat yang lebih akurat. Penerapan dengan algoritma Naïve Bayes
dimaksudkan untuk mencari probabilitas variabel dari
II. METODOLOGI PENELITIAN setiap kemungkinan untuk dapat dinyatakan sebagai
Metodologi penelitian yang digunakan dalam penerima Kartu Indonesia Sehat. Data pelatihan yang
penelitian ini memiliki tahapan yang harus dilalui, digunakan sebanyak 650 data masyarakat. Oleh karena
diantaranya seperti pada gambar 1 berikut: itu, perulangan pencarian confidence dilakukan
sebanyak dari data pelatihan yang telah diperoleh.
Gambar 2 merupakan Flowchart dari sistem yang
dibangun untuk mendapatkan hasil confidence
tertinggi pada variabel yang dicari yaitu penerima
Gambar 1. Tahapan Metodologi Penelitian Kartu Indonesia Sehat.
WIRASWAST
39 SLTP RENDAH 2 YA
A
Tipe
No Variabel Value KARYAWAN
Data 58 SLTP CUKUP 2 YA
SWASTA
a) A1 : Usia < 20 DIPLOMA IV/ PEGAWAI SANGAT
Tahun 52 3 TIDAK
STRATA I NEGERI SIPIL TINGGI
b) A2 : Usia 20 –
40 Tahun AKADEMI/
69 PENSIUNAN TINGGI 0 TIDAK
Polyno c) A3 : Usia 40 – DIPLOMA III
1 Usia
mial 60 Tahun BURUH
d) A4 : Usia 60 – 32 SLTA HARIAN RENDAH 1 YA
80 Tahun LEPAS
e) A5 : Usia > 80 AKADEMI/ KARYAWAN
39 CUKUP 0 TIDAK
Tahun DIPLOMA III SWASTA
Tidak/ Belum Sekolah,
DIPLOMA IV/ PEGAWAI
Belum Tamat SD, 31
STRATA I NEGERI SIPIL
TINGGI 2 TIDAK
Tamat SD, SLTP,
Pendidikan Polyno
2 SLTA, Diploma I/II, WIRASWAST
Terakhir mial 50 SLTP RENDAH 2 YA
Akademi/ Diploma III, A
Diploma IV/ Strata I,
Strata II, Strata III
Karyawan Swasta,
Wiraswasta, Buruh
Harian Lepas, Tukang
Tabel 3. Data Uji
Polyno
3 Pekerjaan Batu, Tukang Jahit,
mial
Guru, Pegawai Negeri PENDIDIKA
USI PENDAPATA T TERIMA
Sipil, Karyawan BUMN, N PEKERJAAN
A N A KIS?
Dosen, dll TERAKHIR
a) Kurang dari Rp. KARYAWAN
44 SLTA CUKUP 2 ?
500.000 SWASTA
Sangat Rendah
b) Rp. 500.000 –
Rp. 999.999 Hasil dari penelitian ini, sistem melakukan
Rendah perhitungan dengan menggunakan Naive Bayes dan
c) Rp. 1.000.000 –
4
Pendapatan Polyno
Rp. 1.499.999
menghasilkan nilai confidence pada setiap variabel Y
per Bulan mial untuk setiap variabel. Masyarakat penerima Kartu
Sedang
d) Rp. 1.500.000 – Indonesia Sehat dikeluarkan oleh sistem berdasarkan
Rp. 1.999.999
Tinggi nilai terbesar. Apabila diberikan sebuah masukan data
e) Lebih dari Rp. uji baru seperti pada tabel 3, maka perhitungan dapat
2.000.000
Sangat Tinggi dijabarkan sebagai berikut:
Tanggunga Polyno 1) Menghitung probabilitas kelas (Y)
5
n Anak mial
0, 1, 2, 3, 4, 5, > 5
5
𝑃 (𝑌 = 𝑌 ) = = 0.5
6 Terima KIS Label YA, TIDAK 10
5
𝑃(𝑌 = 𝑇𝐼𝐷𝐴𝐾 ) = = 0.5
10
2.4 Pengolahan Data
2) Menghitung probabilitas Xi dimana i = 1,2,3,4,5
Pengolahan data merupakan tahapan yang harus
terhadap variabel Y
dilewati setelah data berhasil diperoleh. Pada tahap ini 3
dilakukan Pembersihan Data atau Data Cleansing. 𝑃(𝑈𝑆𝐼𝐴 = 𝐴3 | 𝑌 = 𝑌𝐴) = = 0.6
5
Pembersihan Data atau Data Cleansing merupakan 1
suatu proses yang harus dilakukan untuk 𝑃(𝑈𝑆𝐼𝐴 = 𝐴3 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) = = 0.2
5
menghilangkan noise dari data-data yang telah diambil 1
𝑃(𝑃𝐸𝑁𝐷𝐼𝐷𝐼𝐾𝐴𝑁 𝑇𝐸𝑅𝐴𝐾𝐻𝐼𝑅 = 𝑆𝐿𝑇𝐴 | 𝑌 = 𝑌𝐴) =
sebelumnya. Data Cleansing digunakan untuk 5
menyeragamkan data-data kedalam bentuk format = 0.2
yang sama sehingga dapat menghasilkan hasil mining 𝑃(𝑃𝐸𝑁𝐷𝐼𝐷𝐼𝐾𝐴𝑁 𝑇𝐸𝑅𝐴𝐾𝐻𝐼𝑅 = 𝑆𝐿𝑇𝐴 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾)
1
yang akurat. Setelah selesai Data Cleansing, dilakukan = = 0.2
5
perhitungan dari data yang telah penulis peroleh. 𝑃(𝑃𝐸𝐾𝐸𝑅𝐽𝐴𝐴𝑁 = 𝐾𝐴𝑅𝑌𝐴𝑊𝐴𝑁 𝑆𝑊𝐴𝑆𝑇𝐴 | 𝑌 = 𝑌𝐴)
Tabel 2 merupakan potongan dari data pelatihan yang 2
digunakan dalam penelitian ini dan data tabel 3 adalah = = 0.4
5
sampel data uji. 𝑃(𝑃𝐸𝐾𝐸𝑅𝐽𝐴𝐴𝑁 = 𝐾𝐴𝑅𝑌𝐴𝑊𝐴𝑁 𝑆𝑊𝐴𝑆𝑇𝐴 | 𝑌
1
= 𝑇𝐼𝐷𝐴𝐾) = = 0.2
Tabel 2. Data Pelatihan 5
1
𝑃(𝑃𝐸𝑁𝐷𝐴𝑃𝐴𝑇𝐴𝑁 = 𝐶𝑈𝐾𝑈𝑃 | 𝑌 = 𝑌𝐴) = = 0.2
PENDIDIKA 5
USI
N PEKERJAAN
PENDAPATA T TERIM
1
A
TERAKHIR
N A A KIS?
𝑃(𝑃𝐸𝑁𝐷𝐴𝑃𝐴𝑇𝐴𝑁 = 𝐶𝑈𝐾𝑈𝑃 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) =
5
58 TAMAT SD
KARYAWAN
SWASTA
RENDAH 0 YA = 0.2
3
𝑃(𝑇𝐴𝑁𝐺𝐺𝑈𝑁𝐺𝐴𝑁 𝐴𝑁𝐴𝐾 = 2 | 𝑌 = 𝑌𝐴) = = 0.6
63 SLTA PENSIUNAN TINGGI 1 TIDAK 5
1
𝑃(𝑇𝐴𝑁𝐺𝐺𝑈𝑁𝐺𝐴𝑁 𝐴𝑁𝐴𝐾 = 2 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) =
5 Sedangkan Recall merupakan model perhitungan
= 0.2 untuk mencari hasil proporsi kasus positif yang
diidentifikasi dengan benar. Rumus untuk perhitungan
3) Menghitung probabilitas akhir nilai recall seperti pada persamaan 4 berikut:
𝑃(𝐾𝐿𝐴𝑆𝐼𝐹𝐼𝐾𝐴𝑆𝐼 = 𝑌𝐴)
= 𝑃(𝑋 | 𝑌 = 𝑌𝐴) . 𝑃(𝑌 = 𝑌𝐴) 𝑇𝑃
3 1 2 1 3 5 𝑅𝑒𝑐𝑎𝑙𝑙 = (4)
𝑇𝑃+𝐹𝑁
= x x x x x
5 5 5 5 5 10 Keterangan:
= 0.00288 TP : True Positive FP : False Positive
𝑃(𝐾𝐿𝐴𝑆𝐼𝐹𝐼𝐾𝐴𝑆𝐼 = 𝑇𝐼𝐷𝐴𝐾) TN : True Negative FN : False Negative
= 𝑃(𝑋 | 𝑌 = 𝑇𝐼𝐷𝐴𝐾) . 𝑃(𝑌
= 𝑇𝐼𝐷𝐴𝐾)
1 1 1 1 1 5 2.8 Kesimpulan
= x x x x x Pada tahap kesimpulan ini, penulis menyimpulkan
5 5 5 5 5 10
= 0.00016 bahwa sudahkah tujuan yang diharapkan telah tercapai
dalam implementasi sistemnya.
Dari perhitungan diatas, terlihat bahwa nilai
probabilitas terbesar adalah pada 3 HASIL DAN PEMBAHASAN
P(KLASIFIKASI=YA). Maka dapat disimpulkan Penelitian ini berhasil mengumpulkan 2 jenis data
bahwa data yang telah dimasukkan sebagai uji coba diantaranya data pelatihan dan data uji dengan
adalah masyarakat penerima Kartu Indonesia variabel: Usia, Pendidikan Terakhir, Pekerjaan,
SehatDari perhitungan diatas, terlihat bahwa nilai Pendapatan per Bulan serta Tanggungan Anak.
probabilitas terbesar adalah pada Penelitian ini menghasilkan suatu sistem yang dapat
P(KLASIFIKASI=YA). Maka dapat disimpulkan melakukan perhitungan dengan menggunakan
bahwa data yang telah dimasukkan sebagai uji coba algoritma Naive Bayes dan menghasilkan nilai
adalah masyarakat penerima Kartu Indonesia Sehat. confidence pada setiap variabel Y untuk setiap
variabel Masyarakat penerima Kartu Indonesia Sehat.
2.5 Pembuatan Aplikasi Sistem tersebut nantinya dapat mengklasifikasikan
Aplikasi yang dirancang oleh penulis berbasis website. masyarakat penerima Kartu Indonesia Sehat
Bahasa Pemrograman yang digunakan dalam berdasarkan nilai peluang terbesar.
pembuatan aplikasi adalah PHP dan Sublime Text 3.1 Tampilan Aplikasi
sebagai editornya. sedangkan MYSQL digunakan 3.1.1 Halaman Utama
untuk membangun database dari aplikasi. Tampilan halaman utama merupakan tampilan awal
ketika user pertama kali membuka sistem. Pada
2.6 Pengujian halaman awal terdapat penjelasan singkat mengenai
Pada tahap ini, aplikasi yang telah dibuat dilakukan sistem dan menu untuk login. Menu login digunakan
pengujian accuracy, precision dan recall. Pengujian oleh admin untuk dapat masuk kedalam sistem dengan
ini dilakukan untuk mengetahui tingkat accuracy, memasukkan Username dan Password yang telah
precision dan recall terhadap output yang dihasilkan terdaftar.
oleh aplikasi. 3.1.2 Halaman Beranda
Setelah admin masuk ke dalam sistem, terdapat
2.7 Analisa Hasil beberapa menu dalam sistem, diantaranya seperti
Pada Analisa hasil ini dilakukan perhitungan tingkat menu Data Total, Data Training, Data Testing, Data
accuracy, precision dan recall untuk menguji tingkat Prediksi, Analisa Hasil, Ubah Password dan Logout.
accuracy aplikasi yang telah dibangun. Accuracy 3.1.3 Halaman Ubah Password
adalah perhitungan untuk mendapatkan hasil dari Menu Ubah Password merupakan menu untuk
proporsi jumlah prediksi yang benar [10]. Rumus mengganti password user.
untuk perhitungan nilai accuracy seperti pada 3.1.4 Halaman Data Total
persamaan 2 berikut: Menu Data Total merupakan menu yang berisi
keseluruhan data yang diambil dari sumber data.
𝑇𝑃+𝑇𝑁 Didalam menu Data Total terdapat fitur import untuk
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = (2)
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 memasukkan data dalam jumlah besar sekaligus.
Selain itu, fitur pencarian juga tersedia dalam menu ini
untuk memudahkan dalam pencarian data yang lebih
Kemudian Precision adalah perhitungan untuk spesifik. Gambar 3 merupakan tampilan dari Data
mencari hasil proporsi kasus dengan hasil diagnosa Total.
positif. Rumus untuk perhitungan nilai precision
seperti pada persamaan 3 berikut:
𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃+𝐹𝑃 (3)
pencarian data secara spesifik, lihat hasil perhitungan, Puskesmas Kokop Kecamatan Kokop Kabupaten
ubah password hingga cetak hasil perhitungan tersedia Bangkalan," Ilmu Administrasi Negara, vol. 4,
dalam sistem untuk memudahkan seorang admin no. 1, 2016.
dalam mengolah data. [3] D. M. Agustina, "Analisis Perbandingan
Pada pengujian black box terlihat fungsionalitas Algoritma ID3 Dan C4.5 Untuk Klasifikasi
sistem dapat berjalan dengan baik, begitu juga dengan Penerima Hibah Pemasangan Air Minum Pada
hasil perhitungan yang dilakukan secara manual PDAM Kabupaten Kendal," Journal of Applied
dengan hasil perhitungan oleh sistem menghasilkan Intelligent System, vol. 1, no. 3, pp. 234-244,
hasil yang sama sehingga sistem tersebut dapat 2016.
dipertanggungjawabkan kebenaran hasilnya. Selain itu,
pengujian tingkat accuracy, precision dan recall yang [4] Y. I. Kurniawan, H. Nugroho and H. N. Prasetyo,
dilakukan sebanyak 13 kali percobaan menghasilkan "Sistem Pendukung Keputusan untuk Pemberian
rata-rata nilai accuracy sebesar 94.78%, precision Beasiswa dengan Metode Simple Additive
98.86% dan recall 90.98%. Tingkat accuracy yang Weighting Studi Kasus: Politeknik Telkom," in
telah dilakukan sebanyak 13 kali percobaan cenderung Konferensi Nasional ICT-M Politeknik Telkom
meningkat karena dengan adanya data pelatihan yang (KNIP), Bandung, 2012.
banyak tentu akan mengdapatkan hasil yang akurat. [5] Mulyadi, "Penerapan Algoritma Naive Bayes
Selain itu tingkat precision juga terlihat meningkat Untuk Klasifikasi Penerima Beasiswa Prestasi,"
karena semakin banyak data pelatihan semakin tinggi Jurnal Sistem Informasi Stmik Antar Bangsa, vol.
pula tingkat ketepatan antara data pelatihan dan data 5, no. 2, pp. 139-145, 2016.
testing yang diujikan. Begitu juga tingkat recall [6] K. Zaman, "Penerapan Data Mining
diperoleh hasil yang tidak stabil diakibatkan tingkat Menggunakan Algoritma C4.5 Untuk
keberhasilan sistem dalam menemukan kembali Menentukan Kelayakan Penerima Bantuan
sebuah informasi. Rehabilitas Sosial Rumah Tidak Layak Huni
(Studi Kasus Di Pemerintahan Kabupaten Solok
4 KESIMPULAN Selatan)," UPI YPTK Jurnal KomTekInfo, vol. 3,
Berdasarkan hasil penelitian, beberapa kesimpulan no. 2, pp. 12-24, 2016.
yang dapat diambil yaitu: [7] Setyawan, "Klasifikasi Prestasi Akademik
1. Aplikasi Klasifikasi ini dapat membantu seorang Mahasiswa FKI UMS Menggunakan Metode
admin dalam menentukan klasifikasi masyarakat Decision Tree," 2014.
penerima atau bukan penerima Kartu Indonesia
Sehat [8] H. Deng, Y. Sun, Y. Chang and J. Han,
2. Hasil klasifikasi Penerima Kartu Indonesia Sehat "Probabilistic Models for Classification," in Data
dapat dilihat berdasarkan confidence tertinggi Classification: Algorithms and Applications, 1
yang dihasilkan dari perhitungan setiap variabel ed., Minnesota, Chapman and Hall/CRC, 2014, p.
yang telah ditentukan. 67.
3. Berdasarkan pengujian data testing sebanyak 13 [9] D. Dahri, F. Agus and D. M. Khairina, "Metode
kali percobaan menghasilkan rata-rata nilai Naive Bayes Untuk Penentuan Penerima
accuracy sebesar 94.78%, precision 98.86% dan Beasiswa Bidikmisi Universitas Mulawarman,"
recall 90.98%. Jurnal Informatika Mulawarman, vol. 11, no. 2,
pp. 29-36, 2016.
5. DAFTAR PUSTAKA [10] T. Vafeiadis, K. Diamantaras, G. Sarigiannidis
[1] Q. Sabrina, "Pelaksanaan Program Jaminan and K. Chatzisavvas, "A Comparison of Machine
Kesehatan Nasional (JKN) Dalam Peningkatan Learning Techniques for Customer," Simulation
Kualitas Pelayanan Kesehatan Di RSU Haji Modelling Practice and Theory, vol. 55, pp. 1-9,
Surabaya," Kebijakan dan Manajemen Publik, 2015.
vol. 3, no. 2, pp. 54-62, 2015.
[2] U. Hasanah, "Implementasi Program Jaminan
Kesehatan Nasional Pemberian Bantuan Iuran Di
Abstract
Bank is one of which are engaged in financial services, which one of services is giving credit cards to
customers with certain conditions that had been determined by the bank. Problems arising from the
provision of credit cards to bank customers is difficulty analyst credit cards in determining the
appropriate credit card to the customers. This research is conducted in order to help analyst credit cards
in classifying customers to get a credit card that right. Implementation of naive bayes method in this
research to classify prospective credit card customers to get the best and best results by utilizing
customer data of BNI Syariah Bank Surabaya. The naive bayes method is used to find the pattern of
customers who have been accepted in credit card application with the variables obtained from factors
used are sex, home status, status, the number of dependents, profession, and income every year. The
results of this research shows that an average of the value of precision of 100%, the value of recall of
95%, and the value of accuracy of 98,67%. Thus, this application is effective to help analyst credit cards
in classifying customers to get credit card proper, that would give a credit card best appropriate criteria.
Keywords: application, data mining, classification, naive bayes, the determination of a credit card
pendukungnya. Faktor yang digunakan adalah jenis X4 : Jumlah Polynomial 0, 0 < anak ≤ 2, dan
kelamin, status rumah, status, jumlah tanggungan, Tanggungan anak > 2.
X5 : Profesi Polynomial PNS, BUMN, dan
profesi, dan penghasilan per tahunnya. Tujuan SWASTA.
penelitian ini adalah untuk menghasilkan sebuah X6 : Polynomial Rendah, Sedang, Tinggi
aplikasi berbasis web yang dapat membantu pihak Penghasilan dan Sangat Tinggi.
analis kartu kredit dalam mengklasifikasikan nasabah per tahun
Y : Kartu Polynomial Tidak diterima, Classic,
untuk mendapatkan kartu kredit yang tepat, sehingga Kredit Gold, dan Platinum.
dapat memberikan kartu kredit yang terbaik yang 2.4 Desain
sesuai kriteria. Desain bertujuan untuk menggambarkan bagaimana
proses dari sebuah aplikasi yang dibuat secara
2. METODOLOGI keseluruhan menggunakan metode naive bayes. Pada
Metodologi yang digunakan pada penelitian ini, dapat gambar 2 dibawah ini, adalah use case dari aplikasi.
digambarkan sebagai berikut:
peluang di masa depan berdasarkan pengalaman di P(H|X) : Probabilitas hipotesis H berdasar kondisi X
masa sebelumnya. (posteori probabilitas)
Metode naive bayes dari teorema Bayes adalah: P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H).P(H)
P(H|X) = ............................................ (1) P(X|H) : Probabilitas X berdasarkan kondisi pada
P(X) hipotesis H
Dimana: P(X) : Probabilitas X
X : Data dengan class yang belum diketahui Berdasarkan rumus metode naive bayes diatas,
H : Hipotesis data merupakan suatu class berikut ini merupakan contoh perhitungan klasifikasi
spesifik dari 10 data acak yang diambil dari data training yang
ada sebagai berikut:
6 Pria Milik sendiri Kawin Anak > 2 SWASTA Sedang Tidak diterima
7 Wanita Milik sendiri Kawin 0 PNS Tinggi Gold
P(Wanita | Platinum) * P(Milik Sendiri | Platinum) * metode naive bayes, serta menghitung presentase
P(Belum Kawin | Platinum) * P(0 | Platinum) * kesalahan dari aplikasi.
P(BUMN | Platinum) * P(Tinggi | Platinum) * 2.8 Kesimpulan
P(Platinum) Pada tahap kesimpulan, diberikan simpulan hasil
1 1 0 1 0 0 2
= 2 × 2 × 2 × 2 × 2 × 2 × 10 = 0 semua proses yang dibuat hingga menjadi sebuah
aplikasi yang bermanfaat dalam penelitian tugas akhir
ini.
P(Wanita | Tidak diterima) * P(Milik Sendiri | Tidak
diterima) * P(Belum Kawin | Tidak diterima) * P(0 |
3. HASIL DAN PEMBAHASAN
Tidak diterima) * P(BUMN | Tidak diterima) *
3.1 Implementasi Aplikasi
P(Tinggi | Tidak diterima) * P(Tidak diterima)
1 1 0 1 1 1 3 Implementasi aplikasi merupakan sebuah tahap
= 3 × 3 × 3 × 3 × 3 × 3 × 10 = 0 sebagai wujud realisasi dari sebuah rancangan aplikasi
yang dibuat, untuk mengetahui hasil dari rancangan
3. Bandingkan hasil HMAP dari class Classic, Gold, yang telah dibuat. Hasil dari penenelitian ini adalah
Platinum, dan Tidak diterima sebuah aplikasi klasifikasi penentuan pengajuan kartu
Dari hasil perhitungan di atas, terlihat bawah nilai kredit menggunakan metode naive bayes di Bank BNI
probabilitas tertinggi ada pada kelas (P|Gold). Dapat Syariah Surabaya.
disimpulkan bahwa nasabah tersebut dapat Aplikasi tersebut terdapat beberapa menu yaitu
diklasifikasikan mendapat kartu kredit Gold. Home, menu Data Training, menu Data Testing, dan
menu Pengujian yang hanya dapat diakses oleh pihak
2.6 Pengujian analis kartu kredit saja sebagai administrator dalam
Tahap pengujian ini bertujuan untuk mengetahui aplikasi. Aplikasi ini, dapat diakses apabila admin
aplikasi yang telah selesai dibuat sesuai dengan desain sudah melakukan login terlebih dahulu.
yang direncanakan, menguji fungsi-fungsi yang ada 3.1.1 Halaman Utama
sesuai bagaimana semestinya, serta membandingkan Halaman utama dari aplikasi ini adalah halaman form
hasil perhitungan manual dengan hasil perhitungan login. Dimana untuk masuk ke dalam aplikasi, admin
menggunakan aplikasi untuk menghitung nilai diharuskan memasukkan username dan password
precision, recall, dan accuracy. Menurut Han, terlebih dahulu sesuai data yang dimasukkan ke dalam
Kamber dan Pei (2012) perhitungan akurasi database.
menggunakan tabel confusion matrix: 3.1.2 Halaman Home
Tabel 2.4 Panduan Menghitung Precision, Recall, Halaman home akan muncul apabila admin sudah
dan Accuracy berhasil login. Halaman ini menjelaskan secara
Kelas Prediksi singkat tentang aplikasi, dan terdiri dari beberapa
Kelas menu lain seperti menu Data Training, Data Testing,
Sebenarnya 1 0 Pengujian, Prediksi, dan Logout admin yang memiliki
TP (True FN (False fungsi berbeda-beda pada setiap menunya.
1 3.1.3 Halaman Data Training
Positive) Negative)
FP (False TN (True Menu data training berfungsi untuk menampilkan
0 daftar data training nasabah yang telah diinputkan.
Positive) Negative)
Pada halaman data training, terdapat tombol tambah
Nilai precission, recall, dan accuracy maka dapat
data untuk menambahkan data nasabah secara satu-
dihitung dengan rumus sebagai berikut:
𝑇𝑃 persatu maupun dengan cara import file excel. Data
Precission = 𝐹𝑃+𝑇𝑃 ......................................... (2) training yang telah di diinputkan, dapat di edit dan
𝑇𝑃
Recall = 𝑇𝑃+𝑇𝑁 ........................................ (3) dihapus apabila admin kurang teliti atau salah saat
𝑇𝑃+𝑇𝑁 memasukkan data training. Berikut ini pada Gambar
Accuracy = 𝑇𝑃+𝐹𝑁+𝐹𝑃+𝑇𝑁 ............................. (4) 3.1 merupakan halaman data training.
Dalam hal ini dapat dijelaskan bahwa :
TP = jumlah dari data yang terklasifikasi di kelas
yang benar.
TN = jumlah dari data yang terklasifikasi di kelas
sebaliknya yang benar.
FP = jumlah data yang dianggap berada di kelas
yang benar oleh sistem padahal seharusnya data
tersebut berada di kelas yang sebaliknya.
FN = jumlah data yang dianggap berada di kelas
yang sebaliknya oleh sistem padahal seharusnya data
Gambar 3.1 Halaman data training
tersebut berada di kelas yang benar. 3.1.4 Halaman Data Testing
2.7 Analisa Hasil Menu data testing berfungsi untuk menampilkan
Analisa hasil dilakukan dengan membandingkan hasil daftar data testing yang telah diinputkan. Pada
perhitungan manual dengan hasil perhitungan halaman data training, terdapat tombol tambah data
menggunakan aplikasi yang telah dibuat menggunakan
untuk menambahkan data nasabah baru secara satu- Gambar 3.3 Halaman pengujian
persatu maupun dengan cara import file excel. Data 3.1.6 Halaman Prediksi
testing yang telah diinputkan dapat di edit dan dihapus Menu prediksi merupakan halaman pengisian form
apabila admin kurang teliti atau salah saat calon nasabah untuk mengklasifikasikan kartu kredit
memasukkan data testing. yang akan diterima, berdasarkan hasil perhitungan
Pada Gambar 3.2 di bawah ini, merupakan tampilan sistem dari satu data yang diinputkan oleh admin.
halaman data testing. Calon nasabah kartu kredit akan diklasifikasikan ke
dalam kartu kredit Classic, Gold, Platinum atau Tidak
diterima yang disertai dengan perhitungan dari hasil
prediksi. Halaman prediksi dapat dilihat pada Gambar
3.4.
kemudian membandingkan hasil yang didapatkan dari oleh sistem padahal seharusnya sebaliknya adalah 0,
perhitungan manual dengan menggunakan sistem. maka nilai precision dapat mencapai 100%.
Dari hasil perbandingan tersebut, didapatkan hasil Sedangkan recall tidak mencapai 100% karena nilai
bahwa klasifikasi yang dilakukan oleh sistem dan true negative (TN) saat menghitung recall lebih dari 0,
perhitungan manual adalah sama. Hal ini maka hal itu menyebabkan nilai recall tidak mencapai
membuktikan bahwa aplikasi yang dibangun telah 100%. Jika nilai accuracy tidak dapat mencapai 100%,
menerapkan algoritma naive bayes dengan benar. karena nilai accuracy dihasilkan dari kedekatan antara
3.2.3 Pengujian Precision, Recall, dan Accuracy nilai precision dan recall.
Tabel 3.2 di bawah ini merupakan hasil perhitungan
precision, recall, dan accuracy yang didapatkan dari 4. KESIMPULAN DAN SARAN
aplikasi dengan beberapa data uji: 4.1 Kesimpulan
Tabel 3.2 Hasil Precision, Recall, dan Accuracy Berdasarkan hasil penelitian dapat disimpulkan
Jumlah Jumlah bahwa:
Data Data Precision Recall Accuracy
Training Testing 1. Metode naive bayes dapat digunakan untuk
50 240 97,33 % 87,67 % 94,67 %
membantu klasifikasi penentuan pengajuan kartu
kredit
100 190 98 % 90,67 % 96,33 % 2. Berdasarkan pengujian 3 kali pada setiap jumlah
data training maupun testingnya, didapatkan nilai
150 140 98,67 % 91,67 % 96,67 %
rata-rata maksimal dari nilai precision sebesar
200 90 100 % 91,67 % 97,33 % 100%, nilai recall sebesar 95%, dan nilai accuracy
sebesar 98,67%.
250 40 100 % 95 % 98,67 % 3. Semakin banyak data training yang digunakan
3.3 Analisa Hasil maka nilai precision, recall, dan accuracy juga
Aplikasi klasifikasi penentuan pengajuan kartu kredit semakin meningkat.
menggunakan metode naive bayes yang dibangun 4.2 Saran
memiliki satu administrator (analis kartu kredit) Untuk memperoleh hasil yang lebih baik lagi, maka
sebagai aktor dalam aplikasi. Admin di dalam aplikasi diperlukan saran dari berbagai pihak. Adapun saran
ini, memiliki seluruh hak akses yang ada di dalam yang dapat dijadikan pertimbangan untuk penelitian
aplikasi yaitu mengelola (input, update, delete) data berikutnya yaitu:
training, mengelola data testing, melakukan 1. Bagi pengembang berikutnya, disarankan agar
pengujian, dan melakukan prediksi. Pengujian pada menggunakan metode yang berbeda. Serta
aplikasi ini dilakukan dengan 3 cara, yaitu dengan membandingkannya dengan aplikasi yang
pengujian blackbox, pengujian algoritma naive bayes sebelumnya, untuk mengetahui metode manakah
dan pengujian precision, recall, dan accuracy. yang sesuai dan paling efisien dalam menangani
Pengujian blackbox bertujuan untuk mengetahui kasus klasifikasi penentuan pengajuan kartu kredit.
seluruh fitur dapat berjalan sesuai yang diharapkan,
pengujian algoritma naive bayes berfungsi untuk 5. DAFTAR PUSTAKA
membuktikan bahwa aplikasi yang dibangun telah Bustami. (2014). Penerapan Algoritma Naive Bayes
menerapkan algoritma naive bayes dengan benar, dan Untuk Mengklasifikasi Data Nasabah Asuransi.
pengujian precision, recall, dan accuracy untuk Jurnal Informatika, 8, 884-898.
mengetahui hasil nilai precision, recall dan accuracy Deepa, S., & Vijayarani, S. (2014). Naive Bayes
berdasarkan hasil data training dan data testing testing Classification for Predicting Disease in
yang dimasukkan dengan jumlah yang berbeda-beda. Haemoglobin Protein Sequences. International
Sedangkan prediksi, dapat dilakukan dengan Journal of Computational Intelligence and
memasukkan data nama, jenis kelamin, status rumah, Informatics, 3, 278-283.
status, jumlah tanggungan, profesi, dan penghasilan Han, J., & Kamber, M., &Pei, J. (2012). Data Mining
per-tahun. Concepts & Techiques (3nd Ed.). Waltham:
Analisa hasil aplikasi dari pengujian precision, Elsevier.
recall, dan accuracy didapatkan hasil bahwa semakin Khairina, Dyna. M., Dahri, Diasrina., & Agus, Fahrul.
banyaknya data training yang digunakan di dalam (2016). Metode Naive Bayes Untuk Penentuan
aplikasi, maka nilai precision, recall, dan accuracy Penerima Beasiswa Bidikmisi Universitas
yang diperoleh juga semakin meningkat. Hal ini telah Mulawarman. Jurnal Informatika Mulawarman,
dibuktikan berdasarkan pengujian 3 kali pada setiap 11, 29-36.
jumlah data training maupun testingnya pada Kurniawan, D., & A. Kriestanto, D. (2016). Penerapan
pengujian precision, recall, dan accuracy, yang Naive Bayes Untuk Prediksi Kelayakan Kredit.
didapatkan nilai rata-rata maksimal dari nilai precision Jurnal Informatika dan Komputer (JIKO), 1, 19-
sebesar 100%, nilai recall sebesar 95%, dan nilai 23.
accuracy sebesar 98,67%. Nilai precision mencapai Kurniawan, Y. I., & Windiasani, P. A. (2017). Sistem
100% karena nilai false positive (FP) yang merupakan Pendukung Keputusan untuk Penentuan
jumlah data yang dianggap berada di kelas yang benar Kelolosan Beasiswa Sekolah Menengah
Abstrak
Sebagai lembaga keuangan selain bank konvensional, koperasi mempuyai peran serta dalam
mengatasi perekonomian masyarakat didaerah-daerah. Kegiatan tersebut juga dilakukan oleh
Koperasi Simpan Pinjam Pembiayaan Syariah Baitul Maal wa Tamwil (KSPPS BMT) “Arta Jiwa
Mandiri” Wonogiri yang bergerak dalam bidang usaha kredit simpan pinjam dan pembiayaan yang
berlandaskan syariah. Pada proses bidang usaha kredit simpan pinjam koperasi memiliki ketentuan
dalam memilih calon anggota yang layak untuk mendapatkan modal. Hal tersebut bertujuan untuk
mengatasi adanya permasalahan seperti anggota macet dalam pembayaran cicilan. Sehingga hal
tersebut perlu adanya suatu aplikasi yang dapat meprediksi calon anggota kredit yang layak untuk
mendapatkan pinjaman dari pihak koperasi dengan teknik data mining. Algoritma Naïve Bayes
dimanfaatkan dalam kasus ini untuk memprediksi kelayakan calon anggota kredit simpan pinjam
yang nantinya termasuk kategori lancar, kurang lancar atau macet waktu peminjaman. Hasil
penelitian ini mendapatkan nilai Accuracy sebesar 75%, nilai Precision sebesar 84% dan nilai Recall
sebesar 86%. Maka dari itu aplikasi ini dapat membantu pihak koperasi dalam mempertimbangkan
calon anggota kredit yang layak untuk mendapatkan modal.
Kata Kunci: data mining, naïve bayes, simpan pinjam, koperasi.
Umur Polinomial 19 – 24 X2
25 – 30
31 – 36
37 – 42
43 – 48
49 – 54
55 – 60
Jenis Pekerjaan Polinomial Wiraswasta, Swasta, Ibu rumah tangga, dan PNS X3
13.000.000 – 14.999.999
15.000.000 – 19.999.999
20.0000.0000 – 24.999.999
25.000.000 – 29.999.999
30.000.000 – 49.000.000
50.000.000 – 79.999.999
80.000.000 – 109.000.000
110.000.000 – 139.999.999
140.000.000 – 169.999.999
170.000.000 – 200.000.000
P (Y = Kurang Lancar) = 1/10 = 0,1 Kesimpulan hasil yang diperoleh dari perhitungan
P (Y = Macet) = 2/10 = 0,1 menunjukan bahwa masukan pada tabel 3 menghasilkan
(P = Lancar) dengan hasil probabilitas tertinggi.
Mencari nilai probabilitas pada tiap atribut
P (Jenis Kelamin = P | Y = Lancar) = 3/7 = 0,428 2.5 Pengujian
P (Umur = 55-60 | Y = Lancar) = 2/7 = 0,285 Pengujian yang dilakukan pada implementasi
P (Jenis Pekerjaan = Wiraswasta | Y = Lancar) = 3/7 = aplikasi dengan memperhitungkan tingkat precision,
0,428 recall, dan accuracy [10]. Maka dijelaskan seperti
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Lancar) persamaan (2), (3) dan 4 sebagai berikut:
= 1/7 = 0,142
P (Jangka waktu pengembalian = Menengah | Y = Lancar) Pengujian precision digunakan dalam mencari
= 5/7 = 0,714 nilai proporsi kasus positif yang benar, rumus persamaan
P (Jaminan = Sertivikat | Y = Lancar) = 3/7 = 0,428 (2).
P (Penghasilan = <5 Juta | Y = Lancar) = 6/7 = 0,857
P (Jenis Kelamin = L | Y = Kurang Lancar) = 1/1 = 1
P (Umur = 55-60 | Y = Kurang Lancar) = 0/1 = 0 (2)
P (Jenis Pekerjaan = Wiraswasta | Y = Kurang Lancar) = Pengujian recall digunakan dalam mencari nilai
0/1 = 0 proporsi kasus positif yang teridentifukasi benar, rumus
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Kurang persamaan (3).
Lancar) = 0/1 = 0
P (Jangka waktu pengembalian = Menengah | Y = Kurang
Lancar) = 1/1 = 1
P (Jaminan = Sertivikat | Y = Kurang Lancar) = 1/1 = 1 (3)
P (Penghasilan = <5 Juta | Y = Kurang Lancar) = 1/1 = 1
P (Jenis Kelamin = L | Y = Macet) = 3/2 = 1,5 Pengujian accuracy digunakan dalam mencari nilai
P (Umur = 55-60 | Y = Macet) = 0/2 = 0 proporsi jumlah yang benar, rumus persamaan (4).
P (Jenis Pekerjaan = Wiraswasta | Y = Macet) = 0/2 = 0
P (Jenis Pinjaman = 20000000 - 29999999 | Y = Macet) =
0/2 = 0 (4)
P (Jangka waktu pengembalian = Menengah | Y = Macet)
= 2/2 = 1 Keterangan:
P (Jaminan = Sertivikat | Y = Macet) = 0/2 = 0 TP : True Positive
P (Penghasilan = <5 Juta | Y = Macet) = 2/2 = 1 TN : True Negative
FP : False Positive
Menghitung hasil dari atribut lancar, kurang lancar, dan FN : False Negative
macet
P (Kategori = Lancar) * P (Y = Lancar) = 0,00135 HASIL DAN PEMBAHASAN
P (Kategori= Kurang Lancar) * P (Y = Kurang Lancar ) = 3.1 Hasil Implementasi
0 Tahap ini merupakan tahap dimana aplikasi yang dibuat
P (Kategori = Macet) * P (Y = Macet) = 0 telah selesai dibuat, untuk menjalankan aplikasi ini
menggunakan server local di komputer untuk mengetahui
hasilnya.
3.1.1 Halaman login training. Pada form ini data harus diisi semua dan jika ada
Saat membuka aplikasi prediksi kelayakan calon anggota data tidak terisi maka data tidak akan bisa disimpan.
kredit maka pengguna wajib memasukkan username dan
password bertujuan untuk masuk dalam aplikasi, maka
tampilan awal seperti yang dilihat pada gambar 3.
maka halaman lihat prediksi akan dapat diketahui hasil 3.1.8 Halaman lihat performance
prediksinya seperti gambar 7. Pada halaman tersebut Halaman lihat performance yang muncul setelah
setiap data terdapat fitur detail yang berfungsi untuk pengguna memilih fitur lihat prediksi. Pada halaman ini
melihat urutan perhitungan sesuai dengan algoritma Naïve yaitu menampilkan hasil accuracy, precision dan recall
Bayes seperti gambar 8. dari keseluruhan data yang ada pada data testing.
Pengguna dapat langsung melihat jumlah True Positive
(TP), False Positive (FP), False Negative (FN), True
Negative (TN), False Negative (FN) yang ada pada data
testing.
2015.
[9] Bustami, “Penerapan Algoritma Naive Bayes,” J.
Inform., vol. 8, no. 1, pp. 884–898, 2014.
[10] V. S and D. S, “Data Mining Classification
Algorithms for Kidney Disease Prediction,” Int.
J. Cybern. Informatics, vol. 4, no. 4, pp. 13–25,
2015.