ABSTRAK
Data mining adalah teknik yang memanfaatkan data dalam jumlah yang besar
untuk memperoleh informasi berharga yang sebelumnya tidak diketahui dan dapat
dimanfaatkan untuk pengambilan keputusan penting. Pada penelitian ini, penulis
berusaha menambang data (data mining) nasabah sebuah perusahaan asuransi
untuk mengetahui lancar, kurang lancar atau tidak lancarnya nasabah tersebut. Data
yang ada dianalisis menggunakan algoritma Naive Bayes. Naive Bayes merupakan
salah satu meode pada probabilistic reasoning. Algoritma Naive Bayes bertujuan
untuk melakukan klasifikasi data pada kelas tertentu, kemudian pola tersebut dapat
digunakan untuk memperkirakan nasabah yang bergabung, sehingga perusahaan
bisa mengambil keputusan menerima atau menolak calon nasabah tersebut.
Kata Kunci : data mining, asuransi, klasifikasi, algoritma Naive Bayes
PENDAHULUAN
Premi merupakan pendapatan bagi perusahaan asuransi, yang
jumlahnya ditentukan dalam suatu persentase atau tarif tertentu dari jumlah
yang dipertanggungkan. Bagi tertanggung premi merupakan beban karena
membayar premi merupakan beban tertanggung. Pendapatan premi untuk
perusahaan asuransi ditentukan oleh jumlah premi yang dibayar oleh
nasabah.
Permasalahan yang sering timbul dalam perusahaan asuransi adalah
banyaknya nasabah yang menunggak dalam membayar premi, sehingga
diperlukan sebuah sistem yang dapat mengklasifikasikan nasabah mana
yang masuk ke dalam kelompok lancar, kelompok kurang lancar dan
128
1.
2.
3.
4.
5
b. Metode Klasifikasi
Klasifikasi adalah proses untuk menemukan model atau
fungsi yang menjelaskan atau membedakan konsep atau kelas data,
dengan tujuan untuk dapat memperkirakan kelas dari suatu objek
yang labelnya tidak diketahui. Dalam mencapai tujuan tersebut,
proses klasifikasi membentuk suatu model yang mampu
membedakan data kedalam kelas-kelas yang berbeda berdasarkan
aturan atau fungsi tertentu. Model itu sendiri bisa berupa aturan
atau formula matematis.
Input
Atribut Set (x)
Classification
Model
129
Output
Class Label (y)
Keterangan :
: Data dengan class yang belum diketahui
: Hipotesis data merupakan suatu class spesifik
: Probabilitas hipotesis
berdasar kondisi (posteriori
probability)
: Probabilitas hipotesis (prior probability)
: Probabilitas berdasarkan kondisi pada hipotesis
: Probabilitas
Untuk menjelaskan teorema Naive Bayes, perlu diketahui bahwa proses
klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa
yang cocok bagi sampel yang dianalisis tersebut. Karena itu, teorema
bayes di atas disesuaikan sebagai berikut :
130
Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai
dari posterior tersebut nantinya akan dibandingkan dengan nilai nilai
posterior kelas lainnya untuk menentukan ke kelas apa suatu sampel
akan diklasifikasikan. Penjabaran lebih lanjut rumus Bayes tersebut
dilakukan dengan menjabarkan
menggunakan aturan
perkalian sebagai berikut :
Untuk
131
, sehingga
132
Start
Baca Data
Training
Apakah Data
Numerik ?
Tidak
Ya
Jumlah dan
Probabilitas
Mean Tiap
Parameter
Tabel
Probabilitas
Standar Deviasi
tiap Parameter
Solusi
Stop
133
PERANCANGAN SISTEM
a.
Flowchart Sistem
Mulai
Data Nasabah
Input Variabel
Calon nasabah
Bandingkan hasil
tiap class
Probabilitas
P.Lancar >
P.Kurang Lancar &
P.Tidak Lancar
Tidak
Tidak
Ya
Ya
Kurang
Lancar
Lancar
TidakLancar
Selesai
b.
Diagram Konteks
Admin
Input Data
Klasifikasi data
Nasabah
Aplikasi Data
Mining dengan
Proses Naive
Bayes
Pimpinan Asuransi
Laporan
134
c.
Hak Login
Login
Admin
Data Admin
Data Nasabah
Proses
Klasifikasi
Admin
Input Variabel Calon
Nasabah
Variabel Calon
Nasabah
Data Nasabah
variabel Calon
Nasabah
Laporan Klasifikasi
Calon Nasabah
Hasil Laporan
Laporan
Laporan Data Nasabah
d.
Username
Password
Nama
ID Nasabah
Admin
Mengtraining
Data Nasabah
Mengtesting
Nama
135
Nama Field
Username
Password
Tipe Data
Lebar
Varchar
Varchar
Keterangan
10
10
Nama User
Password User
Nama Field
ID_nasabah
Nama
Tipe Data
Integer
Varchar
Lebar
5
30
Jenis Kelamin
Varchar
10
Usia
Status
Pekerjaan
Varchar
Varchar
Varchar
20
15
20
Penghasilan/tahun
Varchar
20
Masa_asuransi
Cara_pembayaran
Varchar
Varchar
20
15
Persentasi_kelancaran
Integer
Klasifikasi
Nilai
Varchar
Integer
20
4
Keterangan
No Id nasabah
Nama nasabah
Jenis
Kelamin
Nasabah
Usia nasabah
Status nasabah
Pekerjaan nasabah
Penghasilan
nasabah
Masa asuransi
Cara pembayaran
Persentasi
kelancaran
Klasifikasi
Nilai Data
136
Nama Field
Tipe Data
Lebar
Keterangan
ID
Integert
ID Calon Nasabah
Nama
Varchar
30
Nama
nasabah
Jenis Kelamin
Usia
Varchar
10
Kriteria
Varchar
20
Kriteria
Status
Varchar
15
Kriteria
Pekerjaan
Varchar
20
Kriteria
Penghasilan/tahun
Varchar
20
Kriteria
Masa_asuransi
Varchar
20
Kriteria
Cara_pembayaran
Varchar
15
Kriteria
Klasifikasi
Varchar
20
Kriteria
Calon
137
Tahap awal cara kerja dari proses perhitungan Naive Bayes adalah
dengan melakukan pengambilan data training dari data nasabah asuransi.
Adapun variabel penentu yang digunakan dalam mengklasifikasikan data
nasabah yaitu :
1. Jenis Kelamin
Merupakan variabel jenis kelamin nasabah yang dikelompokkan
dalam dua kategori yaitu laki laki dan perempuan.
2. Usia
Merupakan variabel usia nasabah yang di kelompokkan dalam tiga
kategori yaitu 20 - 29 tahun, 30 - 40 tahun, dan diatas 40 tahun.
3. Status
Merupakan variabel status nasabah yang dikelompokkan dalam
dua kategori yaitu kawin dan belum kawin.
4. Pekerjaan
Merupakan variabel pekerjaan nasabah yang dikelompokkan dalam
tiga kategori yaitu PNS, Pegawai Swasta, Wiraswasta.
5. Penghasilan
Merupakan variabel penghasilan dari nasabah yang dikelompokkan
dalam tiga kategori yaitu 0 - 25 juta, 25 - 50 juta, dan diatas 50 juta.
6. Cara pembayaran premi
Merupakan variabel cara pembayaran premi yang dikelompokkan
dalam empat kategori yaitu bulanan, triwulan, semesteran, dan
tahunan.
7. Masa pembayaran premi
Merupakan variabel masa pembayaran premi yang dikelompokkan
dalam tiga kategori yaitu 5 - 10 tahun, 11 - 15 tahun, dan diatas 15
tahun.
Nama
Usia
Status
Pekerjaan
Penghasilan
Kawin
Pns
< 25 Juta
Kawin
Pns
< 25 Juta
Kawin
Pegawai
Swasta
< 25 Juta
Belum
Kawin
Pns
< 25 Juta
Kawin
Wiraswasta
< 25 Juta
Kelamin
1
Dani
Lukman
Laki-Laki
Evaliana
Perempuan
Rasyidah
Perempuan
Dina
Saufika
Perempuan
Wilsa Rizki
Laki-Laki
30 - 40
Tahun
30 - 40
Tahun
20 - 29
Tahun
30 - 40
Tahun
30 - 40
Tahun
Masa
Asuransi
>15
Tahun
5 10
Tahun
5 10
Tahun
5 10
Tahun
5 10
Tahun
Cara
Pembayaran
Klasifikasi
Tahunan
Tidak
Lancar
Semesteran
Lancar
Triwulan
Tidak
Lancar
Triwulan
Lancar
Tahunan
Kurang
Lancar
138
Irwanto
Laki-Laki
Ade
Gunawan
Laki-Laki
Fauziah
Perempuan
Zulaikha
Perempuan
10
Zulfahmi
Laki-Laki
11
Hidayatullah
Laki-Laki
12
Nilam Sari
Perempuan
13
Nahari
Arifin
Laki-Laki
14
Yusnidar
Perempuan
15
16
Rizwan
Hadi
Rahmat
Saputra
Laki-Laki
Laki-Laki
17
M. Sahril
Laki-Laki
18
M. Irfan
Laki-Laki
19
20
21
Tutri
Wulandari
Leni
Syamsiah
Syafi Arkan
Perempuan
Perempuan
Laki-Laki
30 - 40
Tahun
30- 40
Tahun
20 - 29
Tahun
20 - 29
Tahun
20 - 29
Tahun
30 - 40
Tahun
30 - 40
Tahun
30 - 40
Tahun
>40
Tahun
20 - 29
Tahun
30 -40
Tahun
>40
Tahun
30 - 40
Tahun
30 - 40
Tahun
20 - 29
Tahun
30 - 40
Tahun
Belum
Kawin
Wiraswasta
> 50 Juta
Kawin
Pns
25 - 50 Juta
Kawin
Wiraswasta
25 - 50 Juta
Kawin
Wiraswasta
< 25 Juta
Kawin
Pns
< 25 Juta
Belum
Kawin
Wiraswasta
25 - 50 Juta
Kawin
Wiraswasta
25 - 50 Juta
Kawin
Wiraswasta
> 50 Juta
Kawin
Pns
< 25 Juta
Pns
< 25 Juta
Wiraswasta
< 25 Juta
Belum
Kawin
Belum
Kawin
Kawin
Kawin
Pegawai
swasta
Pegawai
swasta
< 25 Juta
25 - 50 Juta
Kawin
Wiraswasta
< 25 Juta
Belum
Kawin
Wiraswasta
25 - 50 Juta
Kawin
wiraswasta
25 - 50 Juta
11 15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
>15
Tahun
11 15
Tahun
>15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
11 15
Tahun
5 10
Tahun
11 15
Tahun
Semesteran
Lancar
Semesteran
Tidak
Lancar
Tahunan
Lancar
Triwulan
Triwulan
Tidak
Lancar
Kurang
Lancar
Tahunan
Lancar
Tahunan
Kurang
Lancar
Triwulan
Lancar
Semesteran
Kurang
Lancar
Tahunan
Lancar
Semesteran
Lancar
Tahunan
Tahunan
Tidak
Lancar
Tidak
Lancar
Triwulan
Lancar
Bulanan
Tidak
Lancar
Semesteran
????
139
2.
3.
140
=
4.
IMPLEMENTASI SISTEM
Setelah melalui tahapan perancangan sistem, database selanjutnya
adalah implementasi sistem. Implementasi sistem merupakan bagian akhir
daripada perancangan sistem yang telah dibangun dimana tahapan ini juga
merupakan testing program.
141
a. Form Login
Form login berfungsi sebagai form keamanan, form ini merupakan
form untuk masuk ke program yang akan diakses dengan cara mengisikan
username dan password. Jika hak akses telah diberikan oleh sistem maka
user dapat mengakses menu utama aplikasi. Adapun tampilan form login
dapat dilihat pada gambar berikut :
142
143
e.
144
7. Kesimpulan
Berdasarkan hasil pembahasan maka penulis dapat mengambil
beberapa kesimpulan antara lain :
1. Sistem klasifikasi data nasabah ini digunakan untuk menampilkan
informasi klasifikasi lancar, kurang lancar atau tidak lancarnya
calon nasabah dalam membayar premi asuransi dengan
menggunakan algoritma Naive Bayes.
2.
3.
4.
145
DAFTAR PUSTAKA
Budi, Santoso, 2007, Data Mining : Teknik Pemanfaatan Data untuk Keperluan
Bisnis, Graha Ilmu, Yogyakarta
Frieyadie, 2010, Mudah Belajar Pemograman Database MySql dengan Microsoft
Visual Basic 6.0, Andi, Yogyakarta
Hermawati, Fajar Astuti, 2013, Data Mining, Andi, Yogyakarta
Jogiyanto, H.M, 2000, Analisis dan Desain Sistem Informasi, Andi, Yogyakarta
Kusumadewi, Sri, 2009, Klasifikasi Status Gizi Menggunakan Algoritma Naive
Bayes Classification, Jurusan Teknik Informatika, universitas Islam
Indonesia
Mulyanto, Agus, 2009, Sistem Informasi Konsep dan Aplikasi, Cetakan I,
Pustaka Pelajar, Yogyakarta
146
Natalius, Samuel, 2010, Metode Naive Bayes Classifier dan Penggunaannya Pada
Klasifikasi Dokumen, Program Studi Sistem dan teknologi Informasi,
Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung
Prakoso, Djoko, 1994, Asuransi Indonesia, Dahara Prize, Semarang
Rahadian, Hadi, 2004, Membuat Laporan dengan Crystal Report 8.5 dan Visual
Basic 6.0, Cetakan 2, Elex Media Komputindo, Jakarta
Rokhmah, Dewi Pyriana, 2011, Klasifikasi Data Mengggunakan Metode KNearest Neighbour dan Teorema Bayes, Program Studi Teknik
Informatika, Universitas Brawijaya Malang
Supardi, Yuniar, 2006, Microsoft Visual Basic 6.0, Elex Media Komputindo,
Jakarta
Susanto, Sani, Ph.D, Suryadi, Dedy, 2010, Pengantar Data Mining: Menggali
Pengetahuan dari Bongkahan Data, Andi, Yogyakarta
http://www.scribd.com/ doc /45017830 /Algoritma
Data - Miningdesicion-tree-naive bayes-dll di unduh, 5 Maret 2013, 10:00 Wib
http://www.scribd.com/doc /55713517/Metode - Bayes di unduh
5 Maret 2013, 10:10 Wib