BAB IV New

BAB IV
PERANCANGAN
4.1 Analisa Perancangan
Metode perancangan yang digunakan untuk aplikasi ini menggunakan
pendekatan atau metode studi kasus (case research) dan metode survei dengan
menggunakan diagram arus data (data flow diagram). Data Flow Diagram (DFD)
adalah alat pembuatan model yang memungkinkan profesional sistem untuk
menggambarkan sistem sebagai suatu jaringan proses fungsional yang
dihubungkan satu sama lain dengan alur data, baik secara manual maupun
komputerisasi. DFD ini merupakan alat perancangan sistem yang berorientasi
pada alur data dengan konsep dekomposisi dapat digunakan untuk penggambaran
analisa maupun rancangan sistem yang mudah dikomunikasikan oleh pembuat
program kepada pemakai program nanti.
4.2 Perancangan Sistem
Pada tahap ini hasil perancangan berkaitan erat dengan hasil tahap analisis
karena pada tahap analisis telah ditemukan fungsi-fungsi dan metode yang
digunakan, sehingga software dan hardware serta antarmuka yang diharapkan.
Hasil perancangan program harus sesuai dengan perancangan metode dalam
perancangan yaitu antara lain :
34
35
4.2.1 Data Flow Diagram (DFD)
a. Diagram Konteks
Diagram konteks menggambarkan kondisi sistem yang ada baik input
maupun output serta menyertakan entity yang terlibat dalam penggunaan sistem.
Diagram ini akan memberi gambaran tentang keseluruhan sistem dari aplikasi
yang bertujuan untuk membantu user menganalisa data baru yang akan dilihat
klasifikasinya menggunakan metode Naive Bayes tanpa proses pencarian Cluster
metode K-MEANS. Adapun bentuk diagram konteks dari antarmuka aplikasi
penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi TI
STMIK Nurdin Hamzah Jambi dapat dilihat pada gambar 4.1 Diagram Konteks
dibawah berikut :
Data Admin
Data Kuisioner Alumni
A.
Admin
Data Admin
0
Analisi data mining ketepatan
bidang pekerjaan alumni Prodi Data Kuisioner Alumni Baru
TI STMIK Nurdin Hamzah
Jambi
B.
User
Soal Pertanyaan Kuisioner
Gambar 4.1 Diagram Konteks

36
Penjelasan:
Pada diagram konteks di atas tampak hanya ada satu proses tunggal yang
menggambarkan keseluruhan sistem yang dimodelkan. Proses tersebut diberi
notasi angka 0 untuk menunjukkan bahwa ini adalah level paling abstrak/umum
dari sistem. Terdapat 2 kesatuan luar (external entity) pada diagram konteks ini,
yaitu Admin, dan User. Kedua entity ini dapat berperan sebagai sumber data
maupun penerima data/informasi. Selain itu terdapat 4 data flow pada diagram
konteks di atas, yang terdiri dari 2 data flow yang masuk ke proses (input data)
dan 2 data flow yang keluar dari proses (output data). Masing-masing data flow
diberi label yang menunjukkan data apa saja yang sedang mengalir.
b. Overview Diagram (Level 0)
Pada diagram Level 0 ini merupakan penjabaran dari diagram konteks
sebelumnya. Berikut ini penggambaran dari diagram level 0 (zero) dari antarmuka
Aplikasi penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi
TI STMIK Nurdin Hamzah Jambi yang dibangun :
Data User B. User Klasifikasi Naive Bayes
2.0 3.0
1.0
A. admin Data Admin Olah Data Klasifikasi
Login
Master Naive Bayes
Data Admin
D1 Kuisioner
Alumni
37
Gambar 4.2 Overview Diagram (Level 0)
4.2.2 Flowchart
Dalam analisis data mining ketepatan bidang pekerjaan alumni Prodi TI
STMIK Nurdin Hamzah Jambi, penulis menggunakan penggambaran alir program
flowchart atau diagram alir berikut yang memiliki bagan-bagan yang
melambangkan fungsi tertentu :
a. Flowchart K-Means
Pada Flowchart proses ini dimulai dengan proses mempersiapkan data
agar dapat diolah dalam metode K-Means dengan memberikan nilai tiap
atribut. Setelah itu data yang siap diproses dan telah dinormalisasikan akan
diproses hingga mendapatkan Cluster yang terbagi 3, yaitu Cluster 1 yang
termasuk dalam golongan kurang tepat, Cluster 2 yang termasuk dalam
tepat dan Cluster 3 yaitu yang memiliki ketapatan pekerjaan sangat tepat.
Sebelum mendapatkan Cluster – Cluster tersebut diperlukannya sebuah
initial Cluster Center yaitu nilai initial Cluster centre pada iterasi yang
pertama (perhitungan pertama kali) diberikan secara acak. Pada iterasi
selanjutnya, nilai initial Cluster centre (pengulangan ke-1 sampai dengan
posisi normal/maksimal iterasi) diberikan dengan menghitung nilai rata-
rata data pada setiap Clusternya. Jika nilai initial Cluster centre yang baru
sama dengan nilai initial Cluster centre yang baru maka proses iterasi
dilanjutkan hingga nilai sama atau sampai dengan nilai maksimal iterasi
yang telah ditetapkan sebelumnya (misalnya 100). Namun jika nilai initial
Cluster Center yang baru sama dengan initial Cluster centre yang lama,
38
proses pengelompokkan berhenti. Untuk lebih jelasnya flowchart proses
ini dapat dilihat dibawah :
Start
Data Alumni, keterangan pekerjaan, keterangan kecocokan

jurusan,
keterangan pendapat perkuliahan
Data kuisioner Pemberian kriteria pilihan

alumni jawaban
Normalisasi data
dengan rumus
Data memiliki
NX = (XN-Xmin) T
skala yang sama ?
(Xmaks-Xmin)
Data siap diolah Y
Pemberian Centroid
awal dengan cara
acak nilai
Proses Clustering
Centroid baru sama

T Proses Clustering
dengan sebelumnya ?
T
Y
Hasil Clustering Centroid baru sama dengan

Y
K-Means sebelumnya ?
end
Gambar 4. 3 Flowchart proses perhitungan K-Means

39
Didalam Gambar 4.3 terdapat proses Clustering dimana proses itu akan
dielaskan di Gambar 4.4 dibawah ini :
Start
Data yang sudah

diberikan
centroid awal
Menghitung jarak antara cluster

J=√((NP-CP1)2+(NP2-CP2)2+(NP3-CP3)2+(NP4-
CP4)2+(NP5-CP5)2+(NP6-CP6)2+(NP7-
CP7)2+(NP8-CP8)2)
Menghitung rata – rata tiap atribut

C=(A11+A12=A13...(A1n)
Centroid
baru
End.
Gambar 4. 4 Flowchart perhitungan proses Clustering K-Means
b. Flowchart Naive Bayes
Setelah mendapatkan hasil pengelompokan dari proses K-Means
selanjutnya data akan diolah lagi menggunakan metode Naive Bayes. Data
kuisioner akan diberikan nilai pada masing – masing atribut, tidak seperti K-
Means data Naive Bayes yang telah mendapatkan nilai tiap atributnya dapat
langsung diolah tanpa adanya proses memperkecil skala tiap nilai seperti metode
40
K-Means sebelumnya. Proses perhitungan manual Naive Bayes dapat dilihat dari
gambar 4.4 Flowchart Naive Bayes dibawah :
Start
Data Alumni
Ambil label
dari cluster
K-Means
Mencari nilai
probabilitas
P=(Label/Jumlah
data)
Nilai
probabilitas
tiap atribut
Menghitung nilai perbandingan klasifikasi dengan rumus

K=√((NP-CP1)2 + (NP2-CP2)2 + (NP3- CP3)2 +(NP4- CP4)2 +
(NP5- CP5)2 + (NP6- CP6)2 + (NP7- CP7)2 + (NP8- CP8)2)
Klasifikasi
prediksi
alumni
End.
Gambar 4. 5 Flowchart Naive Bayes
4.2.3 Perancangan Tabel
Di dalam perancangan tabel ini menunjukan sistem basis data yang mana
basis data merupakan himpunan kelompok data yang saling berhubungan, agar
dapat dimanfaatkan kembali dengan cepat dan mudah untuk memenuhi berbagai
kebutuhan. Perancangan basis data pada antarmuka Analisis data mining

41
ketepatan bidang pekerjaan alumni Prodi TI STMIK Nurdin Hamzah Jambi
menggunakan Microsoft Acces didalam file tersebut terdiri dari beberapa tabel
antara lain:
1. Rancangan Tabel Data Kuisioner
Rancangan Tabel data Kuisioner digunakan untuk menyimpan data
kuisioner alumni Prodi TI STMIK Nurdin Hazah Jambi yang berisi no,
nama, NIM, Tahun lulus, no1, no2, no3, no4, no5, no6, no7, no8, Label.
Tabel 4.1 berikut menjelaskan isi tabel data kuisioner:
Tabel 4.1 Tabel Data Kuisioner
No Nama Field Tipe Data Ukuran Keterangan
1 No* Number 3 *Primary key
2 Nama Text 30 Nama alumni
3 NIM Text 30 NIM Alumni
4 Tahun Lulus Text 4 Tahun Lulus
5 no1 Text 30 Kuisioner soal no1
13 Label Number 1 Label Cluster ketepatan

42
4.2.4 Perancangan Antarmuka
Rancangan anatarmuka program merupakan desain untuk membuat
rancangan tampilan program yang akan dibuat sebagai acuan dalam
pembuatan aplikasi, berikut rancangan interface program yang diusulkan :
4.2.4.1 Rancangan Aplikasi Isi Data
Halaman ini merupakan rancangan aplikasi untuk proses mengisi data baru :
Halaman 1 Halaman 2
Isi identias Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Isi Kotak jawaban

kuisioner
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Tambah
Gambar 4.6 Rancangan isi data
Keterangan :
Pada halaman ini user yang akan mengisi data dengan cara isi biodata terlebih
dahulu lalu mengisi kuisioner dan mengklik tombol tambah agar data baru masuk
kedalam database.
43
4.2.4.2 Rancangan Aplikasi Prediksi Klasifikasi Naive Bayes
Halaman ini merupakan rancangan aplikasi untuk proses prediksi klasifikasi data
menggunakan metode naive bayes :
Halaman 1 Halaman 2
Panggil data Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban
Refresh Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban
Nilai probabilitas Nilai probabilitas Nilai probabilitas

Kurang Tepat Tepat Sangat Tepat
Prediksi
Keterangan klasifikasi Update
Gambar 4.7 Rancangan prediksi klasifikasi naive bayes
Keterangan :
Pada halaman ini user akan memanggil data dengan menekan tombol panggil data
dan memilih data mana yang akan diprediksi, setelah itu data yang dipanggil akan
menunjukkan isi jawaban masing – masing di kotak jawaban. Setelah itu nilai
probabilitas akan dapat dilihat di kotak nilai probabilitas dengan acuannya melalui
tiap jawaban di kotak jawaban, setelah itu user akan mengklik tombol prediksi
sehingga nilai prediksi akan timbul di kotak keterangan klasifikasi. Setelah itu
44
user mengklik tombol update untuk menambahkan keterangan prediksi naive
bayes ke database.
4.2.4.3 Rancangan Aplikasi Prediksi Klasifikasi Naive Bayes
Halaman ini merupakan rancangan aplikasi untuk melihat data dan grafik titik
sebar klasifikasi naive bayes :
Halaman 1 Halaman 2
Data Alumni
REFRESH Laporan
Grafik kelas Naive Bayes alumni
Gambar 4.8 Rancangan tabel data dan grafik naive bayes
Keterangan :
Pada halaman ini user dapat melihat tabel data keseluruhan kuisioner dan melihat
titik sebar tiap klasifikasi data alumni. Ketika user mengklik tombol laporan,
laporan akan dapat dilihat oleh user.
4.3 Perhitungan Manual Pengelompokkan K-Means dengan Prediksi
Klasifikasi Naive Bayes
Pada tahap ini peneliti melakukan perhitungan manual dengan proses awal
mencari Cluster data dengan metode K-Means, setelah didapatkan Cluster dari
metode K-Means data kembali diolah dengan metode Naive Bayes untuk mencari
45
prediksi klasifikasi. Dalam proses perhitungan manual data yang dipakai adalah
data kuisioner alumni prodi TI STMIK Nurdin Hamzah Jambi dengan 12
pertanyaan dengan keterangan dibawah ini :
 Nama (Nama alumni pengisi kuisioner)
 NIM (NIM alumni)
 Tahun Lulus (Tahun lulus alumni)
 Apa bidang pekerjaan anda saat ini ? (Soal no 1)
 Sejak anda lulus, berapa kali anda ganti pekerjaan ? (Soal no 2)
 Sudah berapa lama anda bekerja di tempat anda sekarang ? (Soal no 3)
 Berapa lama waktu anda menunggu untuk mendapatkan pekerjaan
setelah lulus dari Prodi TI STMIK Nurdin Hamzah ? (Soal no 4)
 Kompetensi apa yang paling anda kuasai setelah berkuliah di Prodi TI
STMIK Nurdin Hamzah ? (Soal no 5)
 Seberapa besar pengaruh ilmu perkuliahan di Prodi TI STMIK Nurdin
Hamzah dengan pekerjaan anda saat ini ? (Soal no 6)
 Kompetensi apa yang paling berpengaruh dalam pekerjaan anda saat
ini ? (Soal no 7)
 Bahasa programan apa yang anda kuasai setelah lulus dari Prodi TI
STMIK Nurdin Hamzah ? (Soal no 8)
 Menurut anda, apa yang di perlukan oleh lulusan Prodi TI STMIK
Nurdin Hamzah yang akan datang untuk dapat bersaing dalam dunia
pekerjaan saat ini ? (Soal no 9)

46
Isi kuisioner di atas tidak semuanya digunakan dalam perhitungan manual ini, isi
kuisioner yang gunakan dalam perhitungan antara lain pertanyaan nomer 1 sampai
nomer 8, sementara pertanyaan nama, nim dan tahun lulus digunakan sebagai
identitas pengisi, pertanyaan terakhir merupakan saran untuk prodi TI STMIK,
Kuisioner disebarkan melalui link ke alumni – alumni prodi TI STMIK tanpa
batas angkatan.
A. Pengelompokkan Dengan K-Means
1. Pemberian nilai atribut
Dalam proses K-Means diperlukan sebuah data nominal yang digunakan
untuk menemukan jarak antar Cluster, karena itu data kuisioner terlebih
dahulu diberikan nilai tiap jawaban yang diberikan alumni, Nilai masing
– masing atribut tersebut dapat dilihat di tabel 4.3 dibawah ini :
Tabel 4.3 Tabel Nilai Atribut
No soal Atribut Nilai

Perbankan 1
Pendidikan 2
Media Massa 3
Telekomunikasi 4
Pemerintahan 5
Informasi dan Teknologi 6
Seni Kreatif dan Desain 7
Hukum 8
Pariwisata 9
Wirausaha 10
Yang lain 15
Belum pernah ganti pekeejaan 1

1 kali 2
2 kali 3
3 kali 4
47
4 sampai 5 kali 5-6

lebih dari 5 kali 7 - 10
1 sampai 6 bulan 1–6
7 sampai 12 bulan 7 – 12
2 sampai 3 tahun 24 – 36
4 sampai 5 tahun 48 – 60
Lebih dari 5 tahun 60 – 72
Kurang dari 1 bulan 1
2 – 3 bulan 2–3
4 – 6 bulan 4–6
6 – 12 bulan 6 – 12
1 – 2 tahun 12 – 24
Pemrograman 10
Database 20
Umum 30
Desain 40
Sistem Operasi 50
Jaringan 60
Pemrograman 10
Umum 20
Multimedia dan desain 30
Matematika dan logika 40
Java 10
Phyton 20
PHP 30
Java Script 40
C# 50
C 60
C++ 70
Delphi 80
Visual Basic 90
Ruby 100
Yang lain 110
2. Normalisasi Data
48
Setelah data diubah sesuai nilai yang diberikan, data akan di
normalisasikan untuk memperkecil skala perbedaan anatara nilai kriteria
1 dengan yang lainnya dengan menggunakan rumus :
Xnilai−Xmin
NormalisasiX=
Xmaks− Xmin
Berikut adalah cara untuk normalisasi data :
Xnilai pertanyaan 1 = (5), Xmaks pertanyaan 1 = (15) dan Xmin
pertnyaan 1 = (1)
5−1
Normalisasi pertanyaan1= =0,29
15−1
Cara diatas digunakan untuk pertanyaan 1 sampai 8, Setelah
dinormalisasikan didapatlah nilai NP (Normalisasi Pertanyaan) 1 sampai
8 dengan skala yang sama seperti tabel 4.4 dibawah ini :
Tabel 4.3 Tabel normalisasi data
No NP1 NP2 NP3 NP4 NP5 NP6 NP7 NP8

1 0,29 0,00 0,06 0,13 0,00 0,50 0,33 0,00
2 0,00 0,22 0,14 0,00 0,00 0,25 0,33 0,00
3 0,00 0,00 0,41 0,00 0,00 1,00 0,33 0,00
4 0,07 0,11 0,40 0,04 0,00 0,75 0,00 0,00
5 1,00 0,33 0,36 0,00 0,17 0,75 0,33 0,63
6 0,36 0,00 1,00 0,91 0,00 0,00 0,00 0,00
7 0,00 0,33 0,00 0,00 0,33 0,50 1,00 0,00
8 1,00 0,11 0,00 0,09 0,00 0,75 0,33 0,00
9 0,07 0,00 0,93 0,00 0,00 1,00 0,33 0,00
10 0,43 0,22 0,10 0,09 0,50 0,50 0,67 0,00
... ... ... ... ... ... ... ... ...
100 0,07 0,00 0,20 0,04 0,50 0,38 0,33 0,00
3. Proses Pencarian Cluster

49
Setelah data didapat dan dinormalisasikan, data akan siap diCluster yang
dibagi menjadi 3 kelompok yaitu C1 (kurang tepat),C2 (tepat) dan C3
(sangat tepat) dengan dipersiapkan initial Cluster Center terlebih dahulu
dengan nilai yang diacak.
Tabel 4.4 Tabel centroid awal
Centroid Awal PERTANYAAN KUISIONER

Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,36 0,11 0,93 0,09 0,00 1,00 0,00 0,50
Kurang Tepat C2 0,36 0,22 0,47 0,09 0,50 0,50 0,67 0,75
Tidak Tepat C1 1,00 0,11 0,06 0,00 0,33 0,00 0,33 0,63
Setelah initial Cluster Center telah didapat, selanjutnya dilakukan
perhitungan jarak antara nilai dengan rumus yang digunkan pada tiap
Cluster dengan rumus dibawah ini :
√((NP-CP1)2 + (NP2-CP2)2 + (NP3-CP3)2 +(NP4-CP4)2 + (NP5-CP5)2
+ (NP6-CP6)2 + (NP7-CP7)2 + (NP8-CP8)2)
Berikut cara untuk menghitung jarak cluster 1 sampai 3 :
 Alumni 1
NP = (0,29; 0,00; 0,06; 0,13; 0,00; 0,50, 0,33; 0,00)
dengan Cluster 1
CP = (1,00; 0,11; 0,06; 0,00; 0,33; 0,00; 0,33; 0,63)
C1=√((0,29-1,00)2 + (0,00-0,11)2 + (0,06-0,06)2 +(0,13-0,00)2 +
(0,00-0,33)2 + (0,50- 0,00)2 + (0,33-0,33)2 + (0,00-0,63)2) = 1,18
dengan Cluster 2
CP = (0,36; 0,22; 0,47; 0,09; 0,50; 0,50; 0,67; 0,75)

50
C2=√((0,29-0,36)2 + (0,00-0,22)2 + (0,06-0,0,47)2 +(0,13-0,09)2 +
(0,00-0,50)2 + (0,50- 0,50)2 + (0,33-0,67)2 + (0,00-0,75)2) = 1,07
dengan Cluster 3
CP = (0,36; 0,11; 0,93; 0,09; 0,00; 1,00; 0,00; 0,50)
C3=√((0,29-0,36)2+(0,00-0,11)2+(0,06-0,93)2+(0,13-0,09)2+
(0,00-0,00)2 + (0,50- 1,00)2 + (0,33-0,00)2 + (0,00-0,50)2) = 1,14
Hasil dari perhitungan jarak dapat dilihat ditabel 4.5 di bawah ini :
Tabel 4.5 Tabel perhitungan jarak
No Nama C3 C2 C1 CLUSTER
0,38 0,96 1,09 C3
1 Rega Sanjani Alfiqri
0,61 0,98 1,27 C3
2 Syafrizal Edy Chandra
0,58 1,06 1,34 C3
3 Abdy Setiawan
0,50 1,00 1,24 C3
4 Supriyanto
0,95 0,86 0,47 C1
5 Elvi Yanti
1,23 1,50 1,59 C3
6 Panji
0,90 1,10 1,39 C3
7 Angga Pratama
0,78 1,25 0,95 C3
8 M. Jumain
0,79 1,17 1,44 C3
9 Nazratul Putri
0,57 0,88 0,94 C3
10 M. Habib Daiman
... ... ... ... ... ...
0,53 0,84 1,11
100 Ezi Mulyadi C3
Apabila telah diketahui jarak antara Cluster, maka data - data selanjutnya
dapat dielompokkan berdasarkan terhadap suatu Cluster. Suatu data akan
dijadikan anggota suatu Cluster yang mempunyai jarak paling minimum
dengan data tersebut seperti yang di tabel atas.

51
Setelah didapatkan Cluster yang memiliki jarak terdekat, proses
selanjutnya adalah mencari Centroid baru dengan mencari rata – rata tiap
atribut yang sudah dialokasikan kemasing – masing Cluster.
Berikut adalah cara untuk mengitung rata – rata untuk mendapatkan
centroid baru :
Cluster 1 dengan atribut 1 (NP1)
NP1=(1; 0,64; 1; 1; 0,64; 1; 1; 1; 0,64; 0,64; 1; 1; 1; 0,64; 0,64; 1; 0,64;
1; 1; 1; 1; 1; 0,64; )
NP1C1=(1+0,64+1+1+0,64+1+1+1+0,64+0,64+1+1+1+0,64+0,64+1+
0,64+1+1+1+1+1+0,64 )/23 = 0,88
Cara diatas dilakukan di tiap cluster dengan tiap atribut yang selengkapnya
dapat dilihat di tabel 4.6 di bawah ini :
Tabel 4.5 Tabel perhitungan jarak
Cluster P1 P2 P3 P4 P5 P6 P7 P8
C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
4. Perulangan Centroid Cluster K-Means
Setelah didapatkannya Centroid seperti tabel di atas, Centroid baru akan
disamakan dengan centroid sebelumnya, jika nilai centroid awal dan baru
memiliki nilai yang sama, proses akan dihentikan tetapi jika nilai
centroid awal dan baru berbeda centroid baru tersebut akan diporses lagi
ke tahap 3 (Proses Pencarian Cluster). Proses ini lah yang akan
menimbulkan iterasi iterasi baru hingga Centroid yang didapat memiliki

52
nilai yang sama dengan Centroid sebelumnya, seperti pada tabel 4.9 dan
tabel 4.10 dibawah ini :
Tabel 4.9 Tabel Centroid awal
Centroid Awal
Sangat Tepat C3 0,36 0,11 0,93 0,09 0,00 1,00 0,00 0,50
Kurang Tepat C2 0,36 0,22 0,47 0,09 0,50 0,50 0,67 0,75
Tidak Tepat C1 1,00 0,11 0,06 0,00 0,33 0,00 0,33 0,63
Tabel 4.10 Tabel Centroid baru
Centroid Baru
Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
Setelah disamakan Centroid awal dan Centroid baru jika nilai tiap atribut
berbeda di centroid baru dan centroid awal seperti di tabel 4.9 dan 4.10
diatas, maka kembali lagi ke tahap 3 (Proses Pencarian Cluster) hingga
Centroid yang baru sama dengan centroid yang didapat sebelumnya.
Seperti tabel 4.11 dan tabel 4.12 dibawah ini :
Tabel 4.11 Tabel Centroid Iterasi 5
Centroid Iterasi 5 Nilai Cluster

Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
53
Tabel 4.12 Tabel Centroid Iterasi 6
Centroid Iterasi 6 Nilai Cluster

Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
Setelah dilihat Centroid iterasi 6 memiliki nilai yang sama dengan
Centroid 5. Dengan begitu proses pencarian dihentikan dengan hasil
akhir bahwa data – data alumni masing – masing masuk ke Cluster yang
dapat dilihat di tabel 4.13 dibawah ini dan tabel 4.14 untuk melihat
jumlah Cluster yang didapat.
Tabel 4.13 Tabel Pengelompokkan Cluster
No Nama CLUSTER
1 Rega Sanjani Alfiqri C3
2 Syafrizal Edy Chandra C3
3 Abdy Setiawan C3
4 Supriyanto C3
5 Elvi Yanti C1
6 Panji C3
7 Angga Pratama C3
8 M. Jumain C3
9 Nazratul Putri C3
10 M. Habib Daiman C3
... ... ...
100 Ezi Mulyadi C1
Tabel 4.14 Tabel Jumlah Cluster
Cluster Jumlah
C1 23
C2 27
C3 50
B. Klasifikasi dengan navie bayes

54
1. Penambahan label berdasarkan Cluster K-Means
Setelah didapatnya Cluster ketepatan bidang pekerjaan alumni melalui
metode K-Means, selanjutnya data diolah dengan metode Naive Bayes
untuk melihat klasifikasi ketepatan bidang pekerjaan masing – masing
alumni dengan memanfaatkan Cluster sebagai label untuk di
klasifikasikan. Pertama – tama dalam proses Naive Bayes label yang
didapat dari Cluster K-Means sebelumnya dihitung masing – masing
labelnya dan dibagi dengan total jumlah data untuk mendapatkan nilai
probablitas label. Berikut cara menghitung probabilitas label :
P (C1/Jumlah data) = 23/100 = 0,23
Dengan C2
P (C2/Jumlah data) = 27/100 = 0,27
Dengan C3
P (C1/Jumlah data) = 50/100 = 0,50
Selengkapnya dapat dilihat ditabel 4.15 dibawah ini :
Tabel 4.15 Tabel jumlah dan nilai label
Label Keterangan Label Jumlah P(Label)

C1 KURANG TEPAT 23 0,23
C2 TEPAT 27 0,27
C3 SANGAT TEPAT 50 0,50
2. Menghitung probabilitas atribut
Untuk mencari nilai probabilitas tiap pilihan pertama – tama 100 data
yang telah mendapatkan label tiap jawaban soal 1 sampai soal 8 masing
55
– masing akan ditotalkan susuai label yang didapat lalu dibagi dengan
jumlah masing label tersebut.
Cara untuk menghitung probabilitas tiap atribut.
Atribut perbankan dengan label kurang tepat
P(Y=Kurang tepat) = 0/23 = 0
Dengan label tepat
P(Y=Tepat) = 3/27 = 0,111
Dengan label sangat tepat
P(Y=Sangat tepat) = 6/50 = 0,120
Selanjutnya proses perhitungan diatas dilakukan ditiap atribut dan
selengkapnya dapat dilihat seperti tabel 4.16 sampai 4.23 di bawah ini :
Tabel 4.16 Tabel probabilitas soal no 1
Jumla Kurang Sangat P(kurang P(sangat
Atribut h tepat Tepat tepat tepat) P(tepat) tepat)

Perbankan 9 0 3 6 0 0,111 0,120
Pendidikan 15 0 5 10 0 0,185 0,200
Media Massa 2 0 0 2 0 0 0,040
Telekomunikasi 1 0 0 1 0 0 0,020
Pemerintahan 15 0 8 7 0 0,296 0,140
Informasi dan
Teknologi 19 0 10 9 0 0,370 0,180

Seni Kreatif &
Desain 2 0 0 2 0 0 0,040
Hukum 1 0 0 1 0 0 0,020
Pariwisata 0 0 0 0 0 0 0
Wirausaha 18 8 1 9 0,348 0,037 0,180
Yang Lain 18 15 0 3 0,652 0 0,060
Total 100 23 27 50

56
Kurang Sanga P(kurang P(sangat
Atribut Jumlah tepat Tepat t tepat tepat) P(tepat) tepat)

Belum pernah ganti
pekerjaan 46 7 9 30 0,304 0,333 0,600

1 kali 16 6 5 5 0,261 0,185 0,100
2 kali 25 7 7 11 0,304 0,259 0,220
3 kali 8 1 3 4 0,043 0,111 0,080
4 sampai 5 kali 1 0 1 0 0 0,037 0
Lebih dari 5 kali 4 2 2 0 0,087 0,074 0
Total 100 23 27 50
Kurang Tepa Sangat P(kurang P(sangat
Atribut Jumlah tepat t tepat tepat) P(tepat) tepat)

1 sampai 6 Bulan 27 10 3 14 0,435 0,111 0,280
7 sampai 12 Bulan 18 4 5 9 0,174 0,185 0,180
2 sampai 3 Tahun 33 5 13 15 0,217 0,481 0,300
4 sampai 5 Tahun 12 3 4 5 0,130 0,148 0,100
Lebih dari 5
Tahun 10 1 2 7 0,043 0,074 0,140

Total 100 23 27 50
Kurang Sangat P(kurang P(sangat
Jumlah tepat Tepat tepat tepat) P(tepat) tepat)

Kurang dari 1 Bulan 46 11 11 24 0,478 0,407 0,480
2 - 3 Bulan 25 4 10 11 0,174 0,370 0,220
4 - 6 Bulan 16 5 3 8 0,217 0,111 0,160
6 - 12 Bulan 7 2 3 2 0,087 0,111 0,040
1 - 2 Tahun 6 1 0 5 0,043 0 0,100
Total 100 23 27 50
Atribut Jumlah tepat Tepat tepat tepat) P(tepat) tepat)

57
Pemrograman 36 1 6 29 0,043 0,222 0,580

Database 6 2 1 3 0,087 0,037 0,060
Umum 28 10 9 9 0,435 0,333 0,180
Desain 12 1 4 7 0,043 0,148 0,140
Sistem Operasi 1 1 0 0 0,043 0 0
Jaringan 3 0 2 1 0 0,074 0,020
Matematika 14 8 5 1 0,348 0,185 0,020
Total 100 23 27 50

20% 6 1 1 4 0,043 0,037 0,080
40% 15 4 7 4 0,174 0,259 0,080
60% 37 10 12 15 0,435 0,444 0,300
80% 29 6 4 19 0,261 0,148 0,380
100% 13 2 3 8 0,087 0,111 0,160
Total 100 23 27 50

Pemrograman 25 3 7 15 0,130 0,259 0,300
Umum (Microsoft
wrod, Excel, dll) 56 19 13 24 0,826 0,481 0,480

Multimedia dan
Desain Grafis 15 1 5 9 0,043 0,185 0,180

Matematika dan
Logika 4 0 2 2 0 0,074 0,040

Total
100 23 27 50
Atribut Jumlah Kurang Tepat Sangat P(kurang P(tepat) P(sangat

58
tepat tepat tepat) tepat)

Java 0 0 0 0 0 0 0
Phyton 0 0 0 0 0 0 0
PHP 51 2 0 49 0,087 0 0,980
JavaScript 0 0 0 0 0 0 0
C# 0 0 0 0 0 0 0
C 0 0 0 0 0 0 0
C++ 2 1 0 1 0,043 0 0,020
Delphy 18 8 10 0 0,348 0,370 0
Visual Basic 18 7 11 0 0,304 0,407 0
Ruby 0 0 0 0 0 0 0
Yang Lain 11 5 6 0 0,217 0,222 0
Total 100 23 27 50
3. Prediksi naive bayes
Setelah didapatkannya nilai probabilitas tiap atribut dengan masing –
masing labelnya, data siap diolah untuk mencari prediksi klasifikasi
masing – masing alumni Prodi TI STMIK Nurdin Hamzah Jambi dengan
memasukan nilai probabilitas masing – masing jawaban yang dimiliki
tiap alumni dan mengkalikan tiap nilai probabilitas masing – masing
label yang dimiliki seperti cara perhitungan yang ada dibawah ini :
Label Tepat :
P(No1/Tepat)*P(No2/Tepat)*P(No3/Tepat)*P(No4/Tepat)*P(No5/Tepat
)* *P(No6/Tepat)*P(No7/Tepat)*P(No8/Tepat)
LT = 0,30*0,33*0,07*0,11*0,22*0,44*0,48*0,00 = 0
Rumus label Kurang Tepat :
P(No1/KurangTepat)*P(No2/KurangTepat)*P(No3/KurangTepat)
*P(No4KurangTepat)*P(No5/KurangTepat)*P(No6/KurangTepat)*P(N
o7/Kurang Tepat) *P(No8/Kurang Tepat)

59
LKT = 0,00*0,30*0,04*0,22*0,04*0,43*0,83*0,09 = 0
Rumus label Sangat Tepat :
P(No1/SangatTepat)*P(No2/SangatTepat)*P(No3/SangatTepat)*P(No4/
SangatTepat)*P(No5/SangatTepat)**P(No6/SangatTepat)*P(No7/Sanga
tTepat)*P(No8/SangatTepat)
LST = 0,14*0,60*0,14*0,16*0,58*0,30*0,48*0,98 = 0,000154008207
Setelah itu didapat lah nilai label masing – masing alumni yang
menunjukan klasifikasi ketapatan bidang pekerjaan alumni Prodi TI
STMIK Nurdin Hamzah Jambi dengan melihat label mana yang memiliki
nilai paling tinggi seperti tabel 4.26 dibawah ini :
Tabel 4.26 Tabel pencarian nilai label paling tinggi
Ketepatan
No Nama Kurang tepat Tepat Sangat tepat naive bayes

Rega sanjani 0,0001540082073
1 alfiqri 0 0 60 Sangat tepat

SYAFRIZAL
EDY 0,0000387220635
2 CHANDRA 0 0 65 Sangat tepat

Abdy 0,0002112112558
3 Setiawan 0 0 08 Sangat tepat

0,0000399153216
4 Supriyanto 0 0 00 Sangat tepat

ELVI 0,0000038431389
5 YANTI 79 0 0 Kurang tepat

0,0000206260992
6 Panji 0 0 00 Sangat tepat

Angga 0,0000013655900
7 pratama 0 0 16 Sangat tepat

8 M. Jumain 0,0000010481288 0 0,0000191593543 Sangat tepat
60
12 68
Nazratul 0,0003520187596
9 Putri 0 0 80 Sangat tepat

M. Habib 0,0000020080811
10 daiman 0 0 52 Sangat tepat

... ... ... ... ... ...
EZI 0,0000730211328
100 MULYADI 0 0 00 Sangat tepat
4. Analisa metode Naive Bayes dengan metode K-Means
Setelah ditemukan prediksi klasifikasi data menggunakan metode Naive
Bayes, selanjutnya label prediksi yang didapat akan dicocokkan dengan
label yang didapat menggunakan metode K-Means sebelumnya seperti
tabel 4.27 dibawah ini :
Tabel 4.27 Tabel perbandingan Cluster K-Means dengan klasifikasi Naive Bayes
Pengelompokkan
No Nama Prediksi naive bayes k-means

Rega Sanjani
1 Alfiqri SANGAT TEPAT C3

Syafrizal Edy
2 Chandra SANGAT TEPAT C3

3 Abdy Setiawan SANGAT TEPAT C3
4 Supriyanto SANGAT TEPAT C3
5 Elvi Yanti KURANG TEPAT C1
6 Panji SANGAT TEPAT C3
7 Angga Pratama SANGAT TEPAT C3
8 M. Jumain SANGAT TEPAT C3
9 Nazratul Putri SANGAT TEPAT C3
10 M. Habib Daiman SANGAT TEPAT C3
... ... ... ...
100 Ezi Mulyadi SANGAT TEPAT C3
61
Melalui tabel diatas bisa disimpulkan bahwa label yang didapat melalui
Cluster metode K-Means dan prediksi label yang didapat dari meteode
Naive Bayes memiliki keterangan yang sama yaitu Sangat tepat = C3,
Tepat = C2 dan Kurang Tepat = C1. Walaupun K-Means dan Naive
Bayes merupakan metode data mining dengan tujuan yang berbeda,
setelah melalui perhitungan manual diatas K-Means dan Naive Bayes
menunjukan keterhubungannya melalui Cluster dan Label yang didapat
dari masing – masing metode dengan tujuan yang berbeda. Dalam K-
Means Cluster merupakan pengelompokan data, sementara dalam
metode Naive Bayes Label sendiri merupakan kelas untuk berjalannya
klasifikasi data yang akan menunjukkan prediksi terhadap masing –
masing data.

BAB IV New

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

BAB IV New

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB IV

4.1 Analisa Perancangan

Metode perancangan yang digunakan untuk aplikasi ini menggunakan

adalah alat pembuatan model yang memungkinkan profesional sistem untuk

menggambarkan sistem sebagai suatu jaringan proses fungsional yang

komputerisasi. DFD ini merupakan alat perancangan sistem yang berorientasi

analisa maupun rancangan sistem yang mudah dikomunikasikan oleh pembuat

program kepada pemakai program nanti.

4.2 Perancangan Sistem

digunakan, sehingga software dan hardware serta antarmuka yang diharapkan.

Hasil perancangan program harus sesuai dengan perancangan metode dalam

perancangan yaitu antara lain :

4.2.1 Data Flow Diagram (DFD)

Diagram konteks menggambarkan kondisi sistem yang ada baik input

klasifikasinya menggunakan metode Naive Bayes tanpa proses pencarian Cluster

metode K-MEANS. Adapun bentuk diagram konteks dari antarmuka aplikasi

penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi TI

Soal Pertanyaan Kuisioner

Gambar 4.1 Diagram Konteks

menggambarkan keseluruhan sistem yang dimodelkan. Proses tersebut diberi

b. Overview Diagram (Level 0)

Pada diagram Level 0 ini merupakan penjabaran dari diagram konteks

TI STMIK Nurdin Hamzah Jambi yang dibangun :

Data User B. User Klasifikasi Naive Bayes

Gambar 4.2 Overview Diagram (Level 0)

Dalam analisis data mining ketepatan bidang pekerjaan alumni Prodi TI

STMIK Nurdin Hamzah Jambi, penulis menggunakan penggambaran alir program

flowchart atau diagram alir berikut yang memiliki bagan-bagan yang

melambangkan fungsi tertentu :

Pada Flowchart proses ini dimulai dengan proses mempersiapkan data

diproses hingga mendapatkan Cluster yang terbagi 3, yaitu Cluster 1 yang

termasuk dalam golongan kurang tepat, Cluster 2 yang termasuk dalam

Sebelum mendapatkan Cluster – Cluster tersebut diperlukannya sebuah

pertama (perhitungan pertama kali) diberikan secara acak. Pada iterasi

selanjutnya, nilai initial Cluster centre (pengulangan ke-1 sampai dengan

posisi normal/maksimal iterasi) diberikan dengan menghitung nilai rata-

proses pengelompokkan berhenti. Untuk lebih jelasnya flowchart proses

ini dapat dilihat dibawah :

Data Alumni, keterangan pekerjaan, keterangan kecocokan

Data kuisioner Pemberian kriteria pilihan

Data siap diolah Y

Centroid baru sama

Hasil Clustering Centroid baru sama dengan

Gambar 4. 3 Flowchart proses perhitungan K-Means

dielaskan di Gambar 4.4 dibawah ini :

Data yang sudah

Menghitung jarak antara cluster

Menghitung rata – rata tiap atribut

Gambar 4. 4 Flowchart perhitungan proses Clustering K-Means

b. Flowchart Naive Bayes

Setelah mendapatkan hasil pengelompokan dari proses K-Means

gambar 4.4 Flowchart Naive Bayes dibawah :

Menghitung nilai perbandingan klasifikasi dengan rumus

Gambar 4. 5 Flowchart Naive Bayes

4.2.3 Perancangan Tabel

kebutuhan. Perancangan basis data pada antarmuka Analisis data mining

ketepatan bidang pekerjaan alumni Prodi TI STMIK Nurdin Hamzah Jambi

1. Rancangan Tabel Data Kuisioner

Rancangan Tabel data Kuisioner digunakan untuk menyimpan data

Tabel 4.1 berikut menjelaskan isi tabel data kuisioner:

Tabel 4.1 Tabel Data Kuisioner

No Nama Field Tipe Data Ukuran Keterangan

1 No* Number 3 *Primary key