Anda di halaman 1dari 28

BAB IV

PERANCANGAN

4.1 Analisa Perancangan

Metode perancangan yang digunakan untuk aplikasi ini menggunakan

pendekatan atau metode studi kasus (case research) dan metode survei dengan

menggunakan diagram arus data (data flow diagram). Data Flow Diagram (DFD)

adalah alat pembuatan model yang memungkinkan profesional sistem untuk

menggambarkan sistem sebagai suatu jaringan proses fungsional yang

dihubungkan satu sama lain dengan alur data, baik secara manual maupun

komputerisasi. DFD ini merupakan alat perancangan sistem yang berorientasi

pada alur data dengan konsep dekomposisi dapat digunakan untuk penggambaran

analisa maupun rancangan sistem yang mudah dikomunikasikan oleh pembuat

program kepada pemakai program nanti.

4.2 Perancangan Sistem

Pada tahap ini hasil perancangan berkaitan erat dengan hasil tahap analisis

karena pada tahap analisis telah ditemukan fungsi-fungsi dan metode yang

digunakan, sehingga software dan hardware serta antarmuka yang diharapkan.

Hasil perancangan program harus sesuai dengan perancangan metode dalam

perancangan yaitu antara lain :

34
35

4.2.1 Data Flow Diagram (DFD)

a. Diagram Konteks

Diagram konteks menggambarkan kondisi sistem yang ada baik input

maupun output serta menyertakan entity yang terlibat dalam penggunaan sistem.

Diagram ini akan memberi gambaran tentang keseluruhan sistem dari aplikasi

yang bertujuan untuk membantu user menganalisa data baru yang akan dilihat

klasifikasinya menggunakan metode Naive Bayes tanpa proses pencarian Cluster

metode K-MEANS. Adapun bentuk diagram konteks dari antarmuka aplikasi

penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi TI

STMIK Nurdin Hamzah Jambi dapat dilihat pada gambar 4.1 Diagram Konteks

dibawah berikut :

Data Admin
Data Kuisioner Alumni
A.
Admin
Data Admin
Data Kuisioner Alumni

0
Analisi data mining ketepatan
bidang pekerjaan alumni Prodi Data Kuisioner Alumni Baru
TI STMIK Nurdin Hamzah
Jambi

B.
User

Soal Pertanyaan Kuisioner

Gambar 4.1 Diagram Konteks


36

Penjelasan:

Pada diagram konteks di atas tampak hanya ada satu proses tunggal yang

menggambarkan keseluruhan sistem yang dimodelkan. Proses tersebut diberi

notasi angka 0 untuk menunjukkan bahwa ini adalah level paling abstrak/umum

dari sistem. Terdapat 2 kesatuan luar (external entity) pada diagram konteks ini,

yaitu Admin, dan User. Kedua entity ini dapat berperan sebagai sumber data

maupun penerima data/informasi. Selain itu terdapat 4 data flow pada diagram

konteks di atas, yang terdiri dari 2 data flow yang masuk ke proses (input data)

dan 2 data flow yang keluar dari proses (output data). Masing-masing data flow

diberi label yang menunjukkan data apa saja yang sedang mengalir.

b. Overview Diagram (Level 0)

Pada diagram Level 0 ini merupakan penjabaran dari diagram konteks

sebelumnya. Berikut ini penggambaran dari diagram level 0 (zero) dari antarmuka

Aplikasi penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi

TI STMIK Nurdin Hamzah Jambi yang dibangun :

Data User B. User Klasifikasi Naive Bayes

2.0 3.0
1.0
A. admin Data Admin Olah Data Klasifikasi
Login
Master Naive Bayes

Data Admin
Data Kuisioner Alumni

D1 Kuisioner
Data Kuisioner Alumni
Alumni
37

Gambar 4.2 Overview Diagram (Level 0)

4.2.2 Flowchart

Dalam analisis data mining ketepatan bidang pekerjaan alumni Prodi TI

STMIK Nurdin Hamzah Jambi, penulis menggunakan penggambaran alir program

flowchart atau diagram alir berikut yang memiliki bagan-bagan yang

melambangkan fungsi tertentu :

a. Flowchart K-Means

Pada Flowchart proses ini dimulai dengan proses mempersiapkan data

agar dapat diolah dalam metode K-Means dengan memberikan nilai tiap

atribut. Setelah itu data yang siap diproses dan telah dinormalisasikan akan

diproses hingga mendapatkan Cluster yang terbagi 3, yaitu Cluster 1 yang

termasuk dalam golongan kurang tepat, Cluster 2 yang termasuk dalam

tepat dan Cluster 3 yaitu yang memiliki ketapatan pekerjaan sangat tepat.

Sebelum mendapatkan Cluster – Cluster tersebut diperlukannya sebuah

initial Cluster Center yaitu nilai initial Cluster centre pada iterasi yang

pertama (perhitungan pertama kali) diberikan secara acak. Pada iterasi

selanjutnya, nilai initial Cluster centre (pengulangan ke-1 sampai dengan

posisi normal/maksimal iterasi) diberikan dengan menghitung nilai rata-

rata data pada setiap Clusternya. Jika nilai initial Cluster centre yang baru

sama dengan nilai initial Cluster centre yang baru maka proses iterasi

dilanjutkan hingga nilai sama atau sampai dengan nilai maksimal iterasi

yang telah ditetapkan sebelumnya (misalnya 100). Namun jika nilai initial

Cluster Center yang baru sama dengan initial Cluster centre yang lama,
38

proses pengelompokkan berhenti. Untuk lebih jelasnya flowchart proses

ini dapat dilihat dibawah :

Start

Data Alumni, keterangan pekerjaan, keterangan kecocokan


jurusan,
keterangan pendapat perkuliahan

Data kuisioner Pemberian kriteria pilihan


alumni jawaban

Normalisasi data
dengan rumus
Data memiliki
NX = (XN-Xmin) T
skala yang sama ?
(Xmaks-Xmin)

Data siap diolah Y

Pemberian Centroid
awal dengan cara
acak nilai

Proses Clustering

Centroid baru sama


T Proses Clustering
dengan sebelumnya ?

T
Y

Hasil Clustering Centroid baru sama dengan


Y
K-Means sebelumnya ?

end

Gambar 4. 3 Flowchart proses perhitungan K-Means


39

Didalam Gambar 4.3 terdapat proses Clustering dimana proses itu akan

dielaskan di Gambar 4.4 dibawah ini :

Start

Data yang sudah


diberikan
centroid awal

Menghitung jarak antara cluster


J=√((NP-CP1)2+(NP2-CP2)2+(NP3-CP3)2+(NP4-
CP4)2+(NP5-CP5)2+(NP6-CP6)2+(NP7-
CP7)2+(NP8-CP8)2)

Menghitung rata – rata tiap atribut


C=(A11+A12=A13...(A1n)

Centroid
baru

End.

Gambar 4. 4 Flowchart perhitungan proses Clustering K-Means

b. Flowchart Naive Bayes

Setelah mendapatkan hasil pengelompokan dari proses K-Means

selanjutnya data akan diolah lagi menggunakan metode Naive Bayes. Data

kuisioner akan diberikan nilai pada masing – masing atribut, tidak seperti K-

Means data Naive Bayes yang telah mendapatkan nilai tiap atributnya dapat

langsung diolah tanpa adanya proses memperkecil skala tiap nilai seperti metode
40

K-Means sebelumnya. Proses perhitungan manual Naive Bayes dapat dilihat dari

gambar 4.4 Flowchart Naive Bayes dibawah :

Start

Data Alumni

Ambil label
dari cluster
K-Means

Mencari nilai
probabilitas
P=(Label/Jumlah
data)

Nilai
probabilitas
tiap atribut

Menghitung nilai perbandingan klasifikasi dengan rumus


K=√((NP-CP1)2 + (NP2-CP2)2 + (NP3- CP3)2 +(NP4- CP4)2 +
(NP5- CP5)2 + (NP6- CP6)2 + (NP7- CP7)2 + (NP8- CP8)2)

Klasifikasi
prediksi
alumni

End.

Gambar 4. 5 Flowchart Naive Bayes

4.2.3 Perancangan Tabel

Di dalam perancangan tabel ini menunjukan sistem basis data yang mana

basis data merupakan himpunan kelompok data yang saling berhubungan, agar

dapat dimanfaatkan kembali dengan cepat dan mudah untuk memenuhi berbagai

kebutuhan. Perancangan basis data pada antarmuka Analisis data mining


41

ketepatan bidang pekerjaan alumni Prodi TI STMIK Nurdin Hamzah Jambi

menggunakan Microsoft Acces didalam file tersebut terdiri dari beberapa tabel

antara lain:

1. Rancangan Tabel Data Kuisioner

Rancangan Tabel data Kuisioner digunakan untuk menyimpan data

kuisioner alumni Prodi TI STMIK Nurdin Hazah Jambi yang berisi no,

nama, NIM, Tahun lulus, no1, no2, no3, no4, no5, no6, no7, no8, Label.

Tabel 4.1 berikut menjelaskan isi tabel data kuisioner:

Tabel 4.1 Tabel Data Kuisioner

No Nama Field Tipe Data Ukuran Keterangan

1 No* Number 3 *Primary key

2 Nama Text 30 Nama alumni

3 NIM Text 30 NIM Alumni

4 Tahun Lulus Text 4 Tahun Lulus

5 no1 Text 30 Kuisioner soal no1

6 no2 Text 30 Kuisioner soal no2

7 no3 Text 30 Kuisioner soal no3

8 no4 Text 30 Kuisioner soal no4

9 no5 Text 30 Kuisioner soal no5

10 no6 Text 30 Kuisioner soal no6

11 no7 Text 30 Kuisioner soal no7

12 no8 Text 30 Kuisioner soal no8

13 Label Number 1 Label Cluster ketepatan


42

4.2.4 Perancangan Antarmuka

Rancangan anatarmuka program merupakan desain untuk membuat

rancangan tampilan program yang akan dibuat sebagai acuan dalam

pembuatan aplikasi, berikut rancangan interface program yang diusulkan :

4.2.4.1 Rancangan Aplikasi Isi Data

Halaman ini merupakan rancangan aplikasi untuk proses mengisi data baru :

Halaman 1 Halaman 2

Isi identias Kotak jawaban

Kotak jawaban

Kotak jawaban

Kotak jawaban

Kotak jawaban

Kotak jawaban

Isi Kotak jawaban


kuisioner
Kotak jawaban

Kotak jawaban

Kotak jawaban

Kotak jawaban

Tambah

Gambar 4.6 Rancangan isi data

Keterangan :

Pada halaman ini user yang akan mengisi data dengan cara isi biodata terlebih

dahulu lalu mengisi kuisioner dan mengklik tombol tambah agar data baru masuk

kedalam database.
43

4.2.4.2 Rancangan Aplikasi Prediksi Klasifikasi Naive Bayes

Halaman ini merupakan rancangan aplikasi untuk proses prediksi klasifikasi data

menggunakan metode naive bayes :

Halaman 1 Halaman 2

Panggil data Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban

Refresh Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban

Nilai probabilitas Nilai probabilitas Nilai probabilitas


Kurang Tepat Tepat Sangat Tepat

Prediksi

Keterangan klasifikasi Update

Gambar 4.7 Rancangan prediksi klasifikasi naive bayes

Keterangan :

Pada halaman ini user akan memanggil data dengan menekan tombol panggil data

dan memilih data mana yang akan diprediksi, setelah itu data yang dipanggil akan

menunjukkan isi jawaban masing – masing di kotak jawaban. Setelah itu nilai

probabilitas akan dapat dilihat di kotak nilai probabilitas dengan acuannya melalui

tiap jawaban di kotak jawaban, setelah itu user akan mengklik tombol prediksi

sehingga nilai prediksi akan timbul di kotak keterangan klasifikasi. Setelah itu
44

user mengklik tombol update untuk menambahkan keterangan prediksi naive

bayes ke database.

4.2.4.3 Rancangan Aplikasi Prediksi Klasifikasi Naive Bayes

Halaman ini merupakan rancangan aplikasi untuk melihat data dan grafik titik

sebar klasifikasi naive bayes :

Halaman 1 Halaman 2

Data Alumni

REFRESH Laporan

Grafik kelas Naive Bayes alumni

Gambar 4.8 Rancangan tabel data dan grafik naive bayes

Keterangan :

Pada halaman ini user dapat melihat tabel data keseluruhan kuisioner dan melihat

titik sebar tiap klasifikasi data alumni. Ketika user mengklik tombol laporan,

laporan akan dapat dilihat oleh user.

4.3 Perhitungan Manual Pengelompokkan K-Means dengan Prediksi

Klasifikasi Naive Bayes

Pada tahap ini peneliti melakukan perhitungan manual dengan proses awal

mencari Cluster data dengan metode K-Means, setelah didapatkan Cluster dari

metode K-Means data kembali diolah dengan metode Naive Bayes untuk mencari
45

prediksi klasifikasi. Dalam proses perhitungan manual data yang dipakai adalah

data kuisioner alumni prodi TI STMIK Nurdin Hamzah Jambi dengan 12

pertanyaan dengan keterangan dibawah ini :

 Nama (Nama alumni pengisi kuisioner)

 NIM (NIM alumni)

 Tahun Lulus (Tahun lulus alumni)

 Apa bidang pekerjaan anda saat ini ? (Soal no 1)

 Sejak anda lulus, berapa kali anda ganti pekerjaan ? (Soal no 2)

 Sudah berapa lama anda bekerja di tempat anda sekarang ? (Soal no 3)

 Berapa lama waktu anda menunggu untuk mendapatkan pekerjaan

setelah lulus dari Prodi TI STMIK Nurdin Hamzah ? (Soal no 4)

 Kompetensi apa yang paling anda kuasai setelah berkuliah di Prodi TI

STMIK Nurdin Hamzah ? (Soal no 5)

 Seberapa besar pengaruh ilmu perkuliahan di Prodi TI STMIK Nurdin

Hamzah dengan pekerjaan anda saat ini ? (Soal no 6)

 Kompetensi apa yang paling berpengaruh dalam pekerjaan anda saat

ini ? (Soal no 7)

 Bahasa programan apa yang anda kuasai setelah lulus dari Prodi TI

STMIK Nurdin Hamzah ? (Soal no 8)

 Menurut anda, apa yang di perlukan oleh lulusan Prodi TI STMIK

Nurdin Hamzah yang akan datang untuk dapat bersaing dalam dunia

pekerjaan saat ini ? (Soal no 9)


46

Isi kuisioner di atas tidak semuanya digunakan dalam perhitungan manual ini, isi

kuisioner yang gunakan dalam perhitungan antara lain pertanyaan nomer 1 sampai

nomer 8, sementara pertanyaan nama, nim dan tahun lulus digunakan sebagai

identitas pengisi, pertanyaan terakhir merupakan saran untuk prodi TI STMIK,

Kuisioner disebarkan melalui link ke alumni – alumni prodi TI STMIK tanpa

batas angkatan.

A. Pengelompokkan Dengan K-Means

1. Pemberian nilai atribut

Dalam proses K-Means diperlukan sebuah data nominal yang digunakan

untuk menemukan jarak antar Cluster, karena itu data kuisioner terlebih

dahulu diberikan nilai tiap jawaban yang diberikan alumni, Nilai masing

– masing atribut tersebut dapat dilihat di tabel 4.3 dibawah ini :

Tabel 4.3 Tabel Nilai Atribut

No soal Atribut Nilai


Perbankan 1
Pendidikan 2
Media Massa 3
Telekomunikasi 4
Pemerintahan 5
Informasi dan Teknologi 6
Seni Kreatif dan Desain 7
Hukum 8
Pariwisata 9
Wirausaha 10
Yang lain 15

Belum pernah ganti pekeejaan 1


1 kali 2
2 kali 3
3 kali 4
47

4 sampai 5 kali 5-6


lebih dari 5 kali 7 - 10
1 sampai 6 bulan 1–6
7 sampai 12 bulan 7 – 12
2 sampai 3 tahun 24 – 36
4 sampai 5 tahun 48 – 60
Lebih dari 5 tahun 60 – 72
Kurang dari 1 bulan 1
2 – 3 bulan 2–3
4 – 6 bulan 4–6
6 – 12 bulan 6 – 12
1 – 2 tahun 12 – 24
Pemrograman 10
Database 20
Umum 30
Desain 40
Sistem Operasi 50
Jaringan 60
Pemrograman 10
Umum 20
Multimedia dan desain 30
Matematika dan logika 40
Java 10
Phyton 20
PHP 30
Java Script 40
C# 50
C 60
C++ 70
Delphi 80
Visual Basic 90
Ruby 100
Yang lain 110

2. Normalisasi Data
48

Setelah data diubah sesuai nilai yang diberikan, data akan di

normalisasikan untuk memperkecil skala perbedaan anatara nilai kriteria

1 dengan yang lainnya dengan menggunakan rumus :

Xnilai−Xmin
NormalisasiX=
Xmaks− Xmin

Berikut adalah cara untuk normalisasi data :

Xnilai pertanyaan 1 = (5), Xmaks pertanyaan 1 = (15) dan Xmin

pertnyaan 1 = (1)

5−1
Normalisasi pertanyaan1= =0,29
15−1

Cara diatas digunakan untuk pertanyaan 1 sampai 8, Setelah

dinormalisasikan didapatlah nilai NP (Normalisasi Pertanyaan) 1 sampai

8 dengan skala yang sama seperti tabel 4.4 dibawah ini :

Tabel 4.3 Tabel normalisasi data

No NP1 NP2 NP3 NP4 NP5 NP6 NP7 NP8


1 0,29 0,00 0,06 0,13 0,00 0,50 0,33 0,00
2 0,00 0,22 0,14 0,00 0,00 0,25 0,33 0,00
3 0,00 0,00 0,41 0,00 0,00 1,00 0,33 0,00
4 0,07 0,11 0,40 0,04 0,00 0,75 0,00 0,00
5 1,00 0,33 0,36 0,00 0,17 0,75 0,33 0,63
6 0,36 0,00 1,00 0,91 0,00 0,00 0,00 0,00
7 0,00 0,33 0,00 0,00 0,33 0,50 1,00 0,00
8 1,00 0,11 0,00 0,09 0,00 0,75 0,33 0,00
9 0,07 0,00 0,93 0,00 0,00 1,00 0,33 0,00
10 0,43 0,22 0,10 0,09 0,50 0,50 0,67 0,00
... ... ... ... ... ... ... ... ...
100 0,07 0,00 0,20 0,04 0,50 0,38 0,33 0,00

3. Proses Pencarian Cluster


49

Setelah data didapat dan dinormalisasikan, data akan siap diCluster yang

dibagi menjadi 3 kelompok yaitu C1 (kurang tepat),C2 (tepat) dan C3

(sangat tepat) dengan dipersiapkan initial Cluster Center terlebih dahulu

dengan nilai yang diacak.

Tabel 4.4 Tabel centroid awal

Centroid Awal PERTANYAAN KUISIONER


Keterangan  Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,36 0,11 0,93 0,09 0,00 1,00 0,00 0,50
Kurang Tepat C2 0,36 0,22 0,47 0,09 0,50 0,50 0,67 0,75
Tidak Tepat C1 1,00 0,11 0,06 0,00 0,33 0,00 0,33 0,63

Setelah initial Cluster Center telah didapat, selanjutnya dilakukan

perhitungan jarak antara nilai dengan rumus yang digunkan pada tiap

Cluster dengan rumus dibawah ini :

√((NP-CP1)2 + (NP2-CP2)2 + (NP3-CP3)2 +(NP4-CP4)2 + (NP5-CP5)2

+ (NP6-CP6)2 + (NP7-CP7)2 + (NP8-CP8)2)

Berikut cara untuk menghitung jarak cluster 1 sampai 3 :

 Alumni 1

NP = (0,29; 0,00; 0,06; 0,13; 0,00; 0,50, 0,33; 0,00)

dengan Cluster 1

CP = (1,00; 0,11; 0,06; 0,00; 0,33; 0,00; 0,33; 0,63)

C1=√((0,29-1,00)2 + (0,00-0,11)2 + (0,06-0,06)2 +(0,13-0,00)2 +

(0,00-0,33)2 + (0,50- 0,00)2 + (0,33-0,33)2 + (0,00-0,63)2) = 1,18

dengan Cluster 2

CP = (0,36; 0,22; 0,47; 0,09; 0,50; 0,50; 0,67; 0,75)


50

C2=√((0,29-0,36)2 + (0,00-0,22)2 + (0,06-0,0,47)2 +(0,13-0,09)2 +

(0,00-0,50)2 + (0,50- 0,50)2 + (0,33-0,67)2 + (0,00-0,75)2) = 1,07

dengan Cluster 3

CP = (0,36; 0,11; 0,93; 0,09; 0,00; 1,00; 0,00; 0,50)

C3=√((0,29-0,36)2+(0,00-0,11)2+(0,06-0,93)2+(0,13-0,09)2+

(0,00-0,00)2 + (0,50- 1,00)2 + (0,33-0,00)2 + (0,00-0,50)2) = 1,14

Hasil dari perhitungan jarak dapat dilihat ditabel 4.5 di bawah ini :

Tabel 4.5 Tabel perhitungan jarak

No Nama C3 C2 C1 CLUSTER
0,38 0,96 1,09 C3
1 Rega Sanjani Alfiqri
0,61 0,98 1,27 C3
2 Syafrizal Edy Chandra
0,58 1,06 1,34 C3
3 Abdy Setiawan
0,50 1,00 1,24 C3
4 Supriyanto
0,95 0,86 0,47 C1
5 Elvi Yanti
1,23 1,50 1,59 C3
6 Panji
0,90 1,10 1,39 C3
7 Angga Pratama
0,78 1,25 0,95 C3
8 M. Jumain
0,79 1,17 1,44 C3
9 Nazratul Putri
0,57 0,88 0,94 C3
10 M. Habib Daiman
... ... ... ... ... ...
0,53 0,84 1,11
100  Ezi Mulyadi C3

Apabila telah diketahui jarak antara Cluster, maka data - data selanjutnya

dapat dielompokkan berdasarkan terhadap suatu Cluster. Suatu data akan

dijadikan anggota suatu Cluster yang mempunyai jarak paling minimum

dengan data tersebut seperti yang di tabel atas.


51

Setelah didapatkan Cluster yang memiliki jarak terdekat, proses

selanjutnya adalah mencari Centroid baru dengan mencari rata – rata tiap

atribut yang sudah dialokasikan kemasing – masing Cluster.

Berikut adalah cara untuk mengitung rata – rata untuk mendapatkan

centroid baru :

Cluster 1 dengan atribut 1 (NP1)

NP1=(1; 0,64; 1; 1; 0,64; 1; 1; 1; 0,64; 0,64; 1; 1; 1; 0,64; 0,64; 1; 0,64;

1; 1; 1; 1; 1; 0,64; )

NP1C1=(1+0,64+1+1+0,64+1+1+1+0,64+0,64+1+1+1+0,64+0,64+1+

0,64+1+1+1+1+1+0,64 )/23 = 0,88

Cara diatas dilakukan di tiap cluster dengan tiap atribut yang selengkapnya

dapat dilihat di tabel 4.6 di bawah ini :

Tabel 4.5 Tabel perhitungan jarak

Cluster P1 P2 P3 P4 P5 P6 P7 P8
C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71

4. Perulangan Centroid Cluster K-Means

Setelah didapatkannya Centroid seperti tabel di atas, Centroid baru akan

disamakan dengan centroid sebelumnya, jika nilai centroid awal dan baru

memiliki nilai yang sama, proses akan dihentikan tetapi jika nilai

centroid awal dan baru berbeda centroid baru tersebut akan diporses lagi

ke tahap 3 (Proses Pencarian Cluster). Proses ini lah yang akan

menimbulkan iterasi iterasi baru hingga Centroid yang didapat memiliki


52

nilai yang sama dengan Centroid sebelumnya, seperti pada tabel 4.9 dan

tabel 4.10 dibawah ini :

Tabel 4.9 Tabel Centroid awal

Centroid Awal  
Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,36 0,11 0,93 0,09 0,00 1,00 0,00 0,50
Kurang Tepat C2 0,36 0,22 0,47 0,09 0,50 0,50 0,67 0,75
Tidak Tepat C1 1,00 0,11 0,06 0,00 0,33 0,00 0,33 0,63

Tabel 4.10 Tabel Centroid baru

Centroid Baru  
Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71

Setelah disamakan Centroid awal dan Centroid baru jika nilai tiap atribut

berbeda di centroid baru dan centroid awal seperti di tabel 4.9 dan 4.10

diatas, maka kembali lagi ke tahap 3 (Proses Pencarian Cluster) hingga

Centroid yang baru sama dengan centroid yang didapat sebelumnya.

Seperti tabel 4.11 dan tabel 4.12 dibawah ini :

Tabel 4.11 Tabel Centroid Iterasi 5

Centroid Iterasi 5   Nilai Cluster


Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
53

Tabel 4.12 Tabel Centroid Iterasi 6

Centroid Iterasi 6   Nilai Cluster


Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71

Setelah dilihat Centroid iterasi 6 memiliki nilai yang sama dengan

Centroid 5. Dengan begitu proses pencarian dihentikan dengan hasil

akhir bahwa data – data alumni masing – masing masuk ke Cluster yang

dapat dilihat di tabel 4.13 dibawah ini dan tabel 4.14 untuk melihat

jumlah Cluster yang didapat.

Tabel 4.13 Tabel Pengelompokkan Cluster

No Nama CLUSTER
1 Rega Sanjani Alfiqri C3
2 Syafrizal Edy Chandra C3
3 Abdy Setiawan C3
4 Supriyanto C3
5 Elvi Yanti C1
6 Panji C3
7 Angga Pratama C3
8 M. Jumain C3
9 Nazratul Putri C3
10 M. Habib Daiman C3
... ... ...
100  Ezi Mulyadi C1

Tabel 4.14 Tabel Jumlah Cluster

Cluster Jumlah
C1 23
C2 27
C3 50

B. Klasifikasi dengan navie bayes


54

1. Penambahan label berdasarkan Cluster K-Means

Setelah didapatnya Cluster ketepatan bidang pekerjaan alumni melalui

metode K-Means, selanjutnya data diolah dengan metode Naive Bayes

untuk melihat klasifikasi ketepatan bidang pekerjaan masing – masing

alumni dengan memanfaatkan Cluster sebagai label untuk di

klasifikasikan. Pertama – tama dalam proses Naive Bayes label yang

didapat dari Cluster K-Means sebelumnya dihitung masing – masing

labelnya dan dibagi dengan total jumlah data untuk mendapatkan nilai

probablitas label. Berikut cara menghitung probabilitas label :

P (C1/Jumlah data) = 23/100 = 0,23

Dengan C2

P (C2/Jumlah data) = 27/100 = 0,27

Dengan C3

P (C1/Jumlah data) = 50/100 = 0,50

Selengkapnya dapat dilihat ditabel 4.15 dibawah ini :

Tabel 4.15 Tabel jumlah dan nilai label

Label Keterangan Label Jumlah P(Label)


C1 KURANG TEPAT 23 0,23
C2 TEPAT 27 0,27
C3 SANGAT TEPAT 50 0,50

2. Menghitung probabilitas atribut

Untuk mencari nilai probabilitas tiap pilihan pertama – tama 100 data

yang telah mendapatkan label tiap jawaban soal 1 sampai soal 8 masing
55

– masing akan ditotalkan susuai label yang didapat lalu dibagi dengan

jumlah masing label tersebut.

Cara untuk menghitung probabilitas tiap atribut.

Atribut perbankan dengan label kurang tepat

P(Y=Kurang tepat) = 0/23 = 0

Dengan label tepat

P(Y=Tepat) = 3/27 = 0,111

Dengan label sangat tepat

P(Y=Sangat tepat) = 6/50 = 0,120

Selanjutnya proses perhitungan diatas dilakukan ditiap atribut dan

selengkapnya dapat dilihat seperti tabel 4.16 sampai 4.23 di bawah ini :

Tabel 4.16 Tabel probabilitas soal no 1

Jumla Kurang Sangat P(kurang P(sangat

Atribut h tepat Tepat tepat tepat) P(tepat) tepat)


Perbankan 9 0 3 6 0 0,111 0,120
Pendidikan 15 0 5 10 0 0,185 0,200
Media Massa 2 0 0 2 0 0 0,040
Telekomunikasi 1 0 0 1 0 0 0,020
Pemerintahan 15 0 8 7 0 0,296 0,140
Informasi dan

Teknologi 19 0 10 9 0 0,370 0,180


Seni Kreatif &

Desain 2 0 0 2 0 0 0,040
Hukum 1 0 0 1 0 0 0,020
Pariwisata 0 0 0 0 0 0 0
Wirausaha 18 8 1 9 0,348 0,037 0,180
Yang Lain 18 15 0 3 0,652 0 0,060
Total 100 23 27 50      

Tabel 4.17 Tabel probabilitas soal no 2


56

Kurang Sanga P(kurang P(sangat

 Atribut Jumlah tepat Tepat t tepat tepat) P(tepat) tepat)


Belum pernah ganti

pekerjaan 46 7 9 30 0,304 0,333 0,600


1 kali 16 6 5 5 0,261 0,185 0,100
2 kali 25 7 7 11 0,304 0,259 0,220
3 kali 8 1 3 4 0,043 0,111 0,080
4 sampai 5 kali 1 0 1 0 0 0,037 0
Lebih dari 5 kali 4 2 2 0 0,087 0,074 0
Total 100 23 27 50      

Tabel 4.18 Tabel probabilitas soal no 3

Kurang Tepa Sangat P(kurang P(sangat

 Atribut Jumlah tepat t tepat tepat) P(tepat) tepat)


1 sampai 6 Bulan 27 10 3 14 0,435 0,111 0,280
7 sampai 12 Bulan 18 4 5 9 0,174 0,185 0,180
2 sampai 3 Tahun 33 5 13 15 0,217 0,481 0,300
4 sampai 5 Tahun 12 3 4 5 0,130 0,148 0,100
Lebih dari 5

Tahun 10 1 2 7 0,043 0,074 0,140


Total 100 23 27 50      

Tabel 4.19 Tabel probabilitas soal no 4

Kurang Sangat P(kurang P(sangat

  Jumlah tepat Tepat tepat tepat) P(tepat) tepat)


Kurang dari 1 Bulan 46 11 11 24 0,478 0,407 0,480
2 - 3 Bulan 25 4 10 11 0,174 0,370 0,220
4 - 6 Bulan 16 5 3 8 0,217 0,111 0,160
6 - 12 Bulan 7 2 3 2 0,087 0,111 0,040
1 - 2 Tahun 6 1 0 5 0,043 0 0,100
Total 100 23 27 50      

Tabel 4.20 Tabel probabilitas soal no 5

Kurang Sangat P(kurang P(sangat

 Atribut Jumlah tepat Tepat tepat tepat) P(tepat) tepat)


57

Pemrograman 36 1 6 29 0,043 0,222 0,580


Database 6 2 1 3 0,087 0,037 0,060
Umum 28 10 9 9 0,435 0,333 0,180
Desain 12 1 4 7 0,043 0,148 0,140
Sistem Operasi 1 1 0 0 0,043 0 0
Jaringan 3 0 2 1 0 0,074 0,020
Matematika 14 8 5 1 0,348 0,185 0,020
Total 100 23 27 50      

Tabel 4.21 Tabel probabilitas soal no 6

Kurang Sangat P(kurang P(sangat

 Atribut Jumlah tepat Tepat tepat tepat) P(tepat) tepat)


20% 6 1 1 4 0,043 0,037 0,080
40% 15 4 7 4 0,174 0,259 0,080
60% 37 10 12 15 0,435 0,444 0,300
80% 29 6 4 19 0,261 0,148 0,380
100% 13 2 3 8 0,087 0,111 0,160
Total 100 23 27 50      

Tabel 4.22 Tabel probabilitas soal no 7

Kurang Sangat P(kurang P(sangat

 Atribut Jumlah tepat Tepat tepat tepat) P(tepat) tepat)


Pemrograman 25 3 7 15 0,130 0,259 0,300
Umum (Microsoft

wrod, Excel, dll) 56 19 13 24 0,826 0,481 0,480


Multimedia dan

Desain Grafis 15 1 5 9 0,043 0,185 0,180


Matematika dan

Logika 4 0 2 2 0 0,074 0,040


Total

  100 23 27 50      

Tabel 4.23 Tabel probabilitas soal no 8

Atribut  Jumlah Kurang Tepat Sangat P(kurang P(tepat) P(sangat


58

tepat tepat tepat) tepat)


Java 0 0 0 0 0 0 0
Phyton 0 0 0 0 0 0 0
PHP 51 2 0 49 0,087 0 0,980
JavaScript 0 0 0 0 0 0 0
C# 0 0 0 0 0 0 0
C 0 0 0 0 0 0 0
C++ 2 1 0 1 0,043 0 0,020
Delphy 18 8 10 0 0,348 0,370 0
Visual Basic 18 7 11 0 0,304 0,407 0
Ruby 0 0 0 0 0 0 0
Yang Lain 11 5 6 0 0,217 0,222 0
Total 100 23 27 50      

3. Prediksi naive bayes

Setelah didapatkannya nilai probabilitas tiap atribut dengan masing –

masing labelnya, data siap diolah untuk mencari prediksi klasifikasi

masing – masing alumni Prodi TI STMIK Nurdin Hamzah Jambi dengan

memasukan nilai probabilitas masing – masing jawaban yang dimiliki

tiap alumni dan mengkalikan tiap nilai probabilitas masing – masing

label yang dimiliki seperti cara perhitungan yang ada dibawah ini :

Label Tepat :

P(No1/Tepat)*P(No2/Tepat)*P(No3/Tepat)*P(No4/Tepat)*P(No5/Tepat

)* *P(No6/Tepat)*P(No7/Tepat)*P(No8/Tepat)

LT = 0,30*0,33*0,07*0,11*0,22*0,44*0,48*0,00 = 0

Rumus label Kurang Tepat :

P(No1/KurangTepat)*P(No2/KurangTepat)*P(No3/KurangTepat)

*P(No4KurangTepat)*P(No5/KurangTepat)*P(No6/KurangTepat)*P(N

o7/Kurang Tepat) *P(No8/Kurang Tepat)


59

LKT = 0,00*0,30*0,04*0,22*0,04*0,43*0,83*0,09 = 0

Rumus label Sangat Tepat :

P(No1/SangatTepat)*P(No2/SangatTepat)*P(No3/SangatTepat)*P(No4/

SangatTepat)*P(No5/SangatTepat)**P(No6/SangatTepat)*P(No7/Sanga

tTepat)*P(No8/SangatTepat)

LST = 0,14*0,60*0,14*0,16*0,58*0,30*0,48*0,98 = 0,000154008207

Setelah itu didapat lah nilai label masing – masing alumni yang

menunjukan klasifikasi ketapatan bidang pekerjaan alumni Prodi TI

STMIK Nurdin Hamzah Jambi dengan melihat label mana yang memiliki

nilai paling tinggi seperti tabel 4.26 dibawah ini :

Tabel 4.26 Tabel pencarian nilai label paling tinggi

Ketepatan

No Nama Kurang tepat Tepat Sangat tepat naive bayes


Rega sanjani 0,0001540082073

1 alfiqri 0 0 60 Sangat tepat


SYAFRIZAL

EDY 0,0000387220635

2 CHANDRA 0 0 65 Sangat tepat


Abdy 0,0002112112558

3 Setiawan 0 0 08 Sangat tepat


0,0000399153216

4 Supriyanto 0 0 00 Sangat tepat


ELVI 0,0000038431389

5 YANTI 79 0 0 Kurang tepat


0,0000206260992

6 Panji 0 0 00 Sangat tepat


Angga 0,0000013655900

7 pratama 0 0 16 Sangat tepat


8 M. Jumain 0,0000010481288 0 0,0000191593543 Sangat tepat
60

12 68
Nazratul 0,0003520187596

9 Putri 0 0 80 Sangat tepat


M. Habib 0,0000020080811

10 daiman 0 0 52 Sangat tepat


... ... ... ... ... ...
 EZI 0,0000730211328

100 MULYADI 0 0 00 Sangat tepat

4. Analisa metode Naive Bayes dengan metode K-Means

Setelah ditemukan prediksi klasifikasi data menggunakan metode Naive

Bayes, selanjutnya label prediksi yang didapat akan dicocokkan dengan

label yang didapat menggunakan metode K-Means sebelumnya seperti

tabel 4.27 dibawah ini :

Tabel 4.27 Tabel perbandingan Cluster K-Means dengan klasifikasi Naive Bayes

Pengelompokkan

No Nama Prediksi naive bayes k-means


Rega Sanjani

1 Alfiqri SANGAT TEPAT C3


Syafrizal Edy

2 Chandra SANGAT TEPAT C3


3 Abdy Setiawan SANGAT TEPAT C3
4 Supriyanto SANGAT TEPAT C3
5 Elvi Yanti KURANG TEPAT C1
6 Panji SANGAT TEPAT C3
7 Angga Pratama SANGAT TEPAT C3
8 M. Jumain SANGAT TEPAT C3
9 Nazratul Putri SANGAT TEPAT C3
10 M. Habib Daiman SANGAT TEPAT C3
... ... ... ...
100  Ezi Mulyadi SANGAT TEPAT C3
61

Melalui tabel diatas bisa disimpulkan bahwa label yang didapat melalui

Cluster metode K-Means dan prediksi label yang didapat dari meteode

Naive Bayes memiliki keterangan yang sama yaitu Sangat tepat = C3,

Tepat = C2 dan Kurang Tepat = C1. Walaupun K-Means dan Naive

Bayes merupakan metode data mining dengan tujuan yang berbeda,

setelah melalui perhitungan manual diatas K-Means dan Naive Bayes

menunjukan keterhubungannya melalui Cluster dan Label yang didapat

dari masing – masing metode dengan tujuan yang berbeda. Dalam K-

Means Cluster merupakan pengelompokan data, sementara dalam

metode Naive Bayes Label sendiri merupakan kelas untuk berjalannya

klasifikasi data yang akan menunjukkan prediksi terhadap masing –

masing data.

Anda mungkin juga menyukai