BAB IV New
BAB IV New
PERANCANGAN
pendekatan atau metode studi kasus (case research) dan metode survei dengan
menggunakan diagram arus data (data flow diagram). Data Flow Diagram (DFD)
dihubungkan satu sama lain dengan alur data, baik secara manual maupun
pada alur data dengan konsep dekomposisi dapat digunakan untuk penggambaran
Pada tahap ini hasil perancangan berkaitan erat dengan hasil tahap analisis
karena pada tahap analisis telah ditemukan fungsi-fungsi dan metode yang
34
35
a. Diagram Konteks
maupun output serta menyertakan entity yang terlibat dalam penggunaan sistem.
Diagram ini akan memberi gambaran tentang keseluruhan sistem dari aplikasi
yang bertujuan untuk membantu user menganalisa data baru yang akan dilihat
STMIK Nurdin Hamzah Jambi dapat dilihat pada gambar 4.1 Diagram Konteks
dibawah berikut :
Data Admin
Data Kuisioner Alumni
A.
Admin
Data Admin
Data Kuisioner Alumni
0
Analisi data mining ketepatan
bidang pekerjaan alumni Prodi Data Kuisioner Alumni Baru
TI STMIK Nurdin Hamzah
Jambi
B.
User
Penjelasan:
Pada diagram konteks di atas tampak hanya ada satu proses tunggal yang
notasi angka 0 untuk menunjukkan bahwa ini adalah level paling abstrak/umum
dari sistem. Terdapat 2 kesatuan luar (external entity) pada diagram konteks ini,
yaitu Admin, dan User. Kedua entity ini dapat berperan sebagai sumber data
maupun penerima data/informasi. Selain itu terdapat 4 data flow pada diagram
konteks di atas, yang terdiri dari 2 data flow yang masuk ke proses (input data)
dan 2 data flow yang keluar dari proses (output data). Masing-masing data flow
diberi label yang menunjukkan data apa saja yang sedang mengalir.
sebelumnya. Berikut ini penggambaran dari diagram level 0 (zero) dari antarmuka
Aplikasi penunjang analisis data mining ketepatan bidang pekerjaan alumni Prodi
2.0 3.0
1.0
A. admin Data Admin Olah Data Klasifikasi
Login
Master Naive Bayes
Data Admin
Data Kuisioner Alumni
D1 Kuisioner
Data Kuisioner Alumni
Alumni
37
4.2.2 Flowchart
a. Flowchart K-Means
agar dapat diolah dalam metode K-Means dengan memberikan nilai tiap
atribut. Setelah itu data yang siap diproses dan telah dinormalisasikan akan
tepat dan Cluster 3 yaitu yang memiliki ketapatan pekerjaan sangat tepat.
initial Cluster Center yaitu nilai initial Cluster centre pada iterasi yang
rata data pada setiap Clusternya. Jika nilai initial Cluster centre yang baru
sama dengan nilai initial Cluster centre yang baru maka proses iterasi
dilanjutkan hingga nilai sama atau sampai dengan nilai maksimal iterasi
yang telah ditetapkan sebelumnya (misalnya 100). Namun jika nilai initial
Cluster Center yang baru sama dengan initial Cluster centre yang lama,
38
Start
Normalisasi data
dengan rumus
Data memiliki
NX = (XN-Xmin) T
skala yang sama ?
(Xmaks-Xmin)
Pemberian Centroid
awal dengan cara
acak nilai
Proses Clustering
T
Y
end
Didalam Gambar 4.3 terdapat proses Clustering dimana proses itu akan
Start
Centroid
baru
End.
selanjutnya data akan diolah lagi menggunakan metode Naive Bayes. Data
kuisioner akan diberikan nilai pada masing – masing atribut, tidak seperti K-
Means data Naive Bayes yang telah mendapatkan nilai tiap atributnya dapat
langsung diolah tanpa adanya proses memperkecil skala tiap nilai seperti metode
40
K-Means sebelumnya. Proses perhitungan manual Naive Bayes dapat dilihat dari
Start
Data Alumni
Ambil label
dari cluster
K-Means
Mencari nilai
probabilitas
P=(Label/Jumlah
data)
Nilai
probabilitas
tiap atribut
Klasifikasi
prediksi
alumni
End.
Di dalam perancangan tabel ini menunjukan sistem basis data yang mana
basis data merupakan himpunan kelompok data yang saling berhubungan, agar
dapat dimanfaatkan kembali dengan cepat dan mudah untuk memenuhi berbagai
menggunakan Microsoft Acces didalam file tersebut terdiri dari beberapa tabel
antara lain:
kuisioner alumni Prodi TI STMIK Nurdin Hazah Jambi yang berisi no,
nama, NIM, Tahun lulus, no1, no2, no3, no4, no5, no6, no7, no8, Label.
Halaman ini merupakan rancangan aplikasi untuk proses mengisi data baru :
Halaman 1 Halaman 2
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Kotak jawaban
Tambah
Keterangan :
Pada halaman ini user yang akan mengisi data dengan cara isi biodata terlebih
dahulu lalu mengisi kuisioner dan mengklik tombol tambah agar data baru masuk
kedalam database.
43
Halaman ini merupakan rancangan aplikasi untuk proses prediksi klasifikasi data
Halaman 1 Halaman 2
Panggil data Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban Kotak jawaban
Prediksi
Keterangan :
Pada halaman ini user akan memanggil data dengan menekan tombol panggil data
dan memilih data mana yang akan diprediksi, setelah itu data yang dipanggil akan
menunjukkan isi jawaban masing – masing di kotak jawaban. Setelah itu nilai
probabilitas akan dapat dilihat di kotak nilai probabilitas dengan acuannya melalui
tiap jawaban di kotak jawaban, setelah itu user akan mengklik tombol prediksi
sehingga nilai prediksi akan timbul di kotak keterangan klasifikasi. Setelah itu
44
bayes ke database.
Halaman ini merupakan rancangan aplikasi untuk melihat data dan grafik titik
Halaman 1 Halaman 2
Data Alumni
REFRESH Laporan
Keterangan :
Pada halaman ini user dapat melihat tabel data keseluruhan kuisioner dan melihat
titik sebar tiap klasifikasi data alumni. Ketika user mengklik tombol laporan,
Pada tahap ini peneliti melakukan perhitungan manual dengan proses awal
mencari Cluster data dengan metode K-Means, setelah didapatkan Cluster dari
metode K-Means data kembali diolah dengan metode Naive Bayes untuk mencari
45
prediksi klasifikasi. Dalam proses perhitungan manual data yang dipakai adalah
ini ? (Soal no 7)
Bahasa programan apa yang anda kuasai setelah lulus dari Prodi TI
Nurdin Hamzah yang akan datang untuk dapat bersaing dalam dunia
Isi kuisioner di atas tidak semuanya digunakan dalam perhitungan manual ini, isi
kuisioner yang gunakan dalam perhitungan antara lain pertanyaan nomer 1 sampai
nomer 8, sementara pertanyaan nama, nim dan tahun lulus digunakan sebagai
batas angkatan.
untuk menemukan jarak antar Cluster, karena itu data kuisioner terlebih
dahulu diberikan nilai tiap jawaban yang diberikan alumni, Nilai masing
2. Normalisasi Data
48
Xnilai−Xmin
NormalisasiX=
Xmaks− Xmin
pertnyaan 1 = (1)
5−1
Normalisasi pertanyaan1= =0,29
15−1
Setelah data didapat dan dinormalisasikan, data akan siap diCluster yang
perhitungan jarak antara nilai dengan rumus yang digunkan pada tiap
Alumni 1
dengan Cluster 1
dengan Cluster 2
dengan Cluster 3
C3=√((0,29-0,36)2+(0,00-0,11)2+(0,06-0,93)2+(0,13-0,09)2+
Hasil dari perhitungan jarak dapat dilihat ditabel 4.5 di bawah ini :
No Nama C3 C2 C1 CLUSTER
0,38 0,96 1,09 C3
1 Rega Sanjani Alfiqri
0,61 0,98 1,27 C3
2 Syafrizal Edy Chandra
0,58 1,06 1,34 C3
3 Abdy Setiawan
0,50 1,00 1,24 C3
4 Supriyanto
0,95 0,86 0,47 C1
5 Elvi Yanti
1,23 1,50 1,59 C3
6 Panji
0,90 1,10 1,39 C3
7 Angga Pratama
0,78 1,25 0,95 C3
8 M. Jumain
0,79 1,17 1,44 C3
9 Nazratul Putri
0,57 0,88 0,94 C3
10 M. Habib Daiman
... ... ... ... ... ...
0,53 0,84 1,11
100 Ezi Mulyadi C3
Apabila telah diketahui jarak antara Cluster, maka data - data selanjutnya
selanjutnya adalah mencari Centroid baru dengan mencari rata – rata tiap
centroid baru :
1; 1; 1; 1; 1; 0,64; )
NP1C1=(1+0,64+1+1+0,64+1+1+1+0,64+0,64+1+1+1+0,64+0,64+1+
Cara diatas dilakukan di tiap cluster dengan tiap atribut yang selengkapnya
Cluster P1 P2 P3 P4 P5 P6 P7 P8
C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
disamakan dengan centroid sebelumnya, jika nilai centroid awal dan baru
memiliki nilai yang sama, proses akan dihentikan tetapi jika nilai
centroid awal dan baru berbeda centroid baru tersebut akan diporses lagi
nilai yang sama dengan Centroid sebelumnya, seperti pada tabel 4.9 dan
Centroid Awal
Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,36 0,11 0,93 0,09 0,00 1,00 0,00 0,50
Kurang Tepat C2 0,36 0,22 0,47 0,09 0,50 0,50 0,67 0,75
Tidak Tepat C1 1,00 0,11 0,06 0,00 0,33 0,00 0,33 0,63
Centroid Baru
Keterangan Cluster P1 P2 P3 P4 P5 P6 P7 P8
Sangat Tepat C3 0,35 0,09 0,36 0,16 0,17 0,61 0,33 0,01
Kurang Tepat C2 0,25 0,20 0,40 0,08 0,43 0,49 0,37 0,76
Tidak Tepat C1 0,88 0,19 0,29 0,13 0,49 0,53 0,28 0,71
Setelah disamakan Centroid awal dan Centroid baru jika nilai tiap atribut
berbeda di centroid baru dan centroid awal seperti di tabel 4.9 dan 4.10
akhir bahwa data – data alumni masing – masing masuk ke Cluster yang
dapat dilihat di tabel 4.13 dibawah ini dan tabel 4.14 untuk melihat
No Nama CLUSTER
1 Rega Sanjani Alfiqri C3
2 Syafrizal Edy Chandra C3
3 Abdy Setiawan C3
4 Supriyanto C3
5 Elvi Yanti C1
6 Panji C3
7 Angga Pratama C3
8 M. Jumain C3
9 Nazratul Putri C3
10 M. Habib Daiman C3
... ... ...
100 Ezi Mulyadi C1
Cluster Jumlah
C1 23
C2 27
C3 50
labelnya dan dibagi dengan total jumlah data untuk mendapatkan nilai
Dengan C2
Dengan C3
Untuk mencari nilai probabilitas tiap pilihan pertama – tama 100 data
yang telah mendapatkan label tiap jawaban soal 1 sampai soal 8 masing
55
– masing akan ditotalkan susuai label yang didapat lalu dibagi dengan
selengkapnya dapat dilihat seperti tabel 4.16 sampai 4.23 di bawah ini :
Desain 2 0 0 2 0 0 0,040
Hukum 1 0 0 1 0 0 0,020
Pariwisata 0 0 0 0 0 0 0
Wirausaha 18 8 1 9 0,348 0,037 0,180
Yang Lain 18 15 0 3 0,652 0 0,060
Total 100 23 27 50
100 23 27 50
label yang dimiliki seperti cara perhitungan yang ada dibawah ini :
Label Tepat :
P(No1/Tepat)*P(No2/Tepat)*P(No3/Tepat)*P(No4/Tepat)*P(No5/Tepat
)* *P(No6/Tepat)*P(No7/Tepat)*P(No8/Tepat)
LT = 0,30*0,33*0,07*0,11*0,22*0,44*0,48*0,00 = 0
P(No1/KurangTepat)*P(No2/KurangTepat)*P(No3/KurangTepat)
*P(No4KurangTepat)*P(No5/KurangTepat)*P(No6/KurangTepat)*P(N
LKT = 0,00*0,30*0,04*0,22*0,04*0,43*0,83*0,09 = 0
P(No1/SangatTepat)*P(No2/SangatTepat)*P(No3/SangatTepat)*P(No4/
SangatTepat)*P(No5/SangatTepat)**P(No6/SangatTepat)*P(No7/Sanga
tTepat)*P(No8/SangatTepat)
Setelah itu didapat lah nilai label masing – masing alumni yang
STMIK Nurdin Hamzah Jambi dengan melihat label mana yang memiliki
Ketepatan
EDY 0,0000387220635
12 68
Nazratul 0,0003520187596
Tabel 4.27 Tabel perbandingan Cluster K-Means dengan klasifikasi Naive Bayes
Pengelompokkan
Melalui tabel diatas bisa disimpulkan bahwa label yang didapat melalui
Cluster metode K-Means dan prediksi label yang didapat dari meteode
Naive Bayes memiliki keterangan yang sama yaitu Sangat tepat = C3,
masing data.