Laporan Data Mining Dan Analitical Business
Laporan Data Mining Dan Analitical Business
Oleh : Kelompok 7
Puji syukur kehadirat Tuhan Yang Maha Esa atas segala rahmatNYA
sehingga makalah ini dapat tersusun hingga selesai . Tidak lupa kami juga
mengucapkan banyak terimakasih atas bantuan dari pihak yang telah berkontribusi
dengan memberikan saran dan masukan serta sumbangan baik materi maupun
pikirannya dalam menyelesaikan makalah ini terutama kepada Ibu Siti Mutrofin
S.Kom M.Kom selaku dosen pengampuh.
DAFTAR ISI
KATA PENGANTAR...................................................................................................2
DAFTAR ISI.................................................................................................................3
BAB I.............................................................................................................................7
PENDAHULUAN.........................................................................................................7
BAB II...........................................................................................................................9
LANDASAN TEORI....................................................................................................9
2.5 UML............................................................................................................11
2.6 Website........................................................................................................11
2.7 PHP..............................................................................................................12
BAB III........................................................................................................................13
PERANCANGAN.......................................................................................................13
BAB IV........................................................................................................................20
Daftar Pustaka..............................................................................................................36
BAB I
PENDAHULUAN
Beberapa orang tahu dan paham menggunakan alat yang namanya komputer,
akan tetapi jarang diantara orang yang dapat mengoperasikan komputer tersebut
mengenal nama perangkat juga sistem kerja dari komputer itu sendiri. Oleh karena
itu alangkah lebih bijaksananya kita tahu, paham, dan mengerti mengenai perangkat
komputer dan cara kerjanya khusunya pada bagian CPU.
Akan tetapi dengan adanya teknologi analisis data (Data Mining) maka data
yang tidak berguna itu bisa menjadikan sebuah informasi yang sangat berguna entah
itu dalam bidang Bisnis, Pendidikan, maupun Politik akan sangat membantu. Data
yang di olah menggunakan Data mining bisa menhasilkan perkiraan ataupun prediksi.
Salah satu metode yang di gunakan di Data Mining adalah Metode Estimasi,
dan Algoritma yang di gunakan ialah KNN ( K Nearest Neigbhor ). Merupakan salah
satu yang sering digunakan, yang mana algoritma ini melakukan klasifikasi
berdasarkan (K) tetangga terdekat. Hal itulah yang mendasari merancang suatu sistem
yang dapat melakukan pengujian data berdasarkan metode dang algoritma yang sudah
di tentukan di atas.
LANDASAN TEORI
2.1 Sistem Informasi
KNN merupakan algoritma non parametric lazy learning. Hal ini dikarenakan
algoritma KNN tidak membuat asumsi apapun pada distribusi data pokok.
Keuntungan ini karena mayoritas data praktis tidak mematuhi asumsi teoritis yang
dibuat dan disinilah algoritma non parametric seperti KNN digunakan. KNN juga
merupakan algoritma lazy learning dikarenakan tidak menggunakan generalisasi
sehingga fase training sangat cepat. Kurangnya generalisasi artinya KNN menyimpan
semua data training. KNN menghasilkan keputusan berdasarkan seluruh training
dataset. Misalkan setiap sample pada dataset memiliki atribut n yang digabungkan
untuk membentuk vector berdimensi n:
Set ini disebut sebagai training set. Kita anggap kita memberikan sample baru
dimana x = u. kita harus menemukan kelas dimana sample ini berasal. Bila kita
mengetahui fungsi f, maka dengan mudah kita dapat menghitung v = f(u) untuk
mengetahui bagaimana kita mengklasifikasikan sample baru ini tetapi tentu saja kita
tidak mengetahui apapun tentang f kecuali f cukup halus[ CITATION Wil18 \l
1033 ].
CPU adalah otak dari komputer. Pekerjaan utama dari CPU adalah
mengerjakan program yang terdiri atas istruksi-instruksi komputer oleh programmer.
Suatu program komputer akan menginstruksikan CPU untuk membaca informasi dari
piranti input, membaca informasi dari dan menulis informasi ke memori, dan untuk
menulis informasi ke output[ CITATION RRI15 \l 1033 ].
2.5 UML
2.6 Website
PERANCANGAN
A. Kebutuhan Fungsional
Untuk use case diagram proses perhitungan aplikasi. Dapat dilihat pada
gambar 3.1.
Gambar 3.1 use case diagram perhitungan knn
Proses ini menggambarkan tentang semua aktivitas user. Karena data – data
pada sistem ini menjabarkan semua data yang ada pada sistem. Untuk tampilan
activiy diagram dapat dilihat pada Gambar 3.2.
Pada squence diagram ini dibuat untuk menjelaskan alur perhitungan metode
estimasi dengan algoritma knn. Adapun gambar sequence diagram dapat dilihat pada
gambar 3.3.
Conceptual Data Model atau biasa disebut dengan CDM adalah model yang
dibuat berdasarkan anggapan bahwa dunia nyata terdiri dari koleksi obyek dasar yang
dinamakan entity serta relasi antar entity. (Hanif Rahmadani, 2010-2011). Untuk
tampilan Conceptual Data Model dapat dijelaskan pada gambar berikut. Adapun
gambar cdm dapat dilihat pada gambar 4.4.
Gambar 4.4 Conceptual Data Model
Physical Data Model atau biasa disebut PDM merupakan model yang
menggunakan sejumlah table untuk menggambakan data serta hubungan antar data-
data tersebut. Setiap tabel mempunyai sejumlah kolom dimana setiap kolom memiliki
nama yang unik. Untuk tampilan Physical Data Model dari sistem ini dapat
dijelaskan bahwa data yang saling berhubungan. Adapun physical Data Model dapat
dilihat pada gambar 4.5.
Pengujian di Tunjukkan untuk memastikan bahwa tiap User case (fitur) telah dapat
berjalan sebagaimana mestinya. Jumlah test case paling tidak satu untuk masing masing use
case.
A. Halaman Login
Gambar 4.2 adalah halaman login yang digunakan sebagai keamanan dalam
mengakses sistem dan juga di gunakan sistem untuk mengatur management User.
Sebelum User dapat mengakses sistem, maka User harus melakukan login agar dapat
masuk pada sistem.
B. Pengujian Halaman Login
Pada gambar 4.4 yaitu halaman tambah kolom yang bertujuan untuk menambahkan
kolom apabila data latih atau data uji banyak, pada halaman ini admin bisa
menambah, menghapus, dan mengedit data.
Pada gambar 4.5. menjelaskan bahwa halaman ini admin bisa menambah atribut
(baris), edit atribut, dan hapus atribut. Kegunaan tambah atribut ialah untuk
mengantisipasi apabila pada saat memasukkan data banyak, admin tidak perlu
mengatur secara manual, cukup dengan menambah berapa baris yang diingkinkan
oleh admin.
2.2.5 Perhitungan Estimasi dengan KNN
Pada gambar 4.6 ini menjelaskan bahwa button data (jumlah kolom) berjumlah
6, kemudian button atribut (jumlah baris) berjumlah 5. Pada gambar juga sudah ada
nilai pada setiap kolom. Yang terdiri dari 5 data latih dan 1 data uji.
Jika pada saat admin menginputkan data, maka admin harus mengklik tulisan
yang berwarna.
4.2.6 Perhitungan Normalisasi Data
Pada gambar ini admin tidak perlu lagi menghitung, karena setelah data sample
telah dihitung maka hasilnya otomatis ikut terhitung.
Pada gambar 4.7 ini menjelaskan bahwa bagaimana cara menghitung jarak ekludien.
Apabila data uji belum di pilih, maka perhitungan jarak ekludien belum bisa
dilakukan. Tetapi apabila data uji sudah diseting maka proses perhitungan jarak
ekludien akan dilakukan. Berikut hasil perhitungan jarak ekludien setelah data uji
dimasukkan. Hasil perhitungan jarak ekludien setelah data uji dimasukkan dapat
dilihat pada gambar 4.8 :
Gambar 4.8 perhitungan jarak ekludien setelah data uji dimasukkan
Berikut adalah hasil jarak ekludien setelah data uji yang nomer 6 dimasukkan.
Untuk menginstal sistem ini langkah yang perlu dilakukan adalah sebagai
berikut :
1. Ekstrak knn_kelasc.zip
local disc C.
8. Kemudian ubah file database sesuai dengan file yang sudah di tambahkan
di phpmyadmin
Pada tahap ini yaitu bagaimana cara menggunakan sistem tersebut. Berikut
cara menggunakan sistem :
http://leman1.byethost11.com/
4. Pilih data untuk menambah kolom, pilih atribut untuk menambah baris,
dan pilih perhitungan sample apabila kolom dan baris sudah cukup.
5. Pilih perhitungan sample. Kemudian masukkan data latih dan data uji.
6. Setelah data latih dan uji dimasukkan simpan. Setelah tersimpan maka
8. Sebelem menentukan jarak ekludien kita harus memilih salah 1 sari data
9. Setelah memilih data uji, sistem akan otomatis menghitung hasil dari jarak
ekludiennya.
10. Setelah hasil ketemu. Selanjutnya kita bisa menguruskan dari terbesar ke
yang terkecil.
12. Setelah menentukan nilai K, baru kita bisa melihat hasil dari perhitungan
tersebut.
Gambar 4.10 merupakan tampilan coding untuk menormalisasikan data yang sudah di
input. Untuk mendapatkan nilai ternormalisasi maka menggunakan rumus min-max
normalization dengan persamaan berikut atau di gambar 4.11 :.
Gambar 4.12 merupakan tampilan coding untuk menghitung jarak eucludien distance
deengan cara mengambil saple atau data uji yang sudah ternormali sasi terlebih
dahulu lalu di proses perhitungan nya menjadi seperti gambar 4.13 dan untuk rumus
nya bisa di lihat di gambar 4.13
Gambar 4.13 Rumus Menentukan Jarak Eucludien
Gambar 4.14 merupakan tampilan coding untuk Penentuan Nilai k yang mana nilai k
adalah jumla data latih di kurangi 1 dan harus lebih dari 0. Sedangkan
perangkingannya berdasarkan hasil perhitungan jarak eucludien distance yang paling
kecil ke hasil yang paling besar.
Daftar Pustaka
Fahrurrozi, I. (2011). Proses Pemodelan Software Dengan Metode Waterfall Dan
Extreme Programming: Studi Perbandingan.