Anda di halaman 1dari 20

PENERAPAN DATA MINING MEMPREDIKSI HARGA POMPA

AIR SETIAP TAHUNNYA PADA TOKO HANAN AQUARIUM

DENGAN METODE K- NEAREST NEIGHBOR (KNN)

Oleh :

Nama Nim
Ratih Emilia Susanti 200121186
Jody Randa Daulay 200121168

PROGRAM STUDI TEKNIK INFORMATIKA


SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
PELITA NUSANTARA
2023
BAB 1
PENDAHULUAN

1.1 Latar Belakang

Dalam hal ini teknologi informasi sangat lah dibutuhkan oleh manusia karena selain

canggih teknologi informasi juga memudahkan manusia dalam mengambil keputusan

yang tepat untuk itu para sains dan pakar terus menciptakan teknologi informasi yang

mutakir untuk dikembangkan dan dapat digunakan oleh manusia awam sekalipun,

berbagai alat elektronik, aplikasi, serta metode-metode untuk memudahkan para

pengguna. Untuk itu setiap perusahaan pun banyak menggunakan aplikasi dan metode

untuk mempercepat pekerjaan dan semacamnya.

Pada Toko Hanan Aquarium yang menjual berbagai produk kebutuhan bahan

bahan dan accesoris aquarium yang beralamat di Jl. Medan-Binjai No.29 Paya geli kec.

Sunggal kab. Deli serdang selalu mengalami kesulitan dalam membuat kestabilan

harga yang sesuai dikarenakan naik dan turunnya harga bbm di Indonesia sehingga

penjualan pompa air pun kian merosot banyak konsumen yang mengeluhkan tentang

kenaikan harga pompa air, sedangkan pihak toko pun mengalami kerugian dikarenakan

tidak terjualnya produk pompa air tersebut..

Atas permasalahan tersebut, untuk membantu pihak toko dalam memberikan

sebuah analisis pengambilan keputusan yang dapat memprediksi harga pompa air agar

tetap stabil dan laku terjual meski memiliki keuntungan yang sedikit maka dalam

menentukan topik penelitan secara cepat dan tepat. Sistem yang akan dibuat

menggunakan algoritma K-nearest neighbor (K-NN).


Algoritma ini dipilih karena K-NN merupakan suatu model pendukung keputusan

yang dapat mengkasifikasikan data berdasarkan jarak terdekat. Algoritma K-nearest

neighbor (K-NN) memiliki tujuan yaitu untuk mengklasifikasi objek baru berdasarkan

atribut dan training sample atau data latih (Kartika et al., 2017).

Dengan dasar dari uraian yang telah dijelaskan, Hal ini lah yang membuat penulis

akan melakukan observasi dan membuat pengembangan untuk memberi solusi

permasalahan dan untuk mempermudah perusahaan dalam mengambil keputusan

berdasarkan kriteria dengan mengangkat judul “Penerapan Data Mining

Memprediksi Harga Pompa Air Setiap Tahunnya Pada Toko Hanan Aquarium

Dengan Metode K- Nearest Neighbor (Knn)” , sebagai tugas project .


1.2 Rumusan Masalah

Adapun rumusan masalah dalam project ini adalah Bagaimana cara

merekomendasikan topik penelitian menggunakan algoritma K-NN berdasarkan data

harga pompa air setiap tahunnya.

1.3 Batasan Masalah

Adapun batasan masalah dari project ini adalah :

Dalam merekomendasikan topik penelitian ini menggunakan nilai harga pada

tahun – tahun sebelumnya, lalu meimplementasikan ke dalam metode K-NN.

1.4 Tujuan Penelitian

Adapun tujuan dari penelitian ini dibuat untuk:

1. Menerapkan metode K - Nearest Neighbor dalam memprediksi harga pompa air..

2. Merancang dan menerapkan data mining dalam memprediksi harga pompa air di

toko Hanan Aquarium.

1.5 Manfaat Penelitian

Berikut adalah hasil dari manfaat penelitian ini:

1. Diharapkan dapat membantu owner untuk memperoleh informasi mengenai harga

pompa air setiap tahun nya.

2. Untuk memprediksi harga pompa air menggunakan metode K-Nearest Neighbor


1.6 Sistematika Penulisan

Sistematika penulisan project ini adalah untuk merangkum seluruh penugasan

project dan secara garis besar project ini adalah berisikan tentang:

BAB 1 : PENDAHULUAN

Bab ini berisi tentang mendeskripsikan latar belakang masalah,

rumusan masalah, batasan masalah, tujuan masalah, manfaat dan

sistematika penulisan.

BAB 2 : LANDASAN TEORI

Bab ini berisikan mengenai konsep dasar dan teori – teori yang

mendukung pembahasan project ini.

BAB 3 : METODE PENELITIAN

Bab ini berisikan tentang kerangka kerja penelitian dan uraian kerja

project.

BAB 4 : ANALISA DAN PERANCANGAN

Bab ini berisi analisa data dengan metode K-Nearest Neighbordalam,

perancangan sistem, perancangan database, dan pembangunan sistem.

BAB 5 : HASIL DAN PEMBAHASAN

Bab ini membahas analisa hasil dan pembahasan sitem yang telah

dirancang, tampilan interface program, dan pengujian sistem.

BAB 6 : PENUTUP

Bab ini berisi tentang kesimpulan yang diambil dari pembahasan

masalah serta saran untuk tindak lanjut terhasap sistem yang dibuat.
BAB 2
LANDASAN TEORI

2.2 Data Mining

Data mining adalah suatu proses dalam mencari pengetahuan menggunakan

pola dari data dalam jumlah yang besar. Sumber data yang digunakan berupa database,

data warehouse, web, atau penyimpanan informasi lainnya. Data mining sering juga

disebut dengan Knowledge Discovery from Data atau KD (Han et al., 2014). Adapun

proses dalam KDD sebagai berikut :

a. Data cleaning (untuk menghilangkan data yang tidak konsisten)

b. Data integration (berbagai data dapat digabungkan)

c. Data selection (data yang relevan diambil dari database)

d. Data transformation (transformasi data untuk di proses pada data mining)

e. Data mining (proses mencari pola menggunakan metode tertentu)

f. Pattern evaluation (mengindentifikasi pola-pola yang menarik dan bakal

menjadi pengetahuan)

g. Knowledge presentation (teknik visualisasi dan representasi dalam menyajikan

pengetahuan yang diperoleh kepada pengguna)

Data mining terbagi dalam beberapa tugas yang dapat dilakukan, diantaranya

(Kantardzic, 2020) :

a. Classification yaitu fungsi yang mengklasifikasikan suatu item menjadi

beberapa kelas target yang telah ditentukan

b. Regression yaitu fungsi yang mengkategorikan data ke dalam variabel prediksi


c. Clustering yaitu fungsi yang mengidentifikasi data ke beberapa cluster

d. Summarization yaitu fungsi tambahan untuk menemukan deskripsi subset data

e. Depedency modeling yaitu suatu model menggambarkan hubungan antara

variabel dalam data set

f. Change and deviation yaitu untuk menemukan perubahan dalam data set.

2.3 K- Nearest Neighbor

K- Nearest Neighbor K-nearest neighbor merupakan algoritma supervised

learning di mana dalam melakukan klasifikasi berdasarkan data training. Setiap data

training mewakili satu dari data kelas, ketika data uji tidak diketahui kelasnya maka K-

NN akan mencari data yang terdekat dengan data uji. Kedekatan ini didefinisikan

dalam istilah euclidean distance, di mana euclidean distance berada diantara dua titik,

X = (x1,x2,… …,xn) dan Y = (y1,y2,… …,yn) dilambangkan oleh d(X,Y). Klasifikasi

nearest neighbor memberikan nilai atau bobot yang sama setiap masing-masing atribut,

sehingga dapat digunakan untuk melakukan prediksi (Gorade et al., 2017). Algoritma

K-NN merupakan suatu metode yang dilakukan untuk klsifikasi terhadap objek baru

berdasarkan (K) tetangga terdekat. K-NN termasuk dalam algoritma supervised

learning, di mana dalam melakukan klasifikasi berdasarkan mayoritas dari kategori K-

NN. Langkahlangkah untuk menghitung algoritma K-NN yaitu sebagai berikut:

1. Menentukan nilai K (jumlah tetangga terdekat)

2. Menghitung jarak pada semua objek terhadap data training

3. Mengurutkan objek-objek ke dalam kelompok yang mempunyai jarak terdekat

4. Mengumpulkan kategori Y (klasifikasi nearest neighbors)


5. Memilih kategori mayoritas sebagai klasifikasi objek baru

Jumlah nilai K dan rumus jarak dari data pengujian ditentukan dengan

menggunakan 4 rumus perhitungan yaitu, rumus Euclidean Distance,

Minkowski, Manhattan dan Chebyshev (Rahmawati et al., 2021).

Rumus Euclidien Distance dapat dilihat pada persamaan 1 :

D(a,b) = √(𝑎1 − 𝑏1) 2 + (𝑎2 − 𝑏2) 2 + ⋯ + (𝑎𝑛 − 𝑏𝑛) 2

Rumus Minkowski dapat dilihat pada persamaan 2 :

D(a,b) = √(𝑎1 − 𝑏1) 𝑝 + (𝑎2 − 𝑏2) 𝑝 + ⋯ + (𝑎𝑛 − 𝑏𝑛) 𝑝

Rumus Manhattan dapat dilihat pada persamaan 3 :

D(a,b) = |𝑎1 − 𝑏2 | + ⋯ + |𝑎𝑛 − 𝑏𝑛|

Rumus Chebyshev dapat dilihat pada persamaan 4 :

D(a,b) = max (|𝑎1 − 𝑏2 | + ⋯ + |𝑎𝑛 − 𝑏𝑛|)

Keterangan :

D(a,b) = Jarak dari kedua parameter a dan b

a = Nilai data pada dataset

b = Nilai data tes objek

n = Batas jumlah banyaknya data

2.4 Structured Query Language (MySQL)

MySQL adalah perangkat lunak sistem manajemen basis data SQL (BDMS) yang

multithread, dan multi-user. MySQL adalah implementasi dari sistem manajemen basis

data relasional yang artinya MySQL menyimpan datanya dalam bentuk tabel-tabel

yang saling berhubungan. SQL adalah sebuah konsep pengoperasian basis data
terutama untuk pemilihan atau seleksi dan pemasukan data, yang memungkinkan

pengoperasian data dikerjakan dengan mudah secara otomatis. (Edy Winarno dan Ali

Zaki, 2014). Perintah-perintah dasar Structured Query Language (SQL) yang di

gunakan pada MySQL adalah :

1. Create database, yaitu perintah untuk membuat database baru.

2. Drop database, yaitu perintah untu k menghapus database.

3. Create table, yaitu perintah untuk membuat tabel baru.

4. Describe, yaitu perintah yang berfungsi untuk menampilkan deskripsi table.

5. Alter table, yaitu perintah yang berfungsi melakukan modifikasi tabel.

6. Drop table, yaitu perintah untuk menghapus table.

7. Delete, yaitu perintah untuk menghapus record dari sebuah table

8. Grant, yaitu perintah yang berfungsi memberikan privilege akses kepada pengguna

table dan dapat juga digunakan untuk membuat pengguna baru.

9. Lock table, yaitu perintah yang untuk menutup akses pengguna tabel.

10. Unlock table, yaitu perintah yang membuka akses sebelumnya di kunci.

11. Insert into, yaitu perintah untuk memasukkan data ke dalam tabel.

12. Load data infiled, yaitu perintah untuk membaca data dari file teks.

13. Select, yaitu perintah untuk menampilkan record dari suatu tabel.

14. Update, yaitu perintah y untuk melakukan update data field dari sebuah table.

2.5 PHP (Hypertext Prepocessor)

PHP merupakan singkatan dari PHP Hypertext Preprocessor. Ia merupakan bahasa

skrip yang ditempatkan dalam server dan diproses di server. Hasilnya akan dikirimkan
ke klien, tempat pemakai menggunakan browser. Pada awalnya, PHP dirancang untuk

diintegrasikan dengan web server Apache. Namun, belakangan PHP juga dapat bekerja

dengan web server seperti PWS (Personal Web Server), IIS (Internet Information

Server), dan Xitami.Secara khusus, PHP dirancang untuk membentuk aplikasi web

dinamis.Artinya, ia dapat membentuk suatu tampilan berdasarkan permintaan terkini.

PHP sebenarnya bisa digunakan secara command line. Artinya,skrip PHP dapat

dijalankan tanpa melibatkan web server maupun browser. Kelahiran PHP disusun

tahun 1994 dan merupakan hasil kerja keras satu orang, RasmusLerdorf. Kemudian

dilanjutkan oleh orang-orang lain dan telah melewati tiga kali penyusunan ulang secara

besar untuk memberikan hasil produk yang matang seperti yang ada sekarang ini. Pada

januari 2001, PHP digunakan hampir lima juta daerah di seluruh dunia, dan jumlah ini

terus bertambah. PHP merupakan produk Open Source. PHP awalnya berarti Personal

Home Page, tetapi diubah dengan penamaan konvensi rekursif GNU dan sekarang

PHP ialahPHP Hypertext Preprocessor.Beberapa dari pesaing PHP ialah Perl,

Microsoft Active Server Pages (ASP), Java Server Pages (JSP) dan Allaire Cold

Fusion (Herianto 2015).

2.6 Use Case Diagram

Use Case Diagram merupakan pemodelan untuk kelakuan (behavior) sistem

informasi yang akan dibuat. Use case digunakan untuk mengetahui fungsi apa saja yang

ada didalam sebuah sistem informasi. Berikut adalah simbol-simbol yang ada pada

diagram use case (Rosa dan M. Shalahudin , 2014:155).


Tabel 2.1 Daftar simbol Use Case diagram

SIMBOL KETERANGAN
Actor Actor adalah pengguna sistem sepertihalnya manusia, jika sebuah

sistem berkomunikasi dengan aplikasi lain dan membutuhkan input

dan output maka aplikasi tersebut juga bisa di anggap sebagai actor.

Use Case Use Case di gambarkan sebagai lingkaran elips.

Association Assosiasi digunakan sebagai pemhubung Actor dan Use Case

Generalization Hubungan dimana objek anak berbagi prilaku dan struktur data

objek.

System Menspesifikasikan paket yang menampilkan sistem secara terbatas.

Note Elemen fisik yang eksis saat aplikasi di jalankan dan mencerminkan

suatu sumber daya komputasi.

Sumber : Rekayasa perangkat lunak, Rosa A.S, 2018

2.7 Activity Diagram

Activity diagram atau aktivitas diagram merupakan workflow (aliran kerja) sebuah

sistem atau proses bisnis yang ada pada menu perangkat lunak. Yang perlu di

perhatikan pada activity diagram ini adalah bahwa diagram aktivitas menggambarkan

aktivitas sistem bukan apa yang dilakukan actor, jadi aktivitas diagram Activity

berfokus pada aktifitas-aktifitas yang terjadi yang terkait dalam suatu proses tunggal.

dengan kata lain, diagram ini menunjukkan bagaimana aktifitas-aktifitas tersebut

bergantung satu sama lain.


Tabel 2.2 Daftar simbol Activity diagram

SIMBOL KETERANGAN
Status Awal Status awal adalah aktivitas sistem suatu diagram.

Aktivitas Aktivitas yang dilakukan sistem yang di awali dengan kata kerja.

Percabangan/Decision Percabangan dimana jika ada pilihan aktivitas lebih dari satu.

Penggabungan/Join Penggabungan lebih dari satu aktivitas digabungkan jadi satu.

Status Akhir Status Akhir yang di lakukan sistem,sebuah diagram aktivitas

memiliki suatu akhir.

Swimlane Memisahkan organisasi bisnis yang bertanggung jawab terhadap

Nama Swimline aktifitas yang terjadi.


Nama Swimline

Sumber : rekayasa perangkat lunak, Rosa, A.S, 2018

2.8 Class Diagram

Class diagram menurut Satzinger dalam buku rekayasa perangkat lunak (2010:141)

“merupakan sebuah objek-objek yang sejenis. Sebuah objek memiliki keadaan sesaat

(state) dan perilaku (behavior)”. Objek adalah nilai tertentu dari setiap attribute kelas

entity.
Tabel 2.3 Daftar simbol class diagram

SIMBOL KETERANGAN
Kelas Kelas pada struktur sistem
Nama_kelas

+atribut

+operasi()

Antarmuka / interface Interface dalam pemrograman berorientasi objek

Asosiasi berarah / directed association Relasi dengan makna kelas satu digunakan oleh
kelas yang lain, assosiasi biasanya juga disertai
dengan multiplicity
Asosiasi / association Relasi antar kelas dengan makna umum,
asosiasi biasanya juga disertai dengan
multiplicity.
Kebergantungan / defedency Relasi antar kelas dengan makna
kebergantungan antar kelas

Generealisasi Relasi antarkelas dengan makna semua


bagian (whole-part)

Agregasi / aggregation generealisasi- spesialisai (umum khusus)

Sumber : rekayasa perangkat lunak, Rosa, A.S, 2018


2.9 Flowchart

Menurut Jogiyanto (dalam Khanna Tiara, Tuti Nurhaeni dan Ika amalia di Jurnal

Technomedia, 2016:72) “(Program flowchart) Merupakan bagan aliryang mirip dengan

bagan alir sistem, yaitu untuk menggambarkan prosedur didalam sistem”.Menurut

Wibowo (dalam Diding Kusnady, S. Pd, MM dan Diding Kusnady, S. Pd, MM,

2018:10) “Flowchart atau bagan alir adalah representasi grafik dari system yang

mendeskripsikan relasi fisik diantara entitas – entitas intinya. Bagan alir dapat
digunakan untuk menyajikan aktivitas manual, termasuk catatan akuntansi (dokumen,

jurnal, buku besar, dan file), tersebut”.dalam flowchart yaitu sebagai berikut:

Tabel 2.4 Simbol-Simbol Flowchart

SIMBOL KETERANGAN
Terminal Simbol: Untuk memulai atau
mengakhiri suatu program

Proses: Suatu simbol yang enunjukan setiap


pengolahan yang dilakukan oleh komputer.

Data: Input-output, untuk memasukkan data atau


menunjukan hasil dari suatu proses.

Decision: Suatu kondisi yang akan menghasilkan


beberapa kemungkinan atau pilihan

Connector: Suatu prosedure atau masuk atau


keluar melalui symbol ini dalam lembar yang
sama
Display: Untuk output (tampilan), yang
ditunjukan kesatuan device seperti printer,
plotter, dan lain-lain.
Document: Merupakan simbol untuk data yang
berbentuk kertas maupun informasi.

Off-page Connector: Untuk menunjukan


hubungan arus proses yang terputus pada
halaman yang berbeda.

Predefined process: Untuk proses yang detilnya


dijelaskan secara terpisah.

Magnetic Disk: penyimpanan data secara tetap.

Sumber : M.fitra, 2019


BAB 3
METODOLOGI PENELITIAN

3.1 Kerangka Kerja Penelitian

Langkah- langkah yang dilakukan dalam penelitian ini dapat dilihat pada blok

diagram dibawah ini:

Kajian Pustaka Analisa Masalah

Pengumpulan Data

Analisa Data

Penerapan
Metode KNN

Perancangan
Sistem

Implementasi
Sistem

Pengujian Sistem

Laporan Hasil
Penelitian

Gambar 3.1 Tahapan Penelitian


3.2 Uraian Kerangka Kerja

Dari gambar 3.1 adalah langkah-langkah proses penelitian yang akan dijelaskan

sebagai berikut:

1. Kajian Pustaka

Kajian pustaka yang telah terkait dengan konsep Data Mining dengan metode

KNN, ini memliki topic tentang memprediksi harga pompa air dan permasalahan

lainnya yang terkait dengan penelitian ini Kajian pustaka dilakukan dengan

menelaah berdasarkan dari jurnal-jurnal dan hasil penelitian lainnya sebagai

referensi penelitian terdahulu, buku teks, sumber online (internet) dan sumber

lainnya yang terkait dengan topik penelitian yang di bahas.

2. Analisa Masalah

Dalam memprediksi harga pompa air, perusahaan hanya melakukan secara

subyektif dengan beberapa pertimbangan, yaitu dari segi beberapa kriteria saja.

Namun di peroleh fakta bahwa ketika diberlakukan, tidak sesuai dengan yang

diinginkan oleh perusahaan dan kurangnya kestabilan harga. Oleh karena itu

dirumuskanlah permasalahan dalam penelitian ini yaitu bagaimana melakukan

mempertimbangkan berbagai kriteria menggunakan metode KNN.


3. Pengumpulan Data

Tahap ini dilakukan untuk mengumpulkan data-data yang dibutuhkan untuk

penelitian. Adapun data-data yang dibutuhkan peneliti antara lain :

a. Data Primer

Data primer merupakan data yang diperoleh langsung dari sumber asli (tanpa

melalui media perantara). Data primer dapat berupa opini subjek (orang)

secara individual atau kelompok, Data ini didapat dari metode wawancara.

b. Data Sekunder

Data sekunder merupakan data yang diperoleh peneliti secara tidak langsung.

Data sekunder tersebut biasanya berbentuk dokumen, file, arsip atau catatan-

catatan perusahaan. Data ini diperoleh melalui dokumentasi perusahaan dan

literatur yang berhubungan dengan penelitian selama periode waktu tertentu.

c. Data Numerik

Data yang diperoleh dalam bentuk matematis yang mendukung proses

penyelesaian dalam menentukan pemberian bonus karyawan.

4. Analisa Data

Dalam memprediksi harga pompa air belum menggunakan sistem sama sekali.

Pengelolaan data secara perkiraan mengakibatkan permasalahan yang sering

muncul yaitu dalam proses memberikan harga yang hanya memprediksi

keuntungan pihak perusahaan saja membutuhkan waktu yang lama, juga hasil yang

didapat kurang akurat karena bisa saja terjadi banyak kekeliruan disana.

.
5. Penerapan metode KNN

Penerapan Metode K-Nearest Neighbor. Adapun penerapan metode K-NN melalui

beberapa langkah:

a. Tentukan parameter k

b. Hitung jarak antara data yang akan dievaluasi dengan semua pelatihan

c. Urutkan jarak yang terbentuk (urut naik)

d. Tentukan jarak terdekat sampai urutan k

e. Pasangkan kelas yang bersesuaian

f. Cari jumlah kelas dari tetangga yang terdekat dan tetapkan kelas tersebut

sebagai kelas data yang akan dievaluasi.

6. Perancangan Sistem

Hasil analisis sistem yang telah diperoleh, kemudian peneliti menggambarkan

perancangan sistem yang akan digunakan.

a. Perancangan UML

Data Tahap ini akan dibuat desain diagram Unified Modelling Language (UML)

dengan menggunakan usecase diagram, activity diagaram dan class diagram dari

sistem yang akan dikembangkan.

b. Perancangan Database

Tahap ini akan dibuat table table yang dibutuhkan untuk database yang akan

digunakan pada aplikasi.

c. Perancangan Input Output Tahap ini adalah melakukan perancangan input

data yang akan berupa rancangan form juga rancangan output yang berupa

hasil dari sistem.


7. Implementasi Sistem

Implementasi sistem merupakan realisasi pembuatan sistem berdasarkan desain

yang dibuat.

8. Pengujian Sistem

Pengujian merupakan tahapan dimana aplikasi akan dijalankan, tahap ini

diperlukan untuk mengetahui apakah sistem sesuai dengan tujuan yang ingin

dicapai. Pada pengujian ini dilakukan pengujian metode dan pengujian sistem.

Pengujian metode dilakukan dengan cara membuat proses perhitungan masing-

masing metode yaitu metode WP sehingga dapat terlihat jelas proses perhitungan

dan persamaan hasil output berupa perankingan dari masing-masing metode

tersebut. Dari pengujian masingmasing metode dapat diambil kesimpulan apakah

penggabungan kedua metode ini lebih efektif digunakan atau tidak.

9. Laporan Hasil Penelitian

Ini berisikan tentang semua hasil laporan yang telah diuji dan di rangkumkan

secara akurat.
3.3 Tempat Penelitian

Jl. Medan - Binjai No.29, Paya Geli, Kec. Sunggal, Kabupaten Deli Serdang,

Sumatera Utara 20351

Gambar 3.2 Maps Toko Hanan Aquarium

Anda mungkin juga menyukai