1) 2)
Supriyanta Noor Hasan
1)
Program Studi Manajemen Informatika
Akademi Manajemen Informatika dan Komputer ”BSI Yogyakarta”
Jl. Ringroad Barat, Ambarketawang, Gamping, Sleman, Yogyakarta
supriyanta.spt@bsi.ac.id
2)
Program Studi Manajemen Informatika
Akademi Manajemen Informatika dan Komputer ”BSI Yogyakarta”
Jl. Ringroad Barat, Ambarketawang, Gamping, Sleman, Yogyakarta
noor.nhs@bsi.ac.id
ABSTRAK
Setiap hari manusia selalu melakukan transaksi, setiap transaksi selalu melibatkan data yang ada dan akan
menambah data baru. Tumpukan data yang banyak dalam database bila di gali akan di dapatkan berbagai
informasi penting yang dapat di jadikan dasar pengambilan keputusan. Data mining adalah ilmu untuk
menambang data, berbagai metoda bisa di pakai sesuai dengan tujuan akhir pengolahan data. Database harus di seleksi, di
bersihkan, di transformasi, di cari polanya kemudian di evaluasi. Dari data yang sudah di olah bisa di pakai untuk
melakukan deskripsi, estimasi, prediksi, klasifikasi, clustering, asosiasi. Berbagai metode bisa dilakukan untuk data
mining, disesuaikan dengan tujuannya, salah satunya Regresi Linier Sederhana. Penulisan ini bertujuan memberi contoh
data mining untuk memprediksi, menggunakan contoh memprediksi waktu yang ditempuh untuk mengantarkan pesanan
pada jarak tertentu. Perhitungan dengan berdasarkan data-data yang ada memakai rumus sederhana. Data yang ada di
olah, di hitung dengan rumus regresi linier sederhana dan di dapatkan perkiraan waktu untuk menempuh jarak
tertentu.
I. PENDAHULUAN lainnya.
Data mining adalah suatu teknik yang merupakan
gabungan dari metode-metode analisis data secara Trend teknologi komputer mengarah pada pentingnya
statistik dengan algoritma-algoritma untuk memproses data pemakaian data mining. Agar mudah memahami tentang
berukuran besar. Data mining merupakan proses pengertian data mining dan penerapannya maka tulisan ini
menemukan informasi atau pola yang penting dalam basis membahas dan memberikan contoh tentang penggunaan
data berukuran besar. Data- data yang ada di gali, di olah, di data mining untuk memprediksi waktu yang diperlukan untuk
analisa dan akan di dapatkan berbagai informasi yang mengantar pesanan bila di hitung berdasarkan data- data
penting. Tidak seperti statistik yang menggunakan sampel yang ada.
populasi sebagai datanya, data mining membutuhkan data
yang besar, semakin besar datanya maka proses II. KAJIAN LITERATUR
penambangan akan semakin efektif menemukan pola- pola Banyak definisi dari istilah data mining dan belum ada
tertentu. yang dibakukan atau disepakai semua pihak. Namun
demikian istilah ini memiliki hakikat (notion) sebagai disiplin
Manfaat data mining misalnya : di militer untuk
ilmu yang tujuan utamanya adalah untuk menemukan,
mempelajari apa saja yang menjadi faktor utama
menggali atau menambang pengetahuan dari data atau
dalam ketepatan sasaran pengeboman, agen intelejen untuk informasi yang kita miliki. Kegiatan inilah yang menjadi
menangkap dan memilah informasi-informasi yang sesuai garapan atau perhatian utama dari disiplin ilmu data
dengan apa yang ingin dipelajari, spesialis keamanan mining. (Susanto, Suryadi, 2010)
jaringan untuk melihat paket data mana yang berpotensi
memicu ancaman, analis kartu kredit untuk memilah calon Fungsi DATA MINING:
nasabah kartu kredit yang berpotensi melakukan kredit 1. Pola dan trend data sering di
macet, pelaku retail untuk melihat karakteristik dan deskripsikan.Deskripsi tersebut sangat membantu dalam
perilaku pembelinya, sehingga dapat selalu menjual produk menjelaskan pola dan trend yang terjadi. Model data
yang diinginkan oleh customer, marketing untuk mengenali mining harus setransparan mungkin, dimana hasilnya
individu yang mempunya kemiripan faktor dengan customer dapat mendes-kripsikan pola dengan jelas.
terbaik yang kita miliki, faktor ini dapat berupa faktor 2. Estimasi mirip dengan klasifikasi kecuali variabel
demografi, faktor usia, faktor kelas pendapatan, atau faktor targetnya numerik ketimbang kategorikal. Model yang
dibangun menggunakan record yang lengkap, yang kebiasaan suatu entitas dan menetapkan sejumlah norm
menyediakan nilai variabel target dan predictor. Untuk melalui pattern discovery. Sampel yang berdeviasi
observasi yang baru, estimasi nilai variabel target dari norm lalu diidentifikasi sebagai tidak biasa.
ditentukan, berdasarkan nilai-nilai predictor. teknik Deviation Detection melalui visualisasi melalui
3. Prediksi mirip dengan klasifikasi dan estimasi, kecuali parallel coordinates, scatterplots, dan surface
dalam prediksi, hasil terjadi di masa datang. plots
4. Klasifikasi, variabel targetnya. merupakan .
kategorikal. Model data mining memeriksa set record IV. PEMBAHASAN
yang besar, tiap record mempunyai informasi variabel a. TAHAP-TAHAP DATA MINING
target dan set input atau variabel predictor. Data Mining adalah suatu rangkaian proses, yang
5. Clustering merupakan pengelompokkan record, observasi, terdiri dari beberapa tahap :
atau kasus ke dalam kelas-kelas objek yang mirip. 1. Data Selection
Clustering berbeda dengan klasifikasi dimana Pemilihan atau seleksi data dari sekumpulan data
dalam clustering tidak terdapat variabel target. operasional perlu dilakukan sebelum tahap penggalian
Clustering mencoba menyegmentasi seluruh set data ke informasi dimulai. Data hasil seleksi yang akan
dalam subgroup atau cluster yang relatif homogen, digunakan untuk proses data mining, disimpan
dimana kemiripan antar record dalam cluster dimaksimasi dalam suatu berkas, terpisah dari basis data
dan kemiripan record di luar cluster diminimasi. operasional. Mengambil sebagian data yang di
6. Asosiasi merupakan suatu tugas untuk menemukan perlukan dan dipisahkan.
atribut-atribut yang “terjadi” bersamaan. Tugas asosiasi 2. Pre-processing/ Cleaning
mencoba untuk menemukan aturan untuk Sebelum proses data mining dapat dilaksanakan,
mengkuantifikasi hubungan antara dua atau lebih perlu dilakukan proses cleaning pada data yang menjadi
atribut. Aturan asosiasi berbentuk “If antecedent, then fokus penelitian. Proses cleaning mencakup antara
consequent”, bersama-sama dengan ukuran support lain membuang duplikasi data, memeriksa data yang
dan confidence yang berhubungan dengan aturan. inkonsisten, dan memperbaiki kesalahan pada data,
seperti kesalahan cetak atau tipografi. Juga
III. METODE DATA MINING dilakukan proses enrichment, yaitu proses
Banyak teknik dan metode yang ada untuk “memperkaya” data yang sudah ada dengan data atau
melakukan berbagai jenis tugas data mining. Metode ini informasi lain yang relevan dan diperlukan, seperti data
dikelompokkan dalam 3 paradigma utama data mining atau informasi eksternal.
yaitu : Predictive Modeling, Discovery, dan Deviation 3. Transformation
Detection. Coding adalah proses transformasi pada data yang telah
1. Predictive Modeling, menghasilkan klasifikasi atau dipilih, sehingga data tersebut sesuai untuk proses
prediksi. Tujuan dari predictive modeling adalah data mining. Proses coding merupakan proses kreatif
menemukan pola yang melibatkan variabel untuk dan sangat tergantung pada jenis atau pola informasi
memprediksi dan mengklasifikasi perilaku masa yang akan dicari dalam basis data.
depan dari sebuah entitas. Ada dua tipe masalah yang 4. Data mining
diselesaikan oleh predictive modeling: klasifikasi dan Data mining adalah proses mencari pola atau informasi
regresi. Klasifikasi melibatkan model pembelajaran menarik dalam data terpilih dengan menggunakan
yang memetakan (atau mengklasifikasi) data teknik atau metode tertentu. Teknik, metode, atau
contoh ke dalam satu atau beberapa kelas yang telah algoritma dalam data mining sangat bervariasi.
didefinisikan. Sebagai contoh, bank dapat Pemilihan metode atau algoritma yang tepat sangat
menggunakan skema klasifikasi untuk menentukan bergantung pada tujuan dan proses secara
pengajuan pinjaman yang akan disetujui. Teknik keseluruhan.
klasifikasi meliputi Naive Bayesian, neural networks 5. Interpretation/ Evaluation
dan decision trees. Regresi melibatkan model Pola informasi yang dihasilkan dari proses data mining
yang memetakan data contoh ke prediksi real- valued. perlu ditampilkan dalam bentuk yang mudah
Teknik regresi meliputi neural networks dan decision dimengerti oleh pihak yang berkepentingan. Tahap ini
(atau regression) trees. merupakan bagian dari proses yang disebut dengan
2. Discovery adalah pendekatan eksploratoris untuk interpretation. Tahap ini mencakup pemeriksaan apakah
analisis data. Aplikasi discovery menggunakan teknik pola atau informasi yang ditemukan bertentangan
yang menganalisis data set yang besar untuk dengan fakta atau hipotesa yang ada sebelumnya.
menemukan association rules (atau pola), atau
menemukan kluster dari sampel yang dapat Berikut ini gambar tahapan proses data mining, di
dikelompokan. Hasil dari metode discovery umumnya baca dari bawah ke atas, Data di seleksi dan di
dimaksudkan untuk pengguna. Walau begitu, clearing kemudian transformasi, data mining dan
hasilnya juga dapat diaplikasikan ke metode data akihir bisa di interpresasikan.
mining yang lain.
3. Deviation Detection melakukan deteksi anomali secara
otomatis. Tujuannya untuk mengidentifikasi
sebagai sumbu X (dalam kilometer) dan waktu tempuh waktu tempuh di gambar sebagai titik, selanjutnya
sebagai sumbu Y (dalam menit), setiap pasang jarak dan digambarkan sebagai berikut :
.
Gambar 2 memperlihatkan tiga buah garis lurus (waktu) seiring bertambahnya nilai sumbu X (jarak).
yaitu A, B dan C, diantara ketiganya tampak garis B
merupakan garis yang lebih mendekati titik-titik yang ada,
garis A terlalu jauh dari semua titik, garis C justru tidak β0 = Y - β1X… persamaan (1)
menggambarkan kecenderungan naiknya nilai sumbu Y
2
Dari tabel 1 kemudian di hitung YiXi dan X1 untuk
menyelesaikan rumus di atas dan di dapatkan tabel
kedua sebagai berikut :
Tabel 2
[3] Sulianta, Feri & Juju, Dominikus, 2010, Data [4] Susanto, Sani dan Suryadi, Dedy, 2010, Pengantar Data
Mining Meramalkan Bisnis Perusahaan, Elex Mining Menggali Pengetahuan Dari Bongkahan Data,
Media Komputido, Jakarta Penerbit Andi, Yogyakarta