Anda di halaman 1dari 8

PENGERTIAN, IMPLEMANTASI, DAN ILMU-ILMU YANG BERKAITAN

DENGAN DATA MINING

Dosen Pengampu : Drs. Muhamad Fauzan M.Sc.St.

Disusun oleh:

Krisna Nugraha

NIM 16305141072

PRODI MATEMATIKA JURUSAN PENDIDIKAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERISTAS NEGERI YOGYAKARTA

2019
PENGERTIAN, IMPLEMANTASI, KEBUTUHAN, DAN ILMU-ILMU YANG
BERKAITAN DENGAN DATA MINING

Krisna Nugraha
Jurusan Matematika FMIPA UNY
Email : krisna.nugraha2016@student.uny.ac.id
Dosen Pengampu : Drs. Muhamad Fauzan M.Sc.St.

ABSTRAK

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan
sedikit barang berharga dari sejumlah besar material dasar. Karena itu DM sebenarnya
memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial
intelligent), machine learning, statistik dan database.
Data mining mengidentifikasi fakta-fakta atau kesimpulan-kesimpulan yang
disarankan berdasarkan penyaringan melalui data untuk menjelajahi pola-pola atau
anomali-anomali data. Data mining mempunyai 5 fungsi yaitu Classification,
Clusstering, Association, Regression, dan Forcasting. Saat ini data mining banyak
diaplikasikan pada berbagai bidang seperti bisnis, seni dan hiburan, sains dan teknik,
jurnalistik, dan politik.

Kata Kunci : data mining, pengertian data mining, penerapatan data mining,
implemtasi, ilmu-ilmu data mining
BAB I

PENDAHULUAN

A. LATAR BELAKANG
Manusia telah "secara manual" mengekstrak pola dari data selama berabad-
abad, tetapi meningkatnya volume data yang di zaman modern telah menyerukan
pendekatan yang lebih otomatis. Metode awal untuk mengidentifikasi pola-pola dalam
data termasuk Bayes 'teorema (1700) dan Analisis Regresi (1800). Proliferasi, di
mana-mana dan meningkatkan kekuatan teknologi komputer telah meningkat
pengumpulan data dan penyimpanan. Seperti kumpulan data telah tumbuh dalam
ukuran dan kompleksitas, tangan langsung-analisis data telah semakin telah ditambah
dengan tidak langsung, pemrosesan data otomatis.
Data mining adalah proses menerapkan metode ini untuk data dengan maksud
untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah
proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin
penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan
dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan
penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan
pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang
penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan
riset pasar.
Dengan latar belakang tersebut maka tujuan artikel ini adalah untuk
menambah pengetahuan dan wawasan mengenai data mining.

B. RUMUSAN MASALAH
1. Bagaimana pengertian data mining ?
2. Bagaimana implementasi data mining ?
3. Bagaimana kebutuhan dalam data mining ?
4. Apa saja Ilmu-ilmu yang berkaitan dengan data mining ?

BAB II

PEMBAHASAN
A. Data Mining
Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan
definisi berbeda tentang data mining. Sebagian ahli menyatakan bahwa data mining
adalah langkah analisis terhadap proses penemuan pengetahuan di dalam basis data
atau knowledge discovery in database yang disingkat KDD ( Fayyad et al. 1996).
Pengetahuan berupa pola data atau relasi antar data yang valid (yang tidak diketahui
sebelumnya).
Data mining ditujukan untuk mngekstrak (mengambil intisari) pengetahuan
dari sekumpulan data sehingga didapatkan struktur yang dapat dimengerti manusia
serta meliputi basis data dan managemen data, prapemprosesan data, pertimbangan
model dan inferensi, ukuran ketertarikan, pertimbangan kompleksitas,
pascapemrosesan terhadap struktur yang ditemukan, visualisasi, dan online updating
(Dr. Suyanto, 2019).

B. Fungsi dan Tujuan Data Mining


1. Fungsi Data mining
Data mining mengidentifikasi fakta-fakta atau kesimpulan-kesimpulan yang
disarankan berdasarkan penyaringan melalui data untuk menjelajahi pola-pola
atau anomali-anomali data. Data mining mempunyai 5 fungsi :
a. Classification
Classification, yaitu menggeneralisasi struktur yang diketahui untuk
diaplikasikan pada data-data baru. Misalkan klasifikasi penyakit kedalam
sejumlah jenis, klasifikasi email kedalam spam apa bukan.
b. Clusstering
Clusstering, yaitu mengidentifikasi kelompok-kelompok dari barang-barang
atau produk-produk yang mempunyai karakteristik khusus (clusstering
berbeda dengan classification, dimana pada clusstering tidak terdapat definisi-
definisi karakteristik awak yang diberikan pada waktu classification.)

c. Association
Association, yaitu mengidentifikasi hubungan antara kejadian-kejadian yang
terjadi pada suatu waktu, seperti isi-isi dari keranjang belanja.
d. Regression
Regression, yaitu menemukan suatu fungsi yang memodelkan data denngan
galat (kesalahan prediksi) seminimal mungkin.
e. Forecasting
Forcasting memperkirakan nilai pada masa yang akan datang berdasarkan
pola-pola dengan sekumpulan data yang besar, seperti peramalan permintaan
pasar.

2. Tujuan Data mining


Tujuan data mining antara lain :
a. Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa produksi
padi meningkat di Jawa barat.
b. Confirmatory
Untuk mempertegas hipotesis, seperti halnya 2 kali pendapatan seorang
karyawan lebih suka dipakai untuk menabung dibandingkan dengan 1 kali
pendapatan.
c. Exploratory
Menganalisis data untuk hubungan yang baru yang tidak di harapkan,
seperti halnya pola apa yang cocok untuk kasus penggelapan kartu kredit.

C. Penerapan Data mining

1. Kesehatan
Data mining memiliki potensi besar untuk memperbaiki sistem kesehatan.
Menggunakan data dan analisis untuk mengidentifikasi praktik terbaik yang
meningkatkan perawatan dan mengurangi biaya. Peneliti menggunakan pendekatan
data mining seperti database multi dimensi, pembelajaran mesin, soft computing,
visualisasi data dan statistik. Pertambangan dapat digunakan untuk memprediksi
volume pasien dalam setiap kategori. Proses dikembangkan yang memastikan bahwa
pasien mendapat perawatan yang tepat di tempat yang tepat dan pada saat yang tepat.
Data mining juga dapat membantu perusahaan asuransi kesehatan untuk mendeteksi
kecurangan dan penyalahgunaan.
2. Analisis Market
Analisis pasar adalah teknik pemodelan berdasarkan teori bahwa jika seorang
membeli kelompok item tertentu, maka cenderung membeli kelompok item lainnya.
Teknik ini memungkinkan pengecer memahami perilaku pembelian pembeli.
Informasi ini dapat membantu pengecer mengetahui kebutuhan pembeli dan
mengubah tata letak toko sesuai dengan itu. Dengan menggunakan analisis diferensial
perbandingan hasil antara toko yang berbeda, antara pelanggan dalam kelompok
demografis yang berbeda dapat dilakukan.
3. Pendidikan
Ada bidang baru yang muncul, disebut Educational Data Mining, berkaitan
dengan metode pengembangan yang menemukan pengetahuan dari data yang berasal
dari lingkungan pendidikan. Tujuan EDM diidentifikasi sebagai prediksi perilaku
belajar di masa depan siswa, mempelajari dampak dukungan pendidikan, dan
memajukan pengetahuan ilmiah tentang pembelajaran. Data mining dapat digunakan
oleh sebuah institusi untuk mengambil keputusan yang akurat dan juga untuk
memprediksi hasil siswa. Dengan hasilnya institusi bisa fokus pada apa yang harus
diajarkan dan bagaimana cara mengajarnya. Pola belajar siswa dapat diambil dan
digunakan untuk mengembangkan teknik mengajar mereka.
4. Seni dan hiburan.
Pada bidang seni hiburan, kita bisa membuat sistem klasifikasi yang secara
otomatis mengelompokkan ribuan bahkan jutaan lagu kedalam sejumlah genre atau
mood (suasana hati). Hal ini bisa menghemat banyak waktu dan biaya dalam proses
pemilihan lagu yang tepat. Biasanya akan menggunakan penilaian atau rating jadi
para penikmat musik dapat menikmati musik yang disukai.
5. Sains dan teknik
Data mining banyak digunakan untuk sains dan teknik misalnya seperti
genetika, medis, teknik elektro, dan lain sebagainya. Pada ilmu biologi biasanya ada
suatu masalah yang sangat dikenal adalah pencocokan suatu genetika manusia yang
disebut Dioxiribo nucleic acid (DNA). Suatu teknik yang disebut sequence mining
bisa membantu kita memahami pemetaan hubungan darah antar manusia.

D. Kebutuhan Data Mining


Kebutuhan data mining disebabkan karena :

a. Ketersediaan data yang melimpah, kebutuhan akan informasi (pengetahuan) sebagai


pendukung pengambilan keputusan untuk membuat solusi bisnis
b. Ketersediaan data transaksi dalam volume yang besar
c. Informasi yang penting melahirkan gudang data yang mengintegrasikan informasi
dari sistem yang tersebar untuk mendukung pengambilan keputusan
d. Ketersediaan teknologi informasi yang terjangkau dan dapat diadopsi secara luas.
e. Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan)
sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan
dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari
lahirnya teknologi data mining. Ketersediaan data transaksi dalam volume yang besar:
Bidang-bidang industri yang memiliki data transaksi dalam volume besar ini misalnya
jaringan ritel, telekomunikasi, perbankan, kartu kredit, dll.
f. Sistem manajemen transaksi pada industri tersebut merekord informasi-informasi
rinci yang diperlukan dalam bisnis mereka. Informasi sebagai aset perusahaan yang
penting: Kebutuhan terhadap informasi telah melahirkan gudang data yang
mengintegrasikan informasi dari sistemsistem yang tersebar untuk mendukung
pengambilan keputusan. Seringkali gudang data ini juga dilengkapi dengan data
demografis kustomer dan informasi mengenai rumah-tangga.

E. Ilmu-ilmu yang berkaitan dengan data mining

a. Database
b. Information science
c. High performance computing
d. Visualization
e. Machine learning
f. Statistics
g. Artificial Neural networks
h. Mathematical modeling
i. Information retrieval
j. Pattern recognition
BAB III
KESIMPULAN

Berdasarkan beberapa pengertian tersebut dapat ditarik kesimpulan bahwa data


mining adalah suatu teknik menggali informasi berharga yang terpendam atau
tersembunyi pada suatu koleksi data (database) yang sangat besar sehingga ditemukan
suatu pola yang menarik yang sebelumnya tidak diketahui. Kata mining sendiri berarti
usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar.
Karena itu data mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti
kecerdasan buatan (artificial intelligent), machine learning, statistik dan database.
Beberapa metode yang sering disebut-sebut dalam literatur data mining antara lain
clustering, lassification, association rules mining, neural network, genetic algorithm dan
lain-lain

Daftar Pustaka

Suyanto, 2019. Data Mining Untuk Klasifikasi dan Klasterisasi Data . Bandung:
Informatika.

Rindho, Noor. 2012. Jurnal Implementasi Data Mining Dengan Metode Clustering Untuk
Melakukan Competitive Intellegence Perusahan. Penerbit Sbangkala.
Yogyakarta:Universitas Mercubuana

Budi Santoso, 2007. Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnins.
Yogyakarta: Graha Ilmu.