Anda di halaman 1dari 6

Nama : Tri Rahmadi

NIM : 16305141090
Prodi : Matematika F

DATA MINING : MENGGALI INFORMASI YANG BERHARGA


Tri Rahmadi
Prodi Matematika, Jurusan Pendidikan Matematika,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Yogyakarta
E-mail : tri.rahmadi2016@student.uny.ac.id

Abstrak
Di era digital seperti saat ini, ilmu yang berhubungan dengan data sangat dibutuhkan
di berbagai macam bidang. Data-data tersebut terkumpul sejak dulu sampai sekarang
menumpuk. Data-data yang menumpuk semakin hari semakin banyak sehingga terjadi
ledakan data (big data). Maka diperlukannya ilmu untuk mempelajari data tersebut
sehingga data-data yang menumpuk dapat digali informasi-informasi yang bermanfaat.
Diperluknan ilmu yang dapat mengklasifikasi data, mengklasterisasi data, regresi,
deteksi anomali, aturan asosiasi, dan merangkum data. Ilmu yang dimaksud yaitu data
mining.
Kata kunci : data mining, big data.

A. PENDAHULUAN
1. LATAR BELAKANG
Di era digital seperti saat ini, ilmu yang berhubungan dengan data sangat
dibutuhkan di berbagai macam bidang. Data-data tersebut terkumpul sejak dulu
sampai sekarang hingga menumpuk. Data-data yang menumpuk semakin hari
semakin banyak sehingga terjadi ledakan data. Data yang ada sangat banyak,
namun tidak tahu informasi apa yang ada didalmnya. Maka dari itu diperlukanlah
ilmu yang dapat mempelajari data, sehingga data-data yang menumpuk tersebut
dapat digali informasi yang memiliki nilai dan berharga. Data mining menjadi
salah satu bidang ilmu yang sampai saat ini terus berkembang dan sudah banyak
produk-produk yang berguna bagi masyarakat. Data mining adalah langkah analisis
terhadap proses penemuan pengetahuan di dalam basis data atau knowledge
discovery in database yang disingkat KDD (Fayyed et al. 1996). Data mining
merupakan ilmu baru yang sampai saat ini masuk ke dalam ilmu apa, karena di
dalam data mining terdapat ilmu-ilmu yang saling berhubungan seperti database,
kecerdasan buatan, statistika, machine-learning, teori peluang, dsb. Namun
menurut beberapa orang ilmu yang paling berpengaruh di dalam data mining
adalah database. Karena di dalam database terdapat banyak data yang sangat besar,
dan data mining akan mengakses data-data dalam ukuran yang besar, nantinya data
tersebut akan ditambang informasi-informasi yang mungkin berharga dan
bermanfaat yang sebelumnya belum dapat dimengerti. Namun sebenarnya tidak
hanya database saja yang sangat dibutuhkan dalam data minig. Karena masih
diperlukan berbagai macam ilmu yang digunakan untuk mengolah data yang ada
pada database, seperti diperlukannya ilmu statistika, machine learning, teori
peluang, kecerdasan buatan, dan lain sebagainya. Dalam menggali informasi ya ng
berharga di dalam database dipelukannya teknik-teknik dan metode agar data-data
tersebut dapat diolah yang nantinya akan bermanfaat.

2. RUMUSAN MASALAH
a. Apa pengertian dari data mining?
b. Kenapa harus data mining?
c. Apa fungsi dari data mining?
d. Proses apa saja yang diperlukan dalam data mining?

3. TUJUAN
Mengetahui pengertian tentang data mining, manfaat dari data mining,
bagaimana mengolah data menggunakan ilmu-ilmu data mining.

B. PEMBAHASAN
Dalam memahami data mining, bisa dilakukan dengan cara mencari-cari
informasi mengenai pengertian data mining. Banyak pendapat mengenai pengertian
dari data mining. Berikut beberapa pengertian ataupun definisi data mining yang
dapat membantu anda dalam memahami data mining :
1. Data mining adalah langkah analisis terhadap proses penemuan pengetahuan di
dalam basis data atau knowledge discovery in database yang disingkat KDD
(Fayyed et al. 1996).
2. Data mining adalah proses menganalisa data dari perspektif yang berbeda dan
menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai
untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan
keduanya. Secara teknis, data mining dapat disebut sebagai proses untuk
menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah
relasional database yang besar. (Berry , 2004)
3. Menurut Turban dalam buku yang berjudul Decision Support System and
Intelligent System Tahun 2005. Data mining merupakan teknologi
pengetahuan data yang menggunakan penggabungan metoda analisis
tradisional dan algoritma semi otomatik yang menggunakan teknik statistik,
matematika, kecerdasan buatan dan machine learning agar dapat
mengekstraksi dan mengidentifikasi informasi pengetahuan baru yang berguna
yang terkubur dalam basis data yang cenderung berukuran besar.

Dari beberapa definisi dan pengertian diatas dapat dipahami bahwa data
mining merupakan proses penemuan informasi dan pengetahuan baru yang mungkin
berharga dan bermanfaat, dimana hal tersebut belum diketahui sebelumnya. Dalam
penemuan informasi-informasi tersebut diperlukan berbagai disiplin ilmu seperti
statistika, teori peluang, model matematika, machine learning, kecerdasan buatan,
database, dsb. Ilmu-ilmu tersebut sangat berguna untuk menganilis data-data yang
sangat besar dengan cara menemukan pola-pola yang ada.
Pada tahun 2013 volume data sudah menjadi 4,4 zettabytes, dan akan terus
meningkat dengan cepat hingga diperkirakan mencapai 44 zettabytes di tahun 2020
(Turner 2014). Oleh karena itu dari hari ke hari data yang terkumpul semakin banyak
dan terjadi ledakan data. Saat ini fenomena tersebut dikenal dengan Big Data. Big
data mempunyai empat karakteristik : berukuran sangat besar (high-volume), sangat
bervariasi (high-variety), kecepatan pertumbuhan tinggi (high-celocity), dan sangat
tidak jelas (high-veracity) (Suyanto 2019). Berdasarkan karakteristik-karakteristik
tersebut mungkin dirasakan sangat berat untuk menganalisis data dalam mencari
informasi yang berharga, karena jika data-data yang sangat besar tersebut hanya
dianalisis dengan cara manual mungkin terlihat tidak masuk akal dan membosankan.
Untuk itu diperlukanlah data mining dalam mengolah dan menganalis data tersebut
sehingga dapat menghasilkan keputusan-keputusan yang baik secara cepat dan
mudah. Selain hal tersebut, diperlukannya data mining yaitu karena persaingan bisnis
yang meningkat, dimana antara perusahaan satu dan perusahaan yang lainnya saling
berlomba-lomba dalam berinovasi. Disetiap perusahaan pasti memiliki data-data yang
sangat banyak, maka dari itu diperlukannya informasi-informasi yang dapat digali dari
data-data tersebut sehingga dapat memiliki strategi yang baik dalam berinovasi dan
dalam marketing.
Berdasarkan fungsinya, data mining bisa dikelompokkan ke dalam enam
kelompok berikut ini ( Fayyad et al. 1996) :
1. Klasifikasi (classificationi) : men-generalisasi struktur yang diketahui untuk
diaplikasikan pada data-data baru. Misalkan, klasifikasi penyakit ke dalam
sejumlah jenis, klasifikasi email ke dalam spam atau bukan.
2. Klasterisasi (clustering) : mengelompokkan data, yang tidak diketahui label
kelasnya, ke dalam sejumlah kelompok tertentu sesuaidengan ukuran
kemiripannya.
3. Regresi (regression) : menemukan suatu fungsi yang memodelkan data dengan
galat (kesalahan prediksi) seminimal mungkin.
4. Deteksi anomali (anomaly detection) : mengidentifikasi data yang tidak
umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin
sangat penting dan perlu investigasi lebih lanjut.
5. Pembelajaran aturan asosiasi (assosication rule learning) atau pemodelan
kebergantungan (dependency modelling) : mencari relasi antar variabel.
6. Perangkuman (summarization) : menyediakan representasi data yang lebih
sederhana, meliputi visualisasi dan pembuatan laporan.
Dalam menentukan informasi menggunakan proses data mining, yaitu dengan
model verifikasi dan knowledge discovery. Model verifikasi yaitu dilakukan dengan
cara memeriksa validitas data dengan kondisi sesungguhnya sehingga dapat
dibuktikan kebenarannya. Sedangkan model knowledge discovery yaitu mencari
informasi-informasi yang sebelumnya belum diketahui. Model knowledge dibagi
menjadi dua yaitu directed knowledge discovery ( mencari penjelasan nilai target field
tertentu) dan undirected knowledge discovery (tidak ada target field karena komputer
akan mencari pola yang ada pada data).
Tahapan proses dalam data mining untuk menggali informasi-informasi yang
bermanfaat bisa dijelaskan sebagai berikut :
1. Seleksi data
Data diseleksi kemudian disimpan dan dipisahkan dengan database
operasional.
2. Pre-processing/ Cleaning ( Pemilihan data)
Proses ini dilakukan dengan cara membuang data yang ganda, memeriksa data
yang inkonsisten, memperbaiki kesalahan pada data.
3. Transformasi
Proses ini bertujuan agar data yang sudah terpilih dapat disesuaikan dengan
proses data mining sehingga dapat diolah.
4. Data mining
Proses mencari informasi yang menarik, berharga, dan bermanfaat yang
sebelumnya informasi tersebut belum diketahui sebelumnya. Hal ini dilakukan
dengan metode yang berbeda tergantung jenis data yang akan diolah.
5. Interprestasi / Evaluasi
Hasil informasi yang telah ditemukan dari proses data mining, perlu
ditampilkan agar mudah dimengerti oleh banyak orang

Dalam banyak literatur, sebagian ahli mendefinisikan data mining sebagai


sains yang menggunakan banyak teknik, yang sebagian besar ditemukan dalam
machine learning. Machine learning merupakan sub bagian dari artifical intellegence
sedangkan deep learning merupakan sub bagian dari machine learning. Dimana
artifical intellegence adalah istilah yang sangat luas yang mencakup empat teknik
pembangun kecerdasan buatan : searching, reasoning, planning, dan learning.
Machine learning sangat mendukung dan sering digunakan dalam penggalian data
(data mining). Sehingga terdapat relasi yang sangat erat antara data mining, big data,
artifical intellegence, machine learning, dan deep learning.

C. KESIMPULAN
1. Data mining merupakan proses penemuan informasi dan pengetahuan baru
yang mungkin berharga dan bermanfaat, dimana hal tersebut belum
diketahui sebelumnya. Dalam penemuan informasi-informasi tersebut
diperlukan berbagai disiplin ilmu seperti statistika, teori peluang, model
matematika, machine learning, kecerdasan buatan, database, dsb. Ilmu-
ilmu tersebut sangat berguna untuk menganilis data-data yang sangat besar
dengan cara menemukan pola-pola yang ada.
2. Diperlukannya data mining karena terjadinya ledakan data yang dari hari
ke hari semakin banyak, sehingga diperlukannya ilmu untuk mempelajari
data tersebut sehingga data-data yang menumpuk lebih memiliki nilai yang
bermanfaat. Selain itu data mining saat ini dibutuhkan untuk meningkatkan
daya saing bagi pelaku bisnis dalam melakukan strategi marketing dan
berinovasi. Karena pasti setiap perusahaan memiliki data yang sangat
banyak, sehingga perlu dipelajari agat memiliki nilai yang bermanfaat
sehingga dapat berinovasi dan memiliki strategi marketimg yang baik.
3. Fungsi dari data mining sendiri yaitu : untuk mengklasifikasi data,
mengklasterisasi data, regresi, deteksi anomali, aturan asosiasi, dan
merangkum data.
4. Tahapan dalam proses data mining yaitu: seleksi data, pembersihan data,
transformasi data, penggalian data, dan interpretasi data.
5. Selain tahapan dalam proses tersebut dalam penggalian data diperlukan
ilmu-ilmu yang berhubungan dengan big data, artifical intellegence,
machine learning, deep learning, dan juga ilmu-ilmu yang lainnya.

DAFTAR PUSTAKA
Suyanto, 2019, Data Mining untuk Klasifikasi dan Klasterisasi Data, Bandung :
Informatika
Berry, M.J.A. 2004. Data Mining Techniques. John Wiley & Sons.
Turban, E., J.E. Aronson dan T.P. Liang. 2005. Decision Support System and
Intelligent Systems - 7th ed. Pearson Education, Inc. Pearson Education, Inc.
Dwi Prabantini (penterjemah). 2005. Sistem Pendukung Keputusan dan
Sistem Cerdas. Penerbit ANDI. Yogyakarta.
Konsep dan Data Mining. http://rosyid.lecturer.pens.ac.id/dataMining/present1.pdf .
Didownload pada tanggal 22 September 2019
Bab 1 Konsep Data Mining. https://ocw.upj.ac.id/files/Handout-TIF311-DM-1.pdf .
Didownload pada tanggal 22 September 2019

Anda mungkin juga menyukai