Anda di halaman 1dari 3

Nama : Rizal Rizki Maulana

Npm : 988-24052-19111034
Prodi : Teknik Informatika (IFA)
Mata Kuliah : Data Mining & Data Warehouse

Resume Konsep Data Mining

Latar Belakang
Kehadiran data mining itu di latar belakangi problema data explosion yang di alami akhir2 ini
dimana banyak organisasi telah mengumpulkan data sekian lamanya misalkan data pembelian, data
penjualan, transaksi, dll. Hampir semua data tersebut dimasukan menggunakan aplikasi computer
untuk menangani transaksi sehari-hari dengan kebanyakan yaitu online transaksi.

Mengapa kita harus data mining?


Karena Data yang sedemikian besar kadang memiliki informasi yang tersembunyi dan juga
kemampuan manusia terbatas untuk “Mempelototi” data-data terebut dalam analisis.
Contoh dalam bidang bisnis yaitu, Kita bisa mengetahui melalui bursa efek Jakarta kapan saham itu
naik dan turun.

Ada 3 fase proses dalam data mining yaitu:


1. Input
Yang menjadi inputan adalah inputan data
2. Proses
Algoritma dan metode data mining itu sendiri
3. Output
Akan menghasilkan pengetahuan atau bentuk pola-nya

Data mining memang salah satu cabang yang relative baru, Data mining itu mencangkup Artificial
Intelligence, Kecerdasan buatan, Statistik, dll.

Definisi Data Mining


Data adalah kumpulan fakta yang terekam atau sebuah entitas yang tidak memiliki arti dan
selama ini terabaikan. Mining adalah proses penambangan, dan Data Mining adalah proses
penambangan data yang menghasilkan sebuah output berupa pengetahuan.

Tahapan-Tahapan Knowledge Discovery In Database, ini berhubungan dengan Teknik integrase dan
penemuan ilmiah dari sekumpulan data, KDD adalah keseluruhan proses non-prifial untuk
mengindentifikasi pola atau method dari data dimana pola yang di temukan bersifat sah dan dapat
dimengerti, Tahapan-tahapn dari KDD yaitu:
1. Seleksi Data
Seleksi data merupakan sekumpulan data operasional yang diperlukan sebelum tahap mining
atau penggalian informasi dalam KDD dimulai.

2. Pemilihan Data
Tahap preprocessing meliputi proses pembersihan (cleaning) degan membuang duplikasi daa,
memeriksa data yang inkosisten, dan memperbaiki kesalahan pada data misalkan typo. Dan
melakukan enrichment atau memperkaya data yang sudah ada dengan data atau informasi lain
yang relevan yang diperlukan pada KDD.

3. Transformasi
Pada tahap ini adalah mentransformasi bentuk data yang belum mempunyai entitas yang jelas
ke dalam bentuk data yang valid atau siap untuk dilakukan proses data mining.

4. Data Mining
Pada tahapan ini menerapkan metode atau algoritma yang sesuai dengan informasi atau
pengetahuan apa yang akan digali atau dicari, seperti menerapkan algoritma atau metode
untuk klasifikasi, estimasi, prediksi, keterhubungan, klustering dan lain sebagainya.

5. Evaluasi/Interprestasi
Tahap ini merupakan tahapan terakhir yang dilakukan dengan mengevaluasi pembentukan
keluaran atau output dari proses data mining agar mudah untuk dipahami dan dimengerti.

Cross Industry Standard Process for Data mining menurut Larose, 2006)
1. Fase Pemahaman bisnis
2. Pemahaman Data
3. Data Preparation
4. Modeling
5. Evaluation
6. Deployment
Data merupaan kumpulan fakta yang direpresentasikan kedalam bentuk karakter baik huruf, angka
dan lainnya yang dapat diproses menjadi sebuah informasi yang ber obyek record, point, casem
sampel, entitas, dan instan adapun atribut atau variable yaitu karakteristik dari obyek contoh adalah
status pernihakan, umur, dll.

Proses Terbentuknya Informasi himpuanan data atau basis data yang akan diekstarsi menjadi sebuah
pengetahuan baik pola dan klister. Beberapa jenis Data Mining yaitu:
1. Market Basket Analysis
2. Memery-Based Reasoing
3. Cluster Detection
4. Link Analysis
5. Rule Induction
6. Neural Networks
Adapun beberapa jenis Metode Data Mining yaitu:
1. Classification
Klasifikasi data mining adalah sebuah proses menemukan definisi kesamaan karakteristik
dalam suatu kelompok atau kelas (class).

2. Clusterting
Clustering data mining adalah nama lain untuk metode segmentation. Tujuan dari segmentasi
pada metode data mining adalah mengelompokkan suatu class ke dalam beberapa segmen
berdasarkan atribut yang ditentukan. Penentuan atribut harus sesuai kesamaan yang dimiliki
beberapa class tadi.
3. Association
Metode data mining yang kedua adalah Market basket analysis (analisa keranjang pasar) atau
association.

4. Regression
Metode keempat dari data mining adalah regression. Metode yang satu ini sedikit mirip
dengan klasifikasi data mining. Bedanya, regresi merupakan metode yang bertujuan untuk
mencari pola nilai numerik, bukan kelas. Hasil dari metode regression adalah sebuah fungsi
sebagai penentu hasil yang didasarkan nilai dari input.

5. Forecasting
Forecasting data mining adalah metode yang digunakan untuk memprediksi nilai yang akan
dicapai pada satu periode. Dengan menggunakan teknik ini, noise data dan nilai pada periode
sebelumnya dijadikan dasar bahan prediksi.

6. Squence Analysis
Sequence adalah sebuah urutan peristiwa. Tidak jauh dari namanya, metode sequence analysis
berfungsi untuk mencari sebuah pola pada serangkaian kejadian atau sequence. Contoh
sederhananya dalam kehidupan sehari-hari adalah ketika makan. Rangkaian yang umum
dilakukan adalah mengambil piring, sendok dan garpu, kemudian baru mengambil lauk pauk.
Pola seperti itu lah yang berusaha dicari tahu melalui sequencing.

7. Deviation Analysis
Metode data mining yang satu ini bertujuan untuk memahami lebih dalam mengenai data-data
yang masuk dalam pengamatan. Hasil akhirnya adalah mengetahui perilaku dari data itu
sendir

Anda mungkin juga menyukai