Anda di halaman 1dari 28

PENAMBANGAN DATA

(DATA MINING)
DATA MINING (DM)
• Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau
menemukan pola dari suatu data yang besar
• Ekstraksi dari data ke pengetahuan:
1. Data: fakta yang terekam dan tidak membawa arti
2. Pengetahuan: pola, rumus, aturan atau model yang muncul dari data
• Nama lain data mining:
• Knowledge Discovery in Database (KDD)
• Knowledge extraction
• Pattern analysis
• Information harvesting
• Business intelligence

2
FUNGSI DATA MINING

Descriptive Predictive
DESCRIPTIVE
• fungsi deskripsi dalam data mining adalah sebuah fungsi untuk
memahami lebih jauh tentang data yang diamati. Dengan melakukan
sebuah proses diharap bisa mengetahui perilaku dari sebuah data
tersebut. Data tersebut itulah yang nantinya dapat digunakan untuk
mengetahui karakteristik dari data yang dimaksud.
• Dengan menggunakan Fungsi descriptive Data mining, Maka nantinya
bisa menemukan pola tertentu yang tersembunyi dalam sebuah data.
Dengan kata lain jika pola yang berulang dan bernilai itulah
karakteristik sebuah data bisa diketahui.
PREDICTIVE
• Fungsi prediksi merupakan sebuah fungsi bagaimana sebuah proses
nantinya akan menemukan pola tertentu dari suatu data. Pola-pola tersebut
dapat diketahui dari berbagai variabel-variabel yang ada pada data.
• Ketika sudah menemukan pola, Maka pola yang didapat tersebut bisa
digunakan untuk memprediksi variabel lain yang belum diketahui nilai
ataupun jenisnya.
• Karena itulah fungsi satu ini dikatakan sebagai fungsi prediksi sama halnya
dengan melakukan predictive analisis. Fungsi ini juga bisa digunakan untuk
memprediksi sebuah variabel tertentu yang tidak ada dalam suatu data.
• Sehingga fungsi ini memudahkan dan menguntungkan bagi siapapun yang
memerlukan prediksi yang akurat untuk membuat hal penting tersebut
menjadi lebih baik.
PERAN UTAMA DATA MINING
1. Estimasi

5. Asosiasi 2. Forecasting

Data Mining Roles


(Larose, 2005)

4. Klastering 3. Klasifikasi

6
KONSEP PROSES DATA MINING

Himpunan Metode Pengetahua


Data Data Mining n

7
PROSES PENGAMBILAN DATA
PROSES PENGAMBILAN DATA
1. Data Cleansing, Proses dimana data-data yang tidak lengkap,
mengandung error dan tidak konsisten dibuang dari koleksi data.
Ketahui juga data lifecycle management untuk mengetahui tentang
pengolahan data.
2. Data Integration, Proses integrasi data dimana yang berulang akan
dikombinasikan.
3. Selection, Proses seleksi atau pemilihan data yang relevan terhadap
analisis untuk diterima dari koleksi data yang ada.
4. Data Transformation, Proses transformasi data yang sudah dipilih ke
dalam bentuk mining procedure melalui cara dan agresi data.
PROSES PENGAMBILAN DATA
5. Data Mining, Proses yang paling penting dimana akan dilakukan
berbagai teknik yang diaplikasikan untuk mengekstrak berbagai
pola-pola potensial untuk mendapatkan data yang berguna.
6. Pattern Evolution, Sebuah proses dimana pola-pola menarik yang
sebelumnya sudah ditemukan dengan identifikasi berdasarkan
measure yang telah diberikan
7. Knowledge Presentation, Merupakan proses tahap terakhir, Dalam
hal ini digunakan teknik visualisasi yang bertujuan membantu user
dalam mengerti dan menginterpretasikan hasil dari penambangan
data.
PERMASALAHAN DALAM DATA MINING
1. Metodologi Mining
• Menambang berbagai jenis pengetahuan dari berbagai tipe data
• Kinerja: efisiensi, efektivitas, dan skalabilitas
• Evaluasi pola: masalah ketertarikan
• Memasukkan pengetahuan latar belakang
• Menangani kebisingan dan data yang tidak lengkap
• Metode penambangan paralel, terdistribusi dan tambahan
• Integrasi pengetahuan yang ditemukan dengan yang ada: fusi pengetahuan
PERMASALAHAN DALAM DATA MINING
2. User interaction
• Bahasa kueri penambangan data dan penambangan ad-hoc
• Ekspresi dan visualisasi hasil penambangan data
• Penambangan pengetahuan interaktif di berbagai tingkatan abstraksi
PERMASALAHAN DALAM DATA MINING
3. Applications and social impacts
• Penambangan data khusus domain
• Perlindungan keamanan data, integritas, dan privasi
CONTOH DATA DI KAMPUS
• Puluhan ribu data mahasiswa di kampus yang diambil dari sistem
informasi akademik
• Apakah pernah kita ubah menjadi pengetahuan yang lebih
bermanfaat? TIDAK!
• Seperti apa pengetahuan itu? Rumus, Pola, Aturan

14
PREDIKSI KELULUSAN MAHASISWA

15
CONTOH DATA DI KOMISI PEMILIHAN UMUM
• Puluhan ribu data calon anggota legislatif di KPU
• Apakah pernah kita ubah menjadi pengetahuan yang lebih
bermanfaat? TIDAK!

16
PREDIKSI CALON LEGISLATIF DKI JAKARTA

17
20
PENENTUAN KELAYAKAN KREDIT
15

10 Jumlah kredit
macet
5

0
2003 2004

18
DETEKSI PENCUCIAN UANG

19
FFMC
PREDIKSI KEBAKARAN HUTAN
DMC DC ISI temp RH wind rain ln(area+1)
93.5 139.4 594.2 20.3 17.6 52 5.8 0 0
92.4 124.1 680.7 8.5 17.2 58 1.3 0 0

90.9 126.5 686.5 7 15.6 66 3.1 0 0


85.8 48.3 313.4 3.9 18 42 2.7 0 0.307485
91 129.5 692.6 7 21.7 38 2.2 0 0.357674
90.9 126.5 686.5 7 21.9 39 1.8 0 0.385262
95.5 99.9 513.3 13.2 12
23.3 31 4.5 0 0.438255

10 9.648

6
5.9 5.615
  SVM SVM+GA
C 4.3 1,840 4.3

Gamma ( 5.9 9,648 4


3.9
Epsilon ( 3.9 5,615 1.840
1.391

RMSE 2
1.391 1.379
0 1.379
C Gamma Epsilon RMSE

SVM SVM+GA
20
PROFILING DAN PREDIKSI KORUPTOR
Prediksi dan klastering
Aktivitas Penindakan calon tersangka koruptor

Asosiasi atribut
Data tersangka koruptor
Data Data Pengetahuan

Data Prediksi pencucian uang

Estimasi jenis dan


Aktivitas Pencegahan jumlah tahun hukuman

21
POLA PROFIL TERSANGKA KORUPTOR

22
PROFILING DAN DETEKSI KASUS TKI

23
KLASTERISASI TINGKAT KEMISKINAN

24
POLA ATURAN ASOSIASI DARI DATA TRANSAKSI

25
POLA ATURAN ASOSIASI DI AMAZON.COM

26
DATA MINING TASKS AND ROLES IN GENERAL
Increasing potential
values to support End User
business decisions Decision
Making

Data Presentation Business Analyst


Visualization Techniques
Data Mining
Information Discovery and Modeling
Data Scientist
Data Exploration
Statistical Summary, Metadata, and Description

Data Preprocessing, Data Integration, Data Warehouses


DBA/
Data Sources
Paper, Files, Web documents, Scientific experiments, Database Systems
DBE
27
HUBUNGAN DATA MINING DAN BIDANG LAIN

Statistics

Machine Computing
Learning Algorithms

Pattern Data Database


Recognition Mining Technology

28

Anda mungkin juga menyukai