Anda di halaman 1dari 3

1. Sebutkan 5 peran utama data mining!

a. Estimation
Estimasi hampir sama dengan prediksi, kecuali variabel target estimasi lebih
ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan
record lengkap yang menyediakan nilai dari variabel target sebagai nilai
prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel
target dibuat berdasarkan nilai variabel prediksi.

b. Prediction
Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data
diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan pada masa yang
akan datang. Contoh dari tugas prediksi misalnya untuk memprediksikan adanya
pengurangan jumlah pelanggan dalam waktu dekat dan prediksi harga saham
dalam tiga bulan yang akan datang.

c. Classification
Klasifikasi adalah proses menemukan sebuah model atau fungsi yang
mendeskripsikan dan membedakan data ke dalam kelas-kelas. Klasifikasi
melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan objek
ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.

d. Clustering
Clustering adalah pengelompokan data tanpa berdasarkan kelas data tertentu
ke dalam kelas objek yang sama. Sebuah kluster adalah kumpulan record yang
memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan
dengan record dalam kluster lain. Tujuannya adalah untuk menghasilkan
pengelompokan objek yang mirip satu sama lain dalam kelompok-kelompok.
Semakin besar kemiripan objek dalam suatu cluster dan semakin besar
perbedaan tiap cluster maka kualitas analisis cluster semakin baik.

e. Association
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang
belanja (market basket analisys). Tugas asosiasi berusaha untuk mengungkap
aturan untuk mengukur hubungan antara dua atau lebih atribut.

2. Jelaskan perbedaan estimasi dan prediksi!


Estimasi memimiliki variable target sebagai nilai dalam pengolahan data,
sedangkan prediksi menggunakan data sebelumnya untuk memprediksi
kemungkinan dimasa mendatang.

3. Jelaskan perbedaan prediksi dan klasifikasi!


Prediksi menggunakan beberapa variabel atatu field-field basis data untuk
memprediksi nilai-nilai variabel masa mendatang yang diperlukan, yang belum
diketahui saat ini, sedangkan klasifikasi adalah proses menemukan sebuah
model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-
kelas.

4. Jelaskan perbedaan klasifikasi dan klastering!


Klasifikasi adalah proses menemukan sebuah model yang mendeskripsikan dan
membedakan data ke dalam kelas-kelas, sedangkan klustering hanya
mengelompokan data kedalam kelas yang sama tanpa melihat kelas data
tersebut.

5. Jelaskan perbedaan klastering dan association!


Klastering proses pengelompokan data kedalam kelas yang sama, sedangkan
assosiasi adalah proses mengurutkan atribut sesuai kemunculannya.

6. Jelaskan perbedaan estimasi dan klasifikasi!


Estimasi mengerjakan prosesnya menggunakan variable target yang sudah
ditentukan, sedangkan klasifikasi proses menemukan sebuah model atau fungsi
yang mendeskripsikan dan membedakan data ke dalam kelas-kelas.

7. Jelaskan perbedaan estimasi dan klastering!


Estimasi mengerjakan prosesnya menggunakan variable target yang sudah
ditentukan, sedangkan klastering proses yang menghasilkan pengelompokan
dalam kelas yang sama.
8. Jelaskan perbedaan supervised dan unsupervised learning!
a. Supervised
Supervised adalah pembelajaran yang ada supervisornya. Maksud disini ada
supervisornya adalah label di tiap data nya. Label maksudnya adalah tag dari
data yang ditambahkan dalam machine learning model. Contohnya gambar
kucing di tag “kucing” di tiap masing masing image kucing dan gambar anjing
di tag “anjing” di tiap masing gambar anjing. Machine learning kategori dapat
berupa clasification (“anjing”, “kucing”, “beruang”, dsb) dan regression ( berat
badan, tinggi badan dsb). Supervised learning banyak digunakan dalam
memprediksi pola dimana pola tersebut sudah ada contoh data yang lengkap,
jadi pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut.

b. Unsupervised
Unsupervised learning memiliki keunggulan daari unsupervised learning.
Jika unsupervised learning memiliki label sebagai dasar prediksi baik serta
membuat clasification dan regression algorithm memungkinkan. Tetapi dalam
realitanya, data real itu banyak yang tidak memiliki label. Label kebanyakan jika
data sudah masuk ke ERP apapun bentuk ERPnya dan bagaimana kalo datanya
berupa natural input seperti suara, gambar, dan video. Unsupervised learning
tidak menggunakan label dalam memprediksi target feautures / variable.
Melainkan menggunakan ke samaan dari attribut attribut yang dimiliki. Jika
attribut dan sifat sifat dari data data feature yang diekstrak memiliki kemirip
miripan, maka akan dikelompok kelompokan (clustering).

9. Sebutkan tahapan utama proses data mining!


a. Pembersihan data
b. Integrasi data
c. Transformasi data
d. Aplikasi teknik data mining
e. Evaluasi pola yang ditemukan
f. Presentasi pola yang ditemukan untuk menghasilkan aksi

Anda mungkin juga menyukai