Anda di halaman 1dari 2

Nama : YESSYCA FIRDA EKA MAYLINDA

Nim : S1SI200247

Matkul : Data Mining

1. Sebutkan 5 peran utama data mining!


2. Jelaskan perbedaan estimasi dan prediksi!
3. Jelaskan perbeedaan estimasi dan klasifikasi!
4. Jelaskan perbedaan klasifikasi dan klastering!
5. Jelaskan perbedaan klastering dan prediksi!
6. Jelaskan perbedaan supervised dan unsupervised learning!
7. Sebutkan tahapan utama proses data mining!

Jawaban

1. 1. Estimation
2. Prediction
3. Classification
4. Clustering
5. Association

2. - Estimation (estimasi), untuk menerka sebuah nilai yang belum diketahui, misal menerka
penhasilan seseorang ketika informasi mengenai orang tersebut dietahui. Metode yang
digunakan antara lain Point Estimation dan Confidence Interval Estimations, Simple Linear
Regression, dan Correlation dan Multiplt Regression.
- Prediction (prediksi), untuk memperkirakkan nilai masa mendatang, misal memprediksi stok
barang satu tahun kedepan. Fungsi ini mencakup metode Neural Network, Decision Tree, dan
k-Nearest Neighbor.

3. - Estimasi digunakan jika dataset atributnya numerik dan label/kelasnya numerik,


- Klasifikasi atributnya bisa berupa nominal atau numerik tetapi kelasnya harus berupa
nominal.

4. - Klasifikasi digunakan jika datadet atributnya berupa nominal atau numerik tetapi
kelasnya harus berupa nominal, sedangkan
- Klastering mirip dengan klasifikasi tetapi datanya tidak memiliki kelas dan atributnya
hanya berupa numerik. Pengklasteran merupakan pengelompokkan data yang memiliki
kemiripan nilai.

5. -Klastering mirip dengan klasifikasi tetapi datanya tidak memiliki kelas dan atributnya hanya
berupa numerik. Pengklasteran merupakan pengelompokkan data yang memiliki kemiripan
nilai.
- Prediction (prediksi), untuk memperkirakkan nilai masa mendatang, misal memprediksi stok
barang satu tahun kedepan. Fungsi ini mencakup metode Neural Network, Decision Tree, dan
k-Nearest Neighbor.
6. -Supervised Learning merupakan proses pengelompokan data yang telah memiliki label dan
akan dikelompokkan berdasarkan kelas/labelnya. Untuk mendapatkan label tentunya harus
melakukan proses training terlebih dahulu. Contohnya, kita memiliki 3 kriteria dengan
skalanya masing masing. Misalkan Suhu tinggi (1), batuk (0), sesak napas (0) maka corona
(0), dimana angka 1 menunjukkan "ya" dan angka 0 menujukkan "tidak".

- Sedangkan Unsupervised Learning merupakan proses pengelompokan data yang tidak


memiliki label. Sehingga kita bebas menentukan berapa jumlah kelompok data yang akan
dibuat, misalnya menjadi 2, 3 atau seterusnya. Tentunya dalam pengelompokan ini juga
berdasarkan karakteristiknya yang sama. Untuk outputnya sendiri tentunya akan berbeda
dengan supervised learning. Karena outputnya belum diketahui, maka kita dapat
membuatnya sendiri dengan mengelompokkannya.

7. Tahapan Data Mining:


1) Pembersihan data (untuk membuang data yang tidak konsisten dan noise)Sebelum
diproses dan dibentuk menjadi sebuah knowledge, data yang ada harus dibersihkan
terlebih dahulu. Jika ada yang mengandung eror, maka data-data tersebut harus
dibuang. Sehingga tersisa data yang ‘bagus’ untuk diolah dalam tahap selanjutnya.
2) Integrasi data
Penggabungan data dari beberapa sumber.
3) Transformation
Data diubah menjadi bentuk yang sesuai untuk di-mining.
4) Data mining
Aplikasi teknik Data Mining, proses ekstraksi pola dari data yang ada.
5) Evaluasi pola (pattern evaluation)
Setelah selesai melakukan proses data mining, pola-pola yang dihasilkan dari proses
tersebut perlu untuk dievaluasi. Tujuan dari dilakukannya evaluasi adalah untuk
menguji hipotesis awal. Setelah teruji data bisa dipresentasikan kepada pengguna

Anda mungkin juga menyukai