Jawaban
1. Budiman Pratomo (2004) menyatakan bahwa data adalah kumpulan fakta objektif mengenai
sebuah kejadian. Sementara informasi adalah data yang telah diolah, biasanya menggunakan
aturan statistika, sehingga mengandung arti. Budiman juga mendefinisikan pengetahuan
(knowledge) sebagai kebiasaan, keahlian/kepakaran, keterampilan, pemahaman, atau
pengertian yang diperoleh dari pengalaman, latihan atau melalui proses belajar.
Sedangkan menurut Mike Powell (2003) dalam bukunya Information Management for
Development Organizations. Informasi adalah data atau fakta yang memiliki arti (data or
facts with meaning). Sedangkan pengetahuan merupakan hasil atau keluaran atau nilai dari
informasi (producing significance or value from information). Sumber referensi:
https://lingkarlsm.com/data-informasi-dan-pengetahuan
2. Algoritma supervised learning merupakan algoritma machine learning yang proses
pembelajarannya di bawah pengawasan sedangkan Algoritma unsupervised learning lebih
bebas dalam proses eksplorasi data karena tidak memiliki data label dan bisa mencari
karakteristik data yang tersembunyi. Algoritma ini menggunakan titik data sebagai referensi
untuk menemukan struktur dan pola yang ada di dalam data set. Sumber referensi:
https://www.dqlab.id/algoritma-supervised-vs-unsupervised-learning-apa-bedanya
3. Lima karakteristik data mining:
a. Classification
Classification, yaitu menyimpulkan definisi-definisi karakteristik sebuah grup.
Contoh: pelanggan-pelanggan perusahaan yang telah berpindah kesaingan
perusahaan yang lain.
Contoh: LOGISTIC REGRESSION, K-NEAREST NEIGHBORS, NAIVE BAYES, DECISION
TREE
b. Clustering
Clustering, yaitu mengindentifikasikan kelompok-kelompok dari barang-barang atau
produk-produk yang mempunyai karakteristik khusus(clustering berbeda dengan
classification, dimana pada clustering tidak terdapat definisi-definisi karakteristik
awak yang di berikan pada waktu classification.)
Contoh: Hierarchical Clustering, K-Means Clustering, dan K-NN
c. Association
Association, yaitu mengidentifikasikan hubungan antara kejadian-kejadian yang
terjadi pada suatu waktu, seperti isi-isi dari keranjang belanja.
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap : Analisa pola frekuensi
tinggi dan Pembentukan aturan assosiatif
d. Sequencing
Hampir sama dengan association, sequencing mengidentifikasikan hubungan-
hubungan yang berbeda pada suatu periode waktu tertentu, seperti pelanggan-
pelanggan yang mengunjungi supermarket secara berulang-ulang.
e. Forecasting
Forecasting memperkirakan nilai pada masa yang akan datang berdasarkan pola-
pola dengan sekumpulan data yang besar, seperti peramalan permintaan pasar.
Contoh: Metode Data Driven dan Metode Model Driven
Sumber referensi:
http://teknik-informatika-s1.stekom.ac.id/informasi/baca/Seputar-Data-Mining/
b219c7efbf18abc39cf426de906e6f9fd7dab267
4. Kelebihan dari Hierarchical Clustering dan K-Means Clustering
Kelebihan Hierarchical Clustering :
a. Mampu menggambarkan kedekatan antar data dengan dendrogram.
b. Cukup mudah untuk pembuatannya.
c. Dapat menentukan banyak cluster yang terbentuk setelah dendrogram terbentuk.
a. Perlu inisialisasi nilai k menggunakan metode lain untuk mendapatkan nilai k yang
optimal
b. Apabila hasil nilai random untuk centroid kurang baik, maka hasil clustering yang
didapatkan menjadi tidak optimal
c. Cukup sulit jika digunakan untuk mencari jarak dari data yang berdimensi banyak
Sumber referensi: https://www.dqlab.id/k-means-clustering-salah-satu-contoh-
teknik-analisis-data-populer