Anda di halaman 1dari 2

Pertemuan 7 – Quiz DATA WAREHOUSE DAN BUSINESS INTELLIGENCE

1. Jelaskan perbedaan Data, Informasi dan pengetahuan?


2. Menurut Anda, apa perbedaan Supervised Learning dengan Unsupervised Learning?
3. Ada 5 karakteristik data mining. Sebutkan dan jelaskan berikut dengan contohnya?
4. Dari 5 karakteristik data mining, pilih salah satu metode/algoritma, dan silakan
komparasi/bandingkan 2 atau 3 metode. Tentukan kelebihan & kekurangan algoritma
tersebut.

Jawaban

1. Budiman Pratomo (2004) menyatakan bahwa data adalah kumpulan fakta objektif mengenai
sebuah kejadian. Sementara informasi adalah data yang telah diolah, biasanya menggunakan
aturan statistika, sehingga mengandung arti. Budiman juga mendefinisikan pengetahuan
(knowledge) sebagai kebiasaan, keahlian/kepakaran, keterampilan, pemahaman, atau
pengertian yang diperoleh dari pengalaman, latihan atau melalui proses belajar.
Sedangkan menurut Mike Powell (2003) dalam bukunya Information Management for
Development Organizations. Informasi adalah data atau fakta yang memiliki arti (data or
facts with meaning). Sedangkan pengetahuan merupakan hasil atau keluaran atau nilai dari
informasi (producing significance or value from information). Sumber referensi:
https://lingkarlsm.com/data-informasi-dan-pengetahuan
2. Algoritma supervised learning merupakan algoritma machine learning yang proses
pembelajarannya di bawah pengawasan sedangkan Algoritma unsupervised learning lebih
bebas dalam proses eksplorasi data karena tidak memiliki data label dan bisa mencari
karakteristik data yang tersembunyi. Algoritma ini menggunakan titik data sebagai referensi
untuk menemukan struktur dan pola yang ada di dalam data set. Sumber referensi:
https://www.dqlab.id/algoritma-supervised-vs-unsupervised-learning-apa-bedanya
3. Lima karakteristik data mining:
a. Classification
Classification, yaitu menyimpulkan definisi-definisi karakteristik sebuah grup.
Contoh: pelanggan-pelanggan perusahaan yang telah berpindah kesaingan
perusahaan yang lain.
Contoh: LOGISTIC REGRESSION, K-NEAREST NEIGHBORS, NAIVE BAYES, DECISION
TREE
b. Clustering
Clustering, yaitu mengindentifikasikan kelompok-kelompok dari barang-barang atau
produk-produk yang mempunyai karakteristik khusus(clustering berbeda dengan
classification, dimana pada clustering tidak terdapat definisi-definisi karakteristik
awak yang di berikan pada waktu classification.)
Contoh: Hierarchical Clustering, K-Means Clustering, dan K-NN
c. Association
Association, yaitu mengidentifikasikan hubungan antara kejadian-kejadian yang
terjadi pada suatu waktu, seperti isi-isi dari keranjang belanja.
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap : Analisa pola frekuensi
tinggi dan Pembentukan aturan assosiatif
d. Sequencing
Hampir sama dengan association, sequencing mengidentifikasikan hubungan-
hubungan yang berbeda pada suatu periode waktu tertentu, seperti pelanggan-
pelanggan yang mengunjungi supermarket secara berulang-ulang.
e. Forecasting
Forecasting memperkirakan nilai pada masa yang akan datang berdasarkan pola-
pola dengan sekumpulan data yang besar, seperti peramalan permintaan pasar.
Contoh: Metode Data Driven dan Metode Model Driven
Sumber referensi:
http://teknik-informatika-s1.stekom.ac.id/informasi/baca/Seputar-Data-Mining/
b219c7efbf18abc39cf426de906e6f9fd7dab267
4. Kelebihan dari Hierarchical Clustering dan K-Means Clustering
Kelebihan Hierarchical Clustering :
a. Mampu menggambarkan kedekatan antar data dengan dendrogram.
b. Cukup mudah untuk pembuatannya.
c. Dapat menentukan banyak cluster yang terbentuk setelah dendrogram terbentuk.

Kekurangan Hierarchical Clustering:

a. Tidak dapat menganalisis data kategorik secara langsung (terhambat pada


penghitungan jarak yang hanya bisa dilakukan untuk data numerik, sehingga data
kategorik perlu dipre-process terlebih dahulu).Cukup mudah untuk pembuatannya.
b. Tidak diperuntukkan untuk menghasilkan jumlah cluster optimal yang mutlak
(jumlah cluster dapat berubah-ubah tergantung level pemotongan dendrogram).
c. Sensitif terhadap data yang memiliki skala berbeda (sehingga data perlu
dinormalisasi/standarisasi terlebih dahulu).
d. Sensitif terhadap outlier.
e. Cukup berat komputasinya untuk data berukuran besar. Sumber referensi:
https://algotech.netlify.app/blog/introduction-to-hierarchical-clustering

Kelebihan K-Means Clustering

a. Terbilang cukup mudah untuk dipahami dan diimplementasikan


b. Proses pembelajaran membutuhkan waktu yang relatif cepat
c. Sangat umum digunakan sebagai teknik clustering

Kekurangan K-Means Clustering

a. Perlu inisialisasi nilai k menggunakan metode lain untuk mendapatkan nilai k yang
optimal
b. Apabila hasil nilai random untuk centroid kurang baik, maka hasil clustering yang
didapatkan menjadi tidak optimal
c. Cukup sulit jika digunakan untuk mencari jarak dari data yang berdimensi banyak
Sumber referensi: https://www.dqlab.id/k-means-clustering-salah-satu-contoh-
teknik-analisis-data-populer

Metode klastering - Hierarchical Clustering vs K-Means. Sumber: Jurnal ANALISA PERBANDINGAN


METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM CLUSTER DATA
(STUDI KASUS: PROBLEM KERJA PRAKTEK TEKNIK INDUSTRI ITS)
https://ejurnal.its.ac.id/index.php/teknik/article/view/1794

Anda mungkin juga menyukai