Anda di halaman 1dari 4

Sekolah Tinggi Manajemen Informatika dan Komputer(STMIK)

Hangtuah Pekanbaru

Ujian Tengah Semester Genap TA. 2019/2020

Matakuliah : Data Mining Dosen : Eka Sabna,M.Pd,M.Kom


Hari/Tanggal : 16 Agustus 2020 Kelas : TI/SI
Waktu : 90 menit Sifat Ujian : Open Book

Ketentuan :
Dilarang bekerjasama dalam bentuk apapun, jika ketentuan diabaikan maka jawaban tidak dinilai

SOAL :
1. Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining dan KDD ?
2. Jelaskan faktor yang mendorong/memicu munculnya bidang ilmu Data Mining.
3. Apa perbedaan antara data dan pengetahuan (knowledge)?
4. Jelaskan perbedaan :
a. Estimasi dan Prediksi
b. Klasifikasi dan Klastering
c. Estimasi dan Klasifikasi
d. Klasifikasi dan Asosiasi
5. Jelaskan Mengapa melakukan data mining dari sudut pandang keilmuan dan dari sudut pandang komersial .
6. Berdasarkan transaksi penjualan produk Elektronika pada perusahaan KreditPlus berikut data
penjualan yang tertinggi pada tiga bulan terakhir. Tentukan Hasil nya dalam bentuk Association
Rule. Gunakanlah metode apriori dengan minimum support = 2 dan confidence = 50% atau 60%
(nilai confidence dipilih salah satu) untuk hitungan manualnya.

“Memuliakan manusia berarti memuliakan Penciptanya dan merendahkan & menistakan manusia
berarti merendahkan dan menistakan Penciptanya” (Gus Dur)

Jawab

1.Data Mining : kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara
otomatis dari data yang jumlahnya besar.

KDD : proses yang dibantu oleh komputer untuk menggali dan menganalisis sejumlah besar
himpunan data dan mengekstrak informasi dan pengetahuan yang berguna.

2. Tetapi pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering
disebut sebagai rich of data but poor of information , karena data yang terkumpul itu tidak dapat
digunakan untuk aplikasi yang berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja
seakan-akan kuburan data (data tombs). Investasi yang besar di bidang IT untuk mengumpulkan
data berskala besar ini perlu dijustifikasi dengan didapatnya nilai tambah dari kumpulan data ini.
Data Mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaan-
perusahaan menemukan informasi yang sangat penting dari gudang data mereka. Data mining
meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung
pengambilan keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining
melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah banyak
digunakan. Data Mining dapat menjawab pertanyaan-pertanyaan bisnis yang dengan cara
tradisional memerlukan banyak waktu untuk menjawabnya.

Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari
informasi pemrediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di
luar ekspektasi mereka. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk
memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan
sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data mining.

Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan – perusahaan untuk
memecahkan berbagai permasalahan bisnis. Kebutuhan dari dunia bisnis yang ingin memperoleh
nilai tambah dari data yang telah mereka kumpulkan telah mendorong penerapan teknik-teknik
analisa data dari berbagai bidang seperti statistik, kecerdasan buatan dsb pada data berskala besar
itu. Ternyata penerapan pada data berskala besar memberikan tantangan-tantangan baru yang
akhirnya memunculkan metodologi baru yang disebut data mining ini.

3. Data : Fakta yang terekam dan tidak membawa arti

Pengetahuan : Pola ,Aturan Atau Model Yang Muncul Dari Data

4. Estimasi : kalibrasi model probabilistik Anda menggunakan data ("belajar" dalam terminologi AI).

Prediksi : "menebak" dari pengamatan di masa depan.

Klasifikasi : bertujuan untuk mengelompokan titik-titik data yang berdekatan dan mimisahkannya
dengan kelompok-kelompok lain yang berjauhan dalam suatu ruang.

Klastering : bertujuan untuk memetakan satu titik data ke dalam satu kelas yang telah ditentukan
sebelumnya.

Estimasi : Lebih ke angka atau numerik

Klasifikasi : Lebih ke mengelompokkan titik-titik data

Klasifikasi : merupakan proses menemukan sebuah model atau fungsi yang mendeskripsikan dan
membedakan data ke dalam kelas-kelas.

Assosiasi : menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum
disebut analisis keranjang belanja (market basket analisys).

5.Sudut pandang keilmuwan : data mining dapat digunakan untuk mengcapture, menganlisis
serta menyimpan data yang bersifat real-time dan sangat besar

Sudut pandang komersial : data mining bisa digunakan untuk menangani adanya peledakan dari
volume data.

6.

Anda mungkin juga menyukai