Tempik
Tempik
Tempik
A. TUJUAN
1. Menjelaskan pengelolaan big data
2. Menjelaskan hubungan data warehouse dan datamining
B. BAHAN BACAAN
1. Data Mining Concepts and Techniques
• Jiawei Han, Micheline Kamber and Jian Pei
• Elseiver, 2011
3. Database Design
• G. Wiedelhold
• Mc. Graw-Hill International Co., 1988
5. Data Mining
• Fajar Astuti Hermawati
• Penerbit ANDY, Yogyakarta, 2013
1
C. MATERI
DATA WAREHOUSE
2
tabel dimensi tidak ada yang saling berelasi (tidak ada hubungan
data)
• Query yang terbentuk menyebabkan proses eksekusi yang lebih
optimal, karena rencana eksekusi query dalam DBMS akan lebih
cepat dengan setiap tabel hanya berelasi dengan satu tabel lain.
2. Snowflake Schema
3
• Data warehouse dibuat lebih dari satu dan dikelompokkan
berdasarkan fungsi-fungsi yang ada di dalam perusahaan
keuangan, marketing, personalia dll.
• Sistem lebih mudah dibangun dengan biaya relative murah namun
beresiko kehilangan konsistensi data dan terbatasnya kemampuan
dala pengumpulan data bagi pengguna.
4
• Menggunakan gateway yang berfungsi berfungsi sebagai jembatan
penghubung antara data warehouse dengan workstation yang
menggunakan sistem beraneka ragam.
• Keuntungannya adalah data tetap konsisten karena memiliki proses
sinkronisasi.
• Kerugiannya adalah lebih kompleks untuk diterapkan dengan
biayanya yang paling mahal.
DATA MINING
a) Proses Data Mining
Proses data mining merupakan sebuah proses iterative untuk menghasilkan
pengetahuan baru dan hipotesa baru yang digunakan untuk menyesuaikan
kualitas dan kandungan data agar menjadi lebih baik. Proses ini dapat
diilustrasikan dalam sebuah metodologi enam langkah seperti diperlihatkan
pada gambar berikut.
5
c) Metode Dalam Data Mining
• Prediction Methods.
Menggunakan beberapa variabel untuk memprediksi sesuatu atau
suatu nilai yang akan datang.
• Description Methods.
Mendapatkan pola penafsiran (human interpretable patterns) untuk
menjelaskan data.
6
dicing. Semua hal tersebut diharapkan nantinya dapat dilakukan secara interaktif
dan dilengkapi dengan visualisasi.
D. RANGKUMAN
• Data Warehouse berada di antara 2 sistem yaitu sistem transaksi yaitu
OLTP dan sistem analisis yaitu OLAP
• Teknologi data warehouse digunakan untuk melakukan OLAP (on-line
analytical processing), sedangkan data mining digunakan untuk melakukan
information discovery. Dengan memadukan teknologi OLAP dengan data
mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan
di OLAP seperti drilling/rolling untuk melihat data lebih dalam atau lebih
umum, pivoting, slicing dan dicing. Semua hal tersebut diharapkan nantinya
dapat dilakukan secara interaktif dan dilengkapi dengan visualisasi.
E. PRAKTIKUM
Buatlah syntax berikut, sesuai dengan urutannya, kemudian kirimkan ke email
(rizky.palmina@gmail.com)
7
8
Ekspor file to csv:
9
Catatan :
Sebelum mengetik script ini install matplotlib terlebih dahulu dengan pip (Seperti
pertemuan sebelumnya)
10
11