DI SUSUN OLEH :
DANIEL ANDIS DWI ADMOJO
SEMESTER 1
I
KATA PENGANTAR
Puji dan syukur atas kehadirat Tuhan Yang Maha Esa. karena atas rahmat dan karunia-Nya
memberikan kesehatan dan kelapangan waktu bagi penulis sehingga dapat menyelesaikan
makalah dengan lancar.
Judul makalah ini ialah mengenai “Data Warehouse” DAN “Data Mining”. Adapun tujuan
penulisan makalah ini ialah untuk memberikan informasi mengenai berbagai hal yang
berhubungan dengan Data Warehouse Dan Data Minning.
Penulis menyadari bahwa makalah ini masih jauh dari sempurna. Oleh karena itu, penulis
dengan senang hati akan menerima segala kritikan yang bersifat membangun dan saran-saran
yang akhirnya dapat memberikan manfaat bagi makalah ini. Akhir kata, penulis mengucapkan
terimakasih.
ii
DAFTAR ISI
KATA PENGANTAR......................................................................................................ii
DAFTAR ISI....................................................................................................................1
BAB I...............................................................................................................................2
PENDAHULUAN...........................................................................................................2
A. Latar Belakang......................................................................................................2
B. Rumusan Masalah.................................................................................................3
C. Tujuan...................................................................................................................3
D. Batasan Masalah...................................................................................................3
BAB II PEMBAHASAN.................................................................................................4
1. KEBUTUHAN BISNIS........................................................................................4
3. KEBUTUHAN DAN KESEMPATAN UNTUK DATA MINING.......................6
A. BAHASAN UMUM DATA MINING......................................................................6
1. Definisi Data Mining............................................................................................6
2. Ruang Lingkup Data Mining................................................................................7
3. Cara Kerja Data Mining........................................................................................8
4. BAHASAN TEKNIS DATA MINING.................................................................9
5. Metodologi Data Mining....................................................................................10
6. Tugas Utama Data Mining.................................................................................10
B. DATA WARE HOUSE...........................................................................................16
1. MEMANFAATKAN HUBUNGAN REFLEXIVE............................................17
2. EMPAT KARAKTERISTIK DATA WAREHOUSE..........................................19
BAB III..........................................................................................................................20
PENUTUP.....................................................................................................................20
A. KESIMPULAN..........................................................................................................20
B. SARAN......................................................................................................................20
1
BAB I
PENDAHULUAN
A. Latar Belakang
2
B. Rumusan Masalah
Adapun rumusan masalah yang dapat diambil dalam uraian latar belakang di
atas adalah:
1. Apa yang dimaksud kebutuhan bisnis?
2. pemahaman permasalahn dan konsep dasar solusi bisnis?
3. Apa saja kebutuhan dan kesempatan untuk data mining?
4. Apa saja bahasa umum data mining ?
5. Apa Definisi Data Mining?
6. Apa saja Ruang Lingkup Data Mining?
7. Memahami Cara Kerja Data Mining?
8. Memahami bahasan teknis data mining?
9. Memahami metodologi data mining yang populer?
10. Memahami teknologi yang mendatangkan profit?
11. Memahami pengembangan kdd dan data mining?
12. Apa Defenis data ware house?
13. Apa saja karakteristik data ware house?
C. Tujuan
D. Batasan Masalah
3
MINIG arsitektur data warehouse, arsitektur data MINING keuntungan, cara
membangun data warehouse, MINING dan penggunaannya di dalam perusahaan.
BAB II
PEMBAHASAN
1. KEBUTUHAN BISNIS
Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya
harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin
mengembangkan skala bisnis mereka. Untuk mencapai hal itu, dapat diringkaskan tiga
kebutuhan bisnis, yaitu:
a) Penambahan jenis maupun peningkatan kapasitas produk.
b) Pengurangan biaya operasi perusahaan.
c) Peningkatan efektifitas pemasaran dan keuntungan.
Untuk memenuhi kebutuhan-kebutuhan di atas, banyak cara yang dapat ditempuh. Salah
satunya adalah dengan memikirkan teknik-teknik pemasaran yang efektif dengan biaya
yang minimal. Berikut ini akan dibahas mengenai hal-hal yang berkaitan dengan
kegiatan bisnis di bidang pemasaran, seperti identifikasi dan pemahaman permasalahan,
analisis pencarian solusi dan pembahasan teknik-teknik untuk mengimplementasikan
solusi.
Pencarian solusi dari masalah-masalah ini akan berkaitan dengan penemuan dan
pemanfaatan dari berbagai jenis pola-pola yang tersembunyi dari gudang datayang
kemungkinan sudah dimiliki oleh perusahaan. Penjelasan lebih lanjut dari masalah-
masalah di atas dan konsep dasar yang dipikirkan oleh para pelaku dan penganalisis
bisnis sebagai solusinya diberikan di bawah ini :
a. Perumusan target.
Para ahli pemasaran menggunakan teknik-teknik tertentu untuk memilih orang-
orang yang menjadi target pemasaran untuk disuguhi advertensi tertentu. Tujuannya
4
antar lain adalah untuk meningkatkan profit perusahaan, pengenalan produk secara
luas, atau hasil-hasil terukur lainnya.
b. Personalisasi.
Para ahli pemasaran memanfaatkan personalisasi untuk memilih advertensi yang
paling sesuai untuk (atau memberikan rekomendasi tertentu kepada) orang tertentu.
Personalisasi dapat dipandang sebagai kontradiksi dari “perumusan target”. Pada
perumusan target, yang disasar adalah sebanyak mungkin orang yang memiliki
potensi untuk membeli produkproduk tertentu, sedangkan pada personalisasi,
tujuannya adalah agar kustomer yang sudah menjadi pelanggan membeli sebanyak
mungkin produkproduk yang dijual oleh perusahaan.
d. Manajemen pengetahuan.
Sistem ini mengidentifikasi dan memanfaatkan pola-pola di dalam dokumen
yang berbahasa alami, atau berformat text. Di sini didefinisikan asosiasi antara kata-
kata dan konteksnya dalam konsep tingkat-atas. Hal ini dapat dilakukan dengan
“melatih” sistem dengan dokumen-dokumen yang sudah ditandai dengan konsep-
konsep yang relevan. Sistem kemudian membangun sebuah pencocok pola untuk
tiap konsep. Ketika dihadapkan pada dokumen baru, pencocok pola akan
memutuskan tingkat relevansi dari dokumen ini terhadap konsep. Pendekatan ini
dapat digunakan untuk menyortir dokumen-dokumen baru yang masuk ke dalam
kategori-kategori yang sudah ada. Juga dapat digunakan untuk mempersonalisasi
publikasi online. Selain itu, dapat juga dimanfaatkan untuk menciptakan atau
membangkitkan dokumen jawaban-jawaban secara otomatis terhadap pertanyaan-
pertanyaan yang masuk.
e. Pengelompokan (Clustering).
Pengelompokan mengidentifikasi orang-orang yang memiliki kesamaan
karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai
“vektor karakteristik” atau “centroid”. Pengelompokan ini digunakan oleh
perusahaan untuk membuat laporan mengenai karakteristik umum dari grup-grup
pengunjung (kustomer) yang berbeda.
g. Pohon keputusan.
5
Pohon keputusan ini dapat dipandang sebagai diagram alir dari titik-titik
pertanyaan yang menuju pada sebuah keputusan. Pohon keputusan ini diterapkan
pada sistem pemilihan produk-produk yang dijual perusahaan.
Data Mining merupakan teknologi baru yang sangat berguna untuk membantu
perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data
mereka. Kakas data mining meramalkan tren dan sifat-sifat perilaku bisnis yang sangat
berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi
yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung
keputusan tradisional yang sudah banyak digunakan. Data Mining dapat menjawab
pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu
untuk menjawabnya. Data Mining mengeksplorasi basis data untuk menemukan pola-
pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan
oleh para pelaku bisnis karena terletak di luar ekspektasi mereka.
Data mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-
relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini
adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam
teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat
juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis
6
text, dan multimedia (citra). Data mining dapat juga didefinisikan sebagai “pemodelan
dan penemuan polapola yang tersembunyi dengan memanfaatkan data dalam volume
yang besar”. Data mining menggunakan pendekatan discovery-based dimana
pencocokan pola (pattern-matching) dan algoritmaalgoritma yang lain digunakan untuk
menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining merupakan
komponen baru pada arsitektur sistem pendukung keputusan (DSS) di perusahaan-
perusahaan.
Beberapa pengertian data mining yang berhasil penulis himpun dari beberapa
pendapat adalah sebagai berikut.
1. Secara sederhana dapat didefinisikan bahwa Data mining adalah ekstraksi informasi
atau pola yang penting atau menarik dari data yang ada di database yang besar
sehingga menjadi informasi yang sangat berharga[1].
2. Data mining merupakan proses penemuan yang efisien sebuah pola terbaik yang
dapat menghasilkan sesuatu yang bernilai dari suatu koleksi data yang sangat
besar[2].
3. Data mining adalah suatu pola yang menguntungkan dalam melakukan search pada
sebuah database yang terdapat pada sebuah model. Proses ini dilakukan berulang-
ulang (iterasi) hingga didapat satu set pola yang memuaskan yang dapat berfungsi
sesuai yang diharapkan [3].
4. Data mining adalah sebuah class dari suatu aplikasi database yang mencari pola-
pola yang tersembunyi di dalam sebuah group data yang dapat digunakan untuk
memprediksi prilaku yang akan datang[7].
5. Data mining adalah suatu kelas aplikasi database yang berfungsi melakukan
pencarian pola-pola tersembunyi di dalam suatu kumpulan data yang bisa digunakan
untuk memprediksikan trend atau perilaku yang akan datang.
7
dari data yang tersedia. Contoh dari masalah prediksi ini misalnya target pemasaran,
peramalan kebangkrutan dan bentukbentuk kerugian lainnya.
Gol dari pemodelan ini adalah untuk membuat perkiraan yang didasari kalkulasi untuk
mengisi informasi di kuadran kanan bawah pada Tabel 1, berdasar pada informasi
umum dan khusus yang sudah ada (dimiliki oleh perusahaan itu). Misalnya, sebuah
model sederhana untuk perusahaan telekomunikasi itu adalah: 98% kustomer “milik”
perusahaan itu yang berpenghasilan $60.000/tahun membelanjakan lebih dari $80/bulan
untuk penggunaan SLJJ. Model ini kemudian
8
dapat diterapkan untuk menarik kesimpulan dari informasi khusus (sebagai data
prospek), dimana saat ini informasi khusus tersebut tidak dimiliki oleh perusahaan.
Dengan model ini, calon-calon kustomer baru dapat ditarget secara selektif. Skenario
lain dalam membangun model adalah: memprediksi apa yang akan terjadi di masa
mendatang. Model ini ditunjukkan oleh Tabel 2.
Secara garis besar, langkah-langkah utama dalam proses KDD adalah (lihat Gambar 1):
9
6. Pemilihan algoritma data mining untuk pencarian (searching).
7. Data mining: pencarian pola-pola yang diinginkan di himpunan representasi.
8. Penterjemahan pola-pola yang dihasilkan dari data mining (langkah 7),
kemungkinan dapat kembali langkah 1-7 untuk iterasi lebih lanjut.
9. Konsolidasi pengetahuan yang ditemukan : pendokumentasian hasil, pencarian
penyelesaian apabila ada konflik dengan pengetahuan yang telah dipercaya
sebelumnya.
Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif
yang berulang dari metodologi data mining tertentu. Pada pembahasan di sini akan
digunakan istilah pola dan model. Pola dapat diartikan sebagai instansiasi dari model.
Sebagai contoh f(x) = 3x2 + x adalah pola dari model f(x) = ax2 + bx. Data mining
melakukan “pengepasan” atau pencocokan model ke, atau menentukan pola dari data
yang diobservasi. Ada dua pendekatan matematis yang digunakan dalam pencocokan
model: statistik yang memberikan efek non-deterministik dan logik yang murni
deterministik. Yang lebih banyak digunakan adalah pendekatan statistik, mengingat
ketidakpastian yang ada dalam proses pembangkitan data di dunia nyata. Kebanyakan
metodologi data mining didasarkan pada konsep mesin belajar, pengenalan atau
pencocokan pola dan statistik: klasifikasi, pengelompokan
(clustering), pemodelan grafis, dll.4
Telah disebutkan di ruang lingkup data mining bahwa pada kebanyakan aplikasinya,
gol utama dari data mining adalah untuk membuat prediksi dan deskripsi. Prediksi
menggunakan beberapa variabel atau field-field basis data untuk memprediksi nilai-nilai
variabel masa mendatang yang diperlukan, yang belum diketahui saat ini. Deskripsi
berfokus pada penemuan pola-pola tersembunyi dari data yang ditelaah. Dalam konteks
KDD, deskripsi dipandang lebih penting daripada prediksi4. Ini berlawanan dengan
aplikasi pengenalan pola dan mesin belajar. Prediksi dan deskripsi pada data mining
dilakukan dengan tugas-tugas utama yang akan dijelaskan di bawah ini. Pada setiap
tugas akan diberikan pointer ke masalah bisnis yang dapat diselesaikan (yang telah
dibahas pada butir 3). Gambar-gambar yang ada dimisalkan menunjukkan hubungan
antara penghasilan pengecer dan kekurangan pembayaran yang ditanggung oleh
distributor (pemasok barang).
a) Klasifikasi adalah fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah
unsur (item) data ke dalam salah satu dari beberapa kelas yang sudah didefinisikan.
Gambar 2 menunjukkan pembagian sederhana pada data peminjaman menjadi dua
ruang kelas (punya dan tidak punya peminjaman). Pada gambar tersebut x
merepresentasikan peminjaman yang bermasalah dan o peminjaman yang
pengembaliannya lancar. (Sebagai solusi 3.e, 3.d dan 3.g).
10
b) Regresi adalah fungsi pembelajaran yang memetakan sebuah unsur data ke sebuah
variabel prediksi bernilai nyata. Aplikasi dari regresisi ini misalnya adalah pada
prediksi volume biomasa di hutan dengan didasari pada pengukuran gelombang
mikro penginderaan jarak jauh (remotely-sensed), prediksi kebutuhan kustomer
terhadap sebuah produk baru sebagai fungsi dari pembiayaan advertensi, dll.
Gambar 3 menunjukkan regresi linear sederhana dimana “total peminjaman” (total
debt) diplot sebagai fungsi linier dari penghasilan (income) : pengeplotan ini
menghasilkan kesalahan besar karena hanya ada korelasi sedikit antara kedua
variabel ini. (Solusi 3.a dan 3.f)
11
dapat saling menumpu, sehingga titik-titik data dapat menjadi anggota lebih dari
satu cluster. (Label x dan o pada gambar sebelumnya diubah menjadi + untuk
mengindikasikan bahwa keanggotaan kelas diasumsikan belum diketahui.) (Solusi
3.e).
Setelah tugas-tugas utama dari data mining didefinisikan seperti di atas, maka perlu
dirumuskan algoritma-algoritma untuk mencari solusi dari tugas-tugas tersebut di atas.
Dalam setiap algoritma data mining ada tiga komponen utama yaitu representasi model,
evaluasi model dan metodologi pencarian.
a) Representasi Model adalah bahasa untuk mendeskripsikan pola-pola yang dapat
ditemukan. Jika representasi terlalu terbatas, maka tidak akan ada jumlah waktu
pelatihan maupun sampel yang mencukupi, yang akan menghasilkan model yang
akurat untuk data.
b) Evaluasi Model mengestimasi tingkat kecocokan sebuah pola tertentu untuk
memenuhi kriteria pada proses KDD. Evaluasi pada keakuratan prediksi (validasi)
didasarkan pada validasi silang. Evaluasi kualitas deskriptif berkaitan dengan
12
akurasi, kebaruan, utilitas dan kemampuan untuk dipahami dari model yang
diterapkan. Kriteria logika dan statistik dapat digunakan untuk evaluasi model.
c) Metodologi Pencarian terdiri dari dua komponen: pencarian parameter dan
pencarian model. Pada pencarian parameter, algoritma harus mencari parameter-
parameter yang mengoptimisasi kriteria evaluasi model dengan tersedianya data
yang diobservasi dan representasi model yang tetap. Pencarian model terjadi sebagai
sebuah loop di atas metodologi pencarian parameter : representasi model diubah
sehingga dibentuk satu keluarga model-model.
Ada banyak metodologi data mining, tapi di sini hanya akan dibahas yang populer
saja. Bahasan metodologi akan meliputi segi representasi model, evaluasi model dan
metodologi pencarian.
13
c. Metodologi Berbasis-sampel
Representasi dari metodologi ini cukup sederhana: gunakan sampel dari basis data
untuk mengaproksimasi sebuah model, misalnya, prediksi sampel-sampel baru
diturunkan dari properti sampel-sampel yang “mirip” di dalam model yang prediksinya
sudah diketahui. Teknik ini misalnya adalah klasifikasi tetanggaterdekat, algoritma
regresi dan sistem reasoning berbasis-kasus. Gambar 6 menunjukkan hasil dari
klasifikasi tetangga terdekat pada himpunan data peminjaman: kelas pada setiap titik di
dalam ruang 2-dimensi sama dengan kelas dari titik terdekat di dalam himpunan data
yang ditelaah dan orisinil.
14
berbasis-pohon) adalah dibutuhkannya metrik jarak yang akurat untuk mengevaluasi
jarak antara titik-titik data.
Jika aturan dan pohon-keputusan memiliki sebuah representasi yang terbatas pada
logika proporsional, pembelajaran relasional (yang juga dikenal sebagai pemrograman
logika induksi) menggunakan bahasa pola yang lebih sederhana dengan logika
tingkatsatu. Pembelajar relasional dengan mudah dapat menemukan formula seperti
X=Y. Kebanyakan riset pada metodologi evaluasi model untuk pembelajaran relasional
bersifat logik.
Banyak perusahaan yang sudah meluncurkan aplikasi data mining (KDD) dan telah
mendapatkan keuntungan. Teknologi ini tidak hanya cocok untuk digunakan oleh
industri-industri yang mengelola informasi secara intensif seperti perbankan, tetapi juga
perusahaan apa saja yang ingin memanfaatkan gudang data untuk memanajemen
kustomer dengan lebih baik. Dua faktor penting yang menentukan keberhasilan
penggunaan dari data mining adalah : gudang data yang berukuran besar dan
terintegrasi dengan baik, dan pemahaman atau identifikasi yang baik terhadap proses
bisnis dimana data mining akan diaplikasikan5. Beberapa contoh bidang-bidang bisnis
yang telah berhasil menerapkan aplikasi data mining adalah :
15
9. PENGEMBANGAN KDD DAN DATA MINING
10. KESIMPULAN
Data mining, yang hadir sebagai teknologi untuk memanfaatkan ketersediaan data
bisnis yang melimpah, telah membantu para pelaku bisnis untuk mempertahankan dan
mengembangkan bisnis mereka. Akan tetapi, agar teknologi data mining dan KDD ini
dapat dimanfaatkan terus dengan baik, teknologi ini harus terus dapat “bekerja”
berdampingan dengan bidang lain di dunia teknologi informasi yang berkembang
dengan sangat cepat. Penyempurnaan di sana-sini masih terus diperlukan, karena itu
peluang riset di bidang ini masih terbuka lebar.
16
1. MEMANFAATKAN HUBUNGAN REFLEXIVE
Saya masih ingat, betapa suksesnya kami (waktu itu saya masih di Indonesia)
mengerjakan proyek yang sama untuk sejumlah bank.; yaitu memproses penutupan
akhir hari dipusat komputer (system adalah terpusat, centralized), menyampaikan
informasi (laporan) kesemua cabang untuk buka kantor disetiap esok hari kerja. Laporan
berisi misalnya posisi rekening nasabah yang hari sebelumnya mengadakan transaksi.
Juga disiap- dan disebar-kan laporan sejenis untuk kantor wilayah yang mencakup
cabang-cabang dibawah naungannya, dan seterusnya berantai mengikuti jenjang
otonomi sistem perkantorannya.
Laporan ini berjenis-jenis, meskipun semuanya menggunakan sumber data yang
sama. Selain format (layout), strukturnya juga bervariasi. Ada yang diurutkan berdasar
besarnya transaksi, jenis laporan lain berdasar tipe rekening, dan untuk kantor wilayah
misalnya diurutkan dan dikelompokkan per kantor cabang.
Selain penggunaan sumber data yang sama, ada sebagian proses yang sama
diulang untuk setiap cabang (job stream sama sekali terpisah), terutama proses untuk
mengambil data yang dibutuhkan (extraction) dari database milik sistem operasional
bank (yang disiang harinya dipakai untuk menangani segala macam transaksi, baik atas
permintaan pelanggan melalui kantor cabang, ATM maupun internet banking, juga
proses administrasi oleh bank sendiri). Situasi ini dapat digambarkan sebagai berikut.
Mengapa mengambil dan memproses data yang sama berulang kali? Pertanyaan inilah
yang menjadi alasan utama mengapa data warehouse diperlukan.
Ada alasan lain, akibat situasi diatas, yang selalu menimbulkan keraguan pemakai
tingkat-atas (senior manager, misalnya kepala wilayah) akan kebenaran informasi yang
diperolehnya. Laporan harian pada contoh bank-bank diatas diatas dijadikan sumber
data oleh fungsi-fungsi dikantor cabang dan wilayah, untuk membuat laporan yang lain
untuk keperluan masing-masing. Akibat berantainya penggunaan dan pemrosesan
individu ini (terutama re-entry manual, perbedaan pengertian nilai data (definisi dan
makna) dan formula perhitungan), maka bila mereka mengadakan rekonsiliasi kembali
berdasar laporan individu tersebut (misalnya waktu rapat manajemen antar fungsi),
hampir selalu muncul masalah inconsistency informasi.
Sistem gudang data (Data Warehouse) dibangun untuk mengatasi masalah teknis dan
bisnis dalam kasus-kasus sejenis diatas, yaitu kasus kasus yang berkaitan dengan
17
pengunaan data dan informasi untuk mengambil keputusan bisnis dan manajemen.
Bandingkan gambar 2 berikut ini dengan
gambar 1.
Data hanya diambil dan diproses sekali, disimpan didalam data warehouse
(proses ini disebut ETL = Extract, Transform, Load); hanya bagian proses yang unik
dari setiap pemakaian data yang dilaksanakan masing-masing (biasanya menggunakan
software khusus – specialized tool).
Fungsi utama Data Warehouse adalah: Mengambil (termasuk data dari luar yang
dibutuhkan, misalnya daftar kode pos dari kantor pos), mengumpulkan, mempersiapkan
(transforming, seperti membersihkan, mengintegrasikan, decoding), menyimpan
(loading), dan menyediakan data untuk pemakai atau aplikasi yang bersifat
query/reporting (read-only); hanya satu data terpercaya ini yang digunakan oleh semua
yang membutuhkan (single version of truth), untuk pelaporan, analisa informasi dan
mengambil keputusan (analytical application).
Seperti digambarkan di Gambar 2, sekali data masuk kedalam data warehouse, data
yang memang dirancang dan ditujukan untuk bukan hanya satu atau sejumlah
pemakaian yang sudah diketahui, dapat digunakan untuk aplikasi mendatang dan belum
pernah sebelumnya terpikirkan- bandingkan ini dengan pembangunan aplikasi
operasional (fungsional)!
Ada 4 sifat yang mencirikan data yang disimpan didalam data warehouse – ini
didefinisikan oleh salah satu mahaguru data warehousing (Bill Inmon).
18
Subject oriented: Aplikasi untuk operasi perusahaan (operational system) berorientasi
pada proses (mengotomasi fungsi-fungsi dari proses bersangkutan – function oriented).
Misalnya di bank, aplikasi kredit mengotomasi fungsi-fungsi: verifikasi lamaran dan
credit checking, pemeriksaan kolateral, approval, pendanaan, tagihan, dan seterusnya.
Didalam data warehouse data-data yang dihasilkan dari proses kredit ini, diatur kembali
(dikelompokkan) dan diintegrasikan (digabung) dengan data-data dari fungsi-fungsi
lain, agar berorientasi pada misalnya nasabah dan produk.
Non-volatile: Sekali masuk kedalam data warehouse, data-data, terutama data tipe
transaksi, tidak akan pernah di update atau dihapus (delete).
19
BAB III
PENUTUP
A. KESIMPULAN
Pada proses Data Mining hal yang paling penting adalah pada tahap “Data
Mining” dengan menggunakan teknik-teknik yang diaplikasikan untuk
mengekstrak pola-pola potensial yang berguna. Kesimpulan pembahasan ini adalah
penggunaan data mining bagi menyusun strategi pemasaran (marketing). Dimana
data mining dapat mempermudah suatu perusahaan (bank) dalam mengambil
sebuah keputusan tepat sehingga meninggkatkan keuntungan perusahaan (bank).
A. SARAN
Berikut adalah saran yang mungkin perlu dilakukan dalam
pengembangan selanjutnya dimasa yang akan datang terhadap aplikasi data
mining dengan metode clustering:
Dimasa yang akan datang dalam pengembangan selanjutnya, guna lebih
memaksimalkan pendukung keputusan yang akan diambil, misalkan untuk
kepentingan memudahkan kegiatan promosi bisa ditambahkan sebuah fasilitas
berupa fasilitah pengiriman email kepada customer
DAFTAR PUSTAKA
20
Fayyad, U., Piatetsky-Shapiro, G. dan Smyth, P. (1996), From Data Mining to
Knowledge Discovery in Databases, AAAI and The MIT Pres, 37-53.
Kadir. Abdul, 2008, Mudah Menjadi Programmer Visual Basic, Andi Offset
Yogyakarta. Yogytakarta,
Turban, E., and Aronson, J.E., 2001, Decission Support System and |Intelligent
System, 6th Edition, Prentice Hall Inc., New Jersey.
21