Andis Work Pti Paper Fix

TUGAS
MATA KULIAH PTI

PENGERTIAN DAN PENGETAHUAN TENTANG
DATA WARE HOUSE DAN DATA MINING
DI SUSUN OLEH :
DANIEL ANDIS DWI ADMOJO
SEMESTER 1
JURUSAN TEKNIK INFORMATIKA

STMIK PESAT NABIRE
I
KATA PENGANTAR
Puji dan syukur atas kehadirat Tuhan Yang Maha Esa. karena atas rahmat dan karunia-Nya
memberikan kesehatan dan kelapangan waktu bagi penulis sehingga dapat menyelesaikan
makalah dengan lancar.
Judul makalah ini ialah mengenai “Data Warehouse” DAN “Data Mining”. Adapun tujuan
penulisan makalah ini ialah untuk memberikan informasi mengenai berbagai hal yang
berhubungan dengan Data Warehouse Dan Data Minning.
Penulis menyadari bahwa makalah ini masih jauh dari sempurna. Oleh karena itu, penulis
dengan senang hati akan menerima segala kritikan yang bersifat membangun dan saran-saran
yang akhirnya dapat memberikan manfaat bagi makalah ini. Akhir kata, penulis mengucapkan
terimakasih.
ii
DAFTAR ISI
KATA PENGANTAR......................................................................................................ii
DAFTAR ISI....................................................................................................................1
BAB I...............................................................................................................................2
PENDAHULUAN...........................................................................................................2
A. Latar Belakang......................................................................................................2
B. Rumusan Masalah.................................................................................................3
C. Tujuan...................................................................................................................3
D. Batasan Masalah...................................................................................................3
BAB II PEMBAHASAN.................................................................................................4
1. KEBUTUHAN BISNIS........................................................................................4
3. KEBUTUHAN DAN KESEMPATAN UNTUK DATA MINING.......................6
A. BAHASAN UMUM DATA MINING......................................................................6
1. Definisi Data Mining............................................................................................6
2. Ruang Lingkup Data Mining................................................................................7
3. Cara Kerja Data Mining........................................................................................8
4. BAHASAN TEKNIS DATA MINING.................................................................9
5. Metodologi Data Mining....................................................................................10
6. Tugas Utama Data Mining.................................................................................10
B. DATA WARE HOUSE...........................................................................................16
1. MEMANFAATKAN HUBUNGAN REFLEXIVE............................................17
2. EMPAT KARAKTERISTIK DATA WAREHOUSE..........................................19
BAB III..........................................................................................................................20
PENUTUP.....................................................................................................................20
A. KESIMPULAN..........................................................................................................20
B. SARAN......................................................................................................................20
1
BAB I
PENDAHULUAN
A. Latar Belakang
Tahun 90-an telah melahirkan “gunungan” data di bidang ilmu pengetahuan,

bisnis dan pemerintah. Kemampuan teknologi informasi untuk mengumpulkan dan
menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis,
meringkas dan mengekstraksi “pengetahuan” dari data. Metodologi tradisional untuk
menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Sementara
para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data
yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi
baru yang menjawab kebutuhan ini, yaitu data
mining.
Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan-perusahaan
untuk memecahkan berbagai permasalahan bisnis. Makalah ini akan membahas
kebutuhan bisnis, solusi yang dipikirkan para pelaku bisnis, pemanfaatan, cara kerja
tugas dan metodologi-metodologi populer pada data mining. Bahasan akan diberikan
dari sudut pandang pelaku bisnis dan peneliti. Hal ini dimaksudkan agar para pembaca
memperoleh gambaran yang kongkret mengenai data mining di dunia bisnis, sekaligus
juga mengenal konsep-konsep teoretis yang melandasi teknologi data mining.
Data mining dikenal di dunia sains dan matematis namun
juga digunakan secara lebih luas oleh para pemasar untuk merangkum data konsumen
dari beragam Web site.
Data mining muncul setelah banyak dari pemilik data baik perorangan maupun
organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun,
misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan
sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus
dilakukan terhadap tumpukan data tersebut.
Misalnya, perangkat lunak data mining bisa membantu perusahaan ritel untuk
menemukan pelanggan yang memiliki ketertarikan tertentu. Istilah ini umumnya
dipersempit artinya yaitu hanya untuk menggambarkan perangkat lunak yang
merepresentasikan data dengan cara-cara yang baru. Namun sebenarnya perangkat
lunak data mining tidak hanya berfungsi mengubah presentasi tersebut, melainkan juga
menemukan relasi tak dikenal antar-data.
2
B. Rumusan Masalah
Adapun rumusan masalah yang dapat diambil dalam uraian latar belakang di
atas adalah:
1. Apa yang dimaksud kebutuhan bisnis?
2. pemahaman permasalahn dan konsep dasar solusi bisnis?
3. Apa saja kebutuhan dan kesempatan untuk data mining?
4. Apa saja bahasa umum data mining ?
5. Apa Definisi Data Mining?
6. Apa saja Ruang Lingkup Data Mining?
7. Memahami Cara Kerja Data Mining?
8. Memahami bahasan teknis data mining?
9. Memahami metodologi data mining yang populer?
10. Memahami teknologi yang mendatangkan profit?
11. Memahami pengembangan kdd dan data mining?
12. Apa Defenis data ware house?
13. Apa saja karakteristik data ware house?
C. Tujuan
Penulisan Paper ini bertujuan adalah sebagai

berikut:
1. Untuk mengetahui kebutuhan bisnis

2. Untuk mengetahui permasalahn dan konsep dasar solusi bisnis
3. Untuk mengetahui kebutuhan dan kesempatan untuk data mining

4. Untuk mengetahui bahasan umum data mining
5. Untuk mengetahui Data Mining
6. Untuk mengetahui Ruang Lingkup Data Mining
7. Untuk mengetahui Cara Kerja Data Mining
8. Untuk mengetahui bahasan teknis data mining
9. Untuk mengetahui metodologi data mining yang populer
10. Untuk mengetahui teknologi yang mendatangkan profit
11. Untuk mengetahui pengembangan kdd dan data mining
12. Untuk mengetahui data ware house
13. Untuk mengetahui karakteristik data ware house?
D. Batasan Masalah
Batasan masalah dalam penulisan makalah ini adalah pengertian data

warehouse, pengertian data MINING, karakteristik data warehouse, pengertian data
3
MINIG arsitektur data warehouse, arsitektur data MINING keuntungan, cara
membangun data warehouse, MINING dan penggunaannya di dalam perusahaan.
BAB II
PEMBAHASAN
1. KEBUTUHAN BISNIS
Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya
harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin
mengembangkan skala bisnis mereka. Untuk mencapai hal itu, dapat diringkaskan tiga
kebutuhan bisnis, yaitu:
a) Penambahan jenis maupun peningkatan kapasitas produk.
b) Pengurangan biaya operasi perusahaan.
c) Peningkatan efektifitas pemasaran dan keuntungan.
Untuk memenuhi kebutuhan-kebutuhan di atas, banyak cara yang dapat ditempuh. Salah
satunya adalah dengan memikirkan teknik-teknik pemasaran yang efektif dengan biaya
yang minimal. Berikut ini akan dibahas mengenai hal-hal yang berkaitan dengan
kegiatan bisnis di bidang pemasaran, seperti identifikasi dan pemahaman permasalahan,
analisis pencarian solusi dan pembahasan teknik-teknik untuk mengimplementasikan
solusi.
2. 2. PEMAHAMAN PERMASALAHAN DAN KONSEP DASAR SOLUSI

BISNIS
Langkah pertama untuk menyelesaikan permasalahan bisnis adalah mendefinisikan
permasalahan dengan sejelas-jelasnya. Sebagai contoh, permasalahan umum yang
dihadapi oleh perusahaan-perusahaan dot-com adalah:
(1) Bagaimana menyajikan advertensi kepada target yang tepat sasaran.

(2) Menyajikan halaman Web yang khusus untuk setiap customer (mempersonalisasi
halaman Web) agar kustomer merasa diperlakukan secara khusus dan karenanya
akan tetap setia dengan perusahaan itu.
(3) Menampilkan informasi produk-produk lain yang biasa dibeli bersamaan dengan
produk tertentu.
(4) Mengklasifikasi artikel-artikel secara otomatis.
(5) Mengelompokkan pengunjung Web yang memiliki kesamaan karakteristik tertentu.
(6) Mengestimisasi data yang hilang.
(7) Memprediksi kelakukan di masa yang akan datang.
Pencarian solusi dari masalah-masalah ini akan berkaitan dengan penemuan dan
pemanfaatan dari berbagai jenis pola-pola yang tersembunyi dari gudang datayang
kemungkinan sudah dimiliki oleh perusahaan. Penjelasan lebih lanjut dari masalah-
masalah di atas dan konsep dasar yang dipikirkan oleh para pelaku dan penganalisis
bisnis sebagai solusinya diberikan di bawah ini :
a. Perumusan target.
Para ahli pemasaran menggunakan teknik-teknik tertentu untuk memilih orang-
orang yang menjadi target pemasaran untuk disuguhi advertensi tertentu. Tujuannya
4
antar lain adalah untuk meningkatkan profit perusahaan, pengenalan produk secara
luas, atau hasil-hasil terukur lainnya.
b. Personalisasi.
Para ahli pemasaran memanfaatkan personalisasi untuk memilih advertensi yang
paling sesuai untuk (atau memberikan rekomendasi tertentu kepada) orang tertentu.
Personalisasi dapat dipandang sebagai kontradiksi dari “perumusan target”. Pada
perumusan target, yang disasar adalah sebanyak mungkin orang yang memiliki
potensi untuk membeli produkproduk tertentu, sedangkan pada personalisasi,
tujuannya adalah agar kustomer yang sudah menjadi pelanggan membeli sebanyak
mungkin produkproduk yang dijual oleh perusahaan.
c. Asosiasi (juga dinamakan analisis keranjang-pasar).

Asosiasi ini mengidentifikasi item-item produk yang mungkin dibeli bersamaan
dengan produk lain, atau “dilihat” secara bersamaan pada saat mencara informasi
mengenai produk tertentu. Pada halaman Web, kustomer diingatkan untuk melihat
atau membeli produk-produk yang berkaitan dengan produk yang menjadi minat
kustomer.
d. Manajemen pengetahuan.
Sistem ini mengidentifikasi dan memanfaatkan pola-pola di dalam dokumen
yang berbahasa alami, atau berformat text. Di sini didefinisikan asosiasi antara kata-
kata dan konteksnya dalam konsep tingkat-atas. Hal ini dapat dilakukan dengan
“melatih” sistem dengan dokumen-dokumen yang sudah ditandai dengan konsep-
konsep yang relevan. Sistem kemudian membangun sebuah pencocok pola untuk
tiap konsep. Ketika dihadapkan pada dokumen baru, pencocok pola akan
memutuskan tingkat relevansi dari dokumen ini terhadap konsep. Pendekatan ini
dapat digunakan untuk menyortir dokumen-dokumen baru yang masuk ke dalam
kategori-kategori yang sudah ada. Juga dapat digunakan untuk mempersonalisasi
publikasi online. Selain itu, dapat juga dimanfaatkan untuk menciptakan atau
membangkitkan dokumen jawaban-jawaban secara otomatis terhadap pertanyaan-
pertanyaan yang masuk.
e. Pengelompokan (Clustering).
Pengelompokan mengidentifikasi orang-orang yang memiliki kesamaan
karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai
“vektor karakteristik” atau “centroid”. Pengelompokan ini digunakan oleh
perusahaan untuk membuat laporan mengenai karakteristik umum dari grup-grup
pengunjung (kustomer) yang berbeda.
f. Estimasi dan Prediksi.

Estimasi menerka sebuah nilai yang belum diketahui, misalnya penghasilan
seseorang, ketika informasi lain mengenai orang tersebut diketahui. Prediksi
memperkirakan nilai untuk masa mendatang, misalnya probabilitas orang untuk
membeli sebuah mobil baru tahun depan, ketika orang itu belum melakukannya.
Atau nilai saham yang akan dibeli tahun depan.
g. Pohon keputusan.
5
Pohon keputusan ini dapat dipandang sebagai diagram alir dari titik-titik
pertanyaan yang menuju pada sebuah keputusan. Pohon keputusan ini diterapkan
pada sistem pemilihan produk-produk yang dijual perusahaan.
3. KEBUTUHAN DAN KESEMPATAN UNTUK DATA MINING
Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan)

sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan
infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya
teknologi data mining.
Ketersediaan data transaksi dalam volume yang besar: Bidang-bidang industri yang
memiliki data transaksi dalam volume besar ini misalnya jaringan ritel, telekomunikasi,
perbankan, kartu kredit, dll. Sistem manajemen transaksi pada industri tersebut
merekord informasi-informasi rinci yang diperlukan dalam bisnis mereka.
Informasi sebagai aset perusahaan yang penting: Kebutuhan terhadap informasi
telah melahirkan gudang data yang mengintegrasikan informasi dari sistem-sistem yang
tersebar untuk mendukung pengambilan keputusan. Seringkali gudang data ini juga
dilengkapi dengan data demografis kustomer dan informasi mengenai rumah-tangga.
Ketersediaan teknologi informasi dalam skala yang terjangkau: Saat ini teknologi
informasi berbasis sistem yang terbuka sudah dapat diadopsi secara luas. Ini termasuk
sistem manajemen basis data, kakas penganalisis, dan yang terkini adalah pertukaran
informasi dan publikasi melalui jaringan Intranet. Faktor-faktor tersebut di atas
dikombinasikan dengan konsep solusi bisnis yang telah diuraikan sebelumnya, telah
melahirkan teknologi data mining. Data mining dimaksudkan untuk memberikan solusi
nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis
mereka.B
A. BAHASAN UMUM DATA MINING
Data Mining merupakan teknologi baru yang sangat berguna untuk membantu
perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data
mereka. Kakas data mining meramalkan tren dan sifat-sifat perilaku bisnis yang sangat
berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi
yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung
keputusan tradisional yang sudah banyak digunakan. Data Mining dapat menjawab
pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu
untuk menjawabnya. Data Mining mengeksplorasi basis data untuk menemukan pola-
pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan
oleh para pelaku bisnis karena terletak di luar ekspektasi mereka.
1. Definisi Data Mining
Data mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-
relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini
adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam
teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat
juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis
6
text, dan multimedia (citra). Data mining dapat juga didefinisikan sebagai “pemodelan
dan penemuan polapola yang tersembunyi dengan memanfaatkan data dalam volume
yang besar”. Data mining menggunakan pendekatan discovery-based dimana
pencocokan pola (pattern-matching) dan algoritmaalgoritma yang lain digunakan untuk
menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining merupakan
komponen baru pada arsitektur sistem pendukung keputusan (DSS) di perusahaan-
perusahaan.
Beberapa pengertian data mining yang berhasil penulis himpun dari beberapa
pendapat adalah sebagai berikut.
1. Secara sederhana dapat didefinisikan bahwa Data mining adalah ekstraksi informasi
atau pola yang penting atau menarik dari data yang ada di database yang besar
sehingga menjadi informasi yang sangat berharga[1].
2. Data mining merupakan proses penemuan yang efisien sebuah pola terbaik yang
dapat menghasilkan sesuatu yang bernilai dari suatu koleksi data yang sangat
besar[2].
3. Data mining adalah suatu pola yang menguntungkan dalam melakukan search pada
sebuah database yang terdapat pada sebuah model. Proses ini dilakukan berulang-
ulang (iterasi) hingga didapat satu set pola yang memuaskan yang dapat berfungsi
sesuai yang diharapkan [3].
4. Data mining adalah sebuah class dari suatu aplikasi database yang mencari pola-
pola yang tersembunyi di dalam sebuah group data yang dapat digunakan untuk
memprediksi prilaku yang akan datang[7].
5. Data mining adalah suatu kelas aplikasi database yang berfungsi melakukan
pencarian pola-pola tersembunyi di dalam suatu kumpulan data yang bisa digunakan
untuk memprediksikan trend atau perilaku yang akan datang.
Berdasarkan beberapa pengertian diatas dapat ditarik kesimpulan bahwa data

mining adalah suatu algoritma di dalam menggali informasi berharga yang terpendam
atau tersembunyi pada suatu koleksi data (database) yang sangat besar sehingga
ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui. Oleh sebab itu
istilah data mining sering disalahgunakan untuk menggambarkan perangkat lunak yang
mengolah data dengan cara yang baru. Sebenarnya perangkat lunak data mining bukan
hanya mengganti presentasi, tetapi benarbenar menemukan sesuatu yang sebelumnya
belum diketahui menjadi muncul diantara sekumpulan data yang ada. Bahkan dengan
menggunakan data mining dapat memprediksikan prilaku dan tren yang akan terjadi
kemudian, sehingga bisa membuat para pengusaha menjadi lebih proaktif dan dapat
mengambil keputusan
dengan benar.
2. Ruang Lingkup Data Mining
Data mining (penambangan data), sesuai dengan namanya, berkonotasi sebagai

pencarian informasi bisnis yang berharga dari basis data yang sangat besar. Usaha
pencarian yang dilakukan dapat dianalogikan dengan penambangan logam mulia dari
lahan sumbernya. Dengan tersedianya basis data dalam kualitas dan ukuran yang
memadai, teknologi data mining memiliki kemampuan-kemampuan sebagai berikut :
! Mengotomatisasi prediksi tren dan sifat-sifat bisnis. Data mining mengotomatisasi
proses pencarian informasi pemprediksi di dalam basis data yang besar.
Pertanyaanpertanyaan yang berkaitan dengan prediksi ini dapat cepat dijawab langsung
7
dari data yang tersedia. Contoh dari masalah prediksi ini misalnya target pemasaran,
peramalan kebangkrutan dan bentukbentuk kerugian lainnya.
Mengotomatisasi penemuan pola-pola yang tidak diketahui sebelumnya. Kakas data

mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya
tersembunyi dalam satu sapuan. Contoh dari penemuan pola ini adalah analisis pada
data penjulan ritel untuk mengidentifikasi produkproduk, yang kelihatannya tidak
berkaitan, yang seringkali dibeli secara bersamaan oleh kustomer. Contoh lain adalah
pendeteksian transaksi palsu dengan kartu kredit dan identifikasi adanya data anomali
yang dapat diartikan sebagai data salah ketik (karena kesalahan operator).
3. Cara Kerja Data Mining
Bagaimana tepatnya data mining “menggali” hal-hal penting yang belum

diketahui sebelumnya atau memprediksi apa yang akan terjadi? Teknik yang digunakan
untuk melaksanakan tugas ini disebut pemodelan. Pemodelan di sini dimaksudkan
sebagai kegiatan untuk membangun sebuah model pada situasi yang telah diketahui
“jawabannya” dan kemudian menerapkannya pada situasi lain yang akan dicari
jawabannya. Sebagai contoh di sini diambil pencarian solusi bisnis di bidang
telekomunikasi3. Ada beberapa perusahaan telekomunikasi yang beroperasi di sebuah
negara dan dimisalkan pihak manajemen sebuah perusahaan bermaksud untuk
menjaring kustomer baru untuk jasa layanan sambungan langsung jarak jauh (SLJJ).
Pihak manajemen dapat “menghubungi” calon-calon kustomer dengan memilih secara
acak kemudian menawari mereka dengan diskon khusus, dengan hasil yang
kemungkinan besar kurang menggemberikan, atau dengan memanfaatkan pengalaman-
pengalaman bisnis yang saat ini sudah tersimpan di basis data perusahaan untuk
membangun sebuah model. Perusahaan ini telah memiliki banyak informasi mengenai
kustomer perusahaan tersebut: umur, jenis kelamin, sejarah penggunaan fasilitas kredit
dan penggunaan SLJJ. Juga sudah diketahui informasi mengenai calon-calon kustomer:
umur, jenis kelamin, sejarah penggunaan fasilitas kredit, dll. Masalahnya adalah
penggunaan SLJJ untuk para calon kustomer ini belum diketahui, karena mereka saat ini
menjadi kustomer dari perusahaan lain. Yang dipikirkan pihak manajemen adalah
mencari calon kustomer yang akan menggunakan banyak jasa SLJJ. Usaha untuk
mencari jawaban masalah ini dilakukan dengan membangun sebuah model. Tabel 1
memberikan ilustrasi mengenai pembangunan model untuk menentukan calon kustomer
(prospek) di sebuah gudang data.
Gol dari pemodelan ini adalah untuk membuat perkiraan yang didasari kalkulasi untuk
mengisi informasi di kuadran kanan bawah pada Tabel 1, berdasar pada informasi
umum dan khusus yang sudah ada (dimiliki oleh perusahaan itu). Misalnya, sebuah
model sederhana untuk perusahaan telekomunikasi itu adalah: 98% kustomer “milik”
perusahaan itu yang berpenghasilan $60.000/tahun membelanjakan lebih dari $80/bulan
untuk penggunaan SLJJ. Model ini kemudian
8
dapat diterapkan untuk menarik kesimpulan dari informasi khusus (sebagai data
prospek), dimana saat ini informasi khusus tersebut tidak dimiliki oleh perusahaan.
Dengan model ini, calon-calon kustomer baru dapat ditarget secara selektif. Skenario
lain dalam membangun model adalah: memprediksi apa yang akan terjadi di masa
mendatang. Model ini ditunjukkan oleh Tabel 2.
4. BAHASAN TEKNIS DATA MINING
Hubungan Data Mining dan Knowledge Data Discovery (KDD)

Penjelasan umum yang diberikan di atas memberikan pengertian bahwa seolah-olah
teknologi data mining adalah teknologi utuh dan berdiri sendiri. Dibandingkan dengan
knowledge data discovery (KDD), istilah data mining lebih dikenal para pelaku bisnis.
Pada aplikasinya, sebenarnya data mining merupakan bagian dari proses KDD. Sebagai
komponen dalam KDD, data mining terutama berkaitan dengan ekstraksi dan
penghitungan pola-pola dari data yang ditelaah.
Secara garis besar, langkah-langkah utama dalam proses KDD adalah (lihat Gambar 1):
1. Pemahaman terhadap domain dari aplikasi, relevansinya terhadap pengetahuan yang

ada dan goal dari end-user.
2. Menciptakan himpunan data target : pemilihan himpunan data, atau memfokuskan
pada subset variabel atau sampel data, dimana penemuan (discovery) akan
dilakukan.
3. Pemrosesan pendahuluan dan pembersihan data: operasi dasar seperti penghapusan
noise dilakukan.
4. Proyeksi dan pengurangan data : pencarian fitur-fitur yang berguna untuk
mempresentasikan data bergantung kepada goal yang ingin dicapai.
5. Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi,
regresi, clustering, dll.
9
6. Pemilihan algoritma data mining untuk pencarian (searching).
7. Data mining: pencarian pola-pola yang diinginkan di himpunan representasi.
8. Penterjemahan pola-pola yang dihasilkan dari data mining (langkah 7),
kemungkinan dapat kembali langkah 1-7 untuk iterasi lebih lanjut.
9. Konsolidasi pengetahuan yang ditemukan : pendokumentasian hasil, pencarian
penyelesaian apabila ada konflik dengan pengetahuan yang telah dipercaya
sebelumnya.
5. Metodologi Data Mining
Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif
yang berulang dari metodologi data mining tertentu. Pada pembahasan di sini akan
digunakan istilah pola dan model. Pola dapat diartikan sebagai instansiasi dari model.
Sebagai contoh f(x) = 3x2 + x adalah pola dari model f(x) = ax2 + bx. Data mining
melakukan “pengepasan” atau pencocokan model ke, atau menentukan pola dari data
yang diobservasi. Ada dua pendekatan matematis yang digunakan dalam pencocokan
model: statistik yang memberikan efek non-deterministik dan logik yang murni
deterministik. Yang lebih banyak digunakan adalah pendekatan statistik, mengingat
ketidakpastian yang ada dalam proses pembangkitan data di dunia nyata. Kebanyakan
metodologi data mining didasarkan pada konsep mesin belajar, pengenalan atau
pencocokan pola dan statistik: klasifikasi, pengelompokan
(clustering), pemodelan grafis, dll.4
6. Tugas Utama Data Mining
Telah disebutkan di ruang lingkup data mining bahwa pada kebanyakan aplikasinya,
gol utama dari data mining adalah untuk membuat prediksi dan deskripsi. Prediksi
menggunakan beberapa variabel atau field-field basis data untuk memprediksi nilai-nilai
variabel masa mendatang yang diperlukan, yang belum diketahui saat ini. Deskripsi
berfokus pada penemuan pola-pola tersembunyi dari data yang ditelaah. Dalam konteks
KDD, deskripsi dipandang lebih penting daripada prediksi4. Ini berlawanan dengan
aplikasi pengenalan pola dan mesin belajar. Prediksi dan deskripsi pada data mining
dilakukan dengan tugas-tugas utama yang akan dijelaskan di bawah ini. Pada setiap
tugas akan diberikan pointer ke masalah bisnis yang dapat diselesaikan (yang telah
dibahas pada butir 3). Gambar-gambar yang ada dimisalkan menunjukkan hubungan
antara penghasilan pengecer dan kekurangan pembayaran yang ditanggung oleh
distributor (pemasok barang).
a) Klasifikasi adalah fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah
unsur (item) data ke dalam salah satu dari beberapa kelas yang sudah didefinisikan.
Gambar 2 menunjukkan pembagian sederhana pada data peminjaman menjadi dua
ruang kelas (punya dan tidak punya peminjaman). Pada gambar tersebut x
merepresentasikan peminjaman yang bermasalah dan o peminjaman yang
pengembaliannya lancar. (Sebagai solusi 3.e, 3.d dan 3.g).
10
b) Regresi adalah fungsi pembelajaran yang memetakan sebuah unsur data ke sebuah
variabel prediksi bernilai nyata. Aplikasi dari regresisi ini misalnya adalah pada
prediksi volume biomasa di hutan dengan didasari pada pengukuran gelombang
mikro penginderaan jarak jauh (remotely-sensed), prediksi kebutuhan kustomer
terhadap sebuah produk baru sebagai fungsi dari pembiayaan advertensi, dll.
Gambar 3 menunjukkan regresi linear sederhana dimana “total peminjaman” (total
debt) diplot sebagai fungsi linier dari penghasilan (income) : pengeplotan ini
menghasilkan kesalahan besar karena hanya ada korelasi sedikit antara kedua
variabel ini. (Solusi 3.a dan 3.f)
c) Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan

dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk
mendeskripsikan data yang ditelaah. Kategori-kategori ini dapat bersifat eksklusif
dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti
kategori yang hirarkis atau saling menumpu (overlapping). Gambar 4 menunjukkan
pembagian himpunan data peminjaman menjadi 3 cluster. Di sini, cluster - cluster
11
dapat saling menumpu, sehingga titik-titik data dapat menjadi anggota lebih dari
satu cluster. (Label x dan o pada gambar sebelumnya diubah menjadi + untuk
mengindikasikan bahwa keanggotaan kelas diasumsikan belum diketahui.) (Solusi
3.e).
d) Peringkasan melibatkan metodologi untuk menemukan deskripsi yang ringkas dari

sebuah himpunan data. Satu contoh yang sederhana adalah mentabulasikan mean
dan deviasi standar untuk semua field-field tabel. (Solusi 3.f).
e) Pemodelan Kebergantungan adalah penemuan sebuah model yang mendeskripsikan
kebergantungan yang signifikan antara variabelvariabel. Model kebergantungan ini
ada di 2 tingkat: tingkat struktural yang menspesifikasikan variabelvariabel yang
secara local bergantung satu sama lain, dan tingkat kuantitatif yang
menspesifikasikan tingkat kebergantungan dengan menggunakan skala numerik.
(Solusi 3.c).
f) Pendeteksian Perubahan dan Deviasi berfokus pada penemuan perubahan yang
paling signifikan di dalam data dari nilai-nilai yang telah diukur sebelumnya.
(Solusi 3.f)
Komponen Algoritma Data Mining
Setelah tugas-tugas utama dari data mining didefinisikan seperti di atas, maka perlu
dirumuskan algoritma-algoritma untuk mencari solusi dari tugas-tugas tersebut di atas.
Dalam setiap algoritma data mining ada tiga komponen utama yaitu representasi model,
evaluasi model dan metodologi pencarian.
a) Representasi Model adalah bahasa untuk mendeskripsikan pola-pola yang dapat
ditemukan. Jika representasi terlalu terbatas, maka tidak akan ada jumlah waktu
pelatihan maupun sampel yang mencukupi, yang akan menghasilkan model yang
akurat untuk data.
b) Evaluasi Model mengestimasi tingkat kecocokan sebuah pola tertentu untuk
memenuhi kriteria pada proses KDD. Evaluasi pada keakuratan prediksi (validasi)
didasarkan pada validasi silang. Evaluasi kualitas deskriptif berkaitan dengan
12
akurasi, kebaruan, utilitas dan kemampuan untuk dipahami dari model yang
diterapkan. Kriteria logika dan statistik dapat digunakan untuk evaluasi model.
c) Metodologi Pencarian terdiri dari dua komponen: pencarian parameter dan
pencarian model. Pada pencarian parameter, algoritma harus mencari parameter-
parameter yang mengoptimisasi kriteria evaluasi model dengan tersedianya data
yang diobservasi dan representasi model yang tetap. Pencarian model terjadi sebagai
sebuah loop di atas metodologi pencarian parameter : representasi model diubah
sehingga dibentuk satu keluarga model-model.
Untuk setiap representasi model, metodologi pencarian parameter diinstansiasi untuk

mengevaluasi kualitas dari model itu. Implementasi metodologi pencarian model
cenderung untuk menggunakan teknik pencarian heuristic.
7. METODOLOGI DATA MINING YANG POPULER
Ada banyak metodologi data mining, tapi di sini hanya akan dibahas yang populer
saja. Bahasan metodologi akan meliputi segi representasi model, evaluasi model dan
metodologi pencarian.
a. Aturan dan Pohon Keputusan

Metodologi ini, yang menggunakan pemisahan (split) univariate, mudah dipahami
oleh pemakai karena bentuk representasinya yang sederhana. Akan tetapi, batasan-
batasan yang diterapkan pada representasi aturan dan pohon tertentu dapat secara
signifikan membatasi bentuk fungsional dari model. Sebagai contoh, Gambar 2
memberikan ilustrasi mengenai efek penerapan pemisahan, yang didasarkan pada nilai
ambang tertentu, pada variabel penghasilan (income) di himpunan data peminjaman :
sangat jelas terlihat bahwa penerapan pemisahan nilai ambang sederhana sangat
membatasi tipe batas (boundary) klasifikasi yang dapat dihasilkan. Jika ruang model
dilebarkan untuk memfasilitasi ekspresi-ekspresi yang lebih umum (misalnya
multivariate hyperplanes pada berbagai sudut), maka model ini menjadi lebih canggih
untuk prediksi. Hanya saja, mungkin akan lebih sulit untuk dipahami pemakai.
Metodologi ini terutama digunakan untuk pemodelan prediksi, keduanya untuk
klasifikasi dan regresi4. Selain itu, dapat digunakan juga untuk pemodelan deskripsi
ringkasan.
b. Metodologi Klasifikasi dan RegresiNon-linier
Kedua metodologi ini terdiri dari sekumpulan teknik-teknik untuk memprediksi

kombinasi variabel-variabel masukan yang pas dengan kombinasi linier dan non-linier
pada fungsi-fungsi dasar (sigmoid, splines, polinomial). Contohnya antara lain adalah
jaringan saraf feedforward, metodologi spline adaptif, dan proyeksi regresi pursuit.
Gambar 5 menunjukkan tipe boundary keputusan non-linier yang mungkin dihasilkan
oleh jaringan saraf. Metodologi regresi non-linier, walaupun canggih dalam
representasinya, mungkin sulit untuk diinterpretasikan. Gambar 5 bisa jadi lebih akurat
dibandingkan dengan Gambar 2, tapi Gambar 2 lebih mudah untuk diinterpretasikan
(jika penghasilan lebih dari t, maka peminjaman akan memiliki status yang bagus).
13
c. Metodologi Berbasis-sampel
Representasi dari metodologi ini cukup sederhana: gunakan sampel dari basis data
untuk mengaproksimasi sebuah model, misalnya, prediksi sampel-sampel baru
diturunkan dari properti sampel-sampel yang “mirip” di dalam model yang prediksinya
sudah diketahui. Teknik ini misalnya adalah klasifikasi tetanggaterdekat, algoritma
regresi dan sistem reasoning berbasis-kasus. Gambar 6 menunjukkan hasil dari
klasifikasi tetangga terdekat pada himpunan data peminjaman: kelas pada setiap titik di
dalam ruang 2-dimensi sama dengan kelas dari titik terdekat di dalam himpunan data
yang ditelaah dan orisinil.
Kekurangan pada metodologi berbasis sampel (misalnya jika dibandingkan dengan
14
berbasis-pohon) adalah dibutuhkannya metrik jarak yang akurat untuk mengevaluasi
jarak antara titik-titik data.
d. Model Kebergantungan Grafik Probabilistik
Model grafik menspesifikasikan kebergantungan probabilistik yang mendasari

sebuah model dalam menggunakan struktur grafik. Dalam bentuknya yang paling
sederhana, model ini menspesifikasikan variabel-variabel mana yang bergantung satu
sama lain. Pada umumnya, model ini digunakan dengan variabel kategorial atau bernilai
diskret, tapi pengembangan untuk kasus khusus, seperti densitas Gausian, untuk
variabel yang bernilai real (pecahan) juga dimungkinkan. Baru-baru ini riset di bidang
inteligensia buatan dan statistic dilakukan untuk mencari teknik dimana struktur dan
parameter-parameter pada model grafik “dipelajari” secara langsung dari basisdata.
e. Model Belajar Relasional
Jika aturan dan pohon-keputusan memiliki sebuah representasi yang terbatas pada
logika proporsional, pembelajaran relasional (yang juga dikenal sebagai pemrograman
logika induksi) menggunakan bahasa pola yang lebih sederhana dengan logika
tingkatsatu. Pembelajar relasional dengan mudah dapat menemukan formula seperti
X=Y. Kebanyakan riset pada metodologi evaluasi model untuk pembelajaran relasional
bersifat logik.
8. TEKNOLOGI YANG MENDATANGKAN PROFIT
Banyak perusahaan yang sudah meluncurkan aplikasi data mining (KDD) dan telah
mendapatkan keuntungan. Teknologi ini tidak hanya cocok untuk digunakan oleh
industri-industri yang mengelola informasi secara intensif seperti perbankan, tetapi juga
perusahaan apa saja yang ingin memanfaatkan gudang data untuk memanajemen
kustomer dengan lebih baik. Dua faktor penting yang menentukan keberhasilan
penggunaan dari data mining adalah : gudang data yang berukuran besar dan
terintegrasi dengan baik, dan pemahaman atau identifikasi yang baik terhadap proses
bisnis dimana data mining akan diaplikasikan5. Beberapa contoh bidang-bidang bisnis
yang telah berhasil menerapkan aplikasi data mining adalah :
a) Perusahaan farmasi dapat menganalisis aktivitas penjualan terkininya dan

menggunakan hasilnya untuk mentargetkan dokter-dokter yang berpotensi
menggunakan produknya dan menentukan aktifitas pemasaran yang paling efektif
untuk beberapa bulan mendatang.
b) Perusahaan kartu kredit dapat memanfaatkan data transaksi kustomer-kustomernya
untuk merancang produk kredit baru yang akan menarik minat para kustomer
tersebut.
c) Perusahaan transportasi yang menyediakan berbagai jenis pelayanan. Data mining
dapat digunakan untuk mengidentifikasi prospek-prospek pelayanan yang
menjanjikan keuntungan.
d) Perusahaan produk makanan atau kebutuhan sehari-hari. Data mining dapat
dimanfaatkan untuk meningkatkan penjualan produk ke para pengecer (retailer).
Data kustomer, pengiriman, aktivitas kompetitor dapat digunakan untuk
menganalisis sebab-sebab customer berpindah ke produk merek lain. Kemudian,
hasilnya dapat digunakan untuk menyusun strategi pemasaran yang lebih efektif.
15
9. PENGEMBANGAN KDD DAN DATA MINING
Walaupun telah banyak diaplikasikan di dunia bisnis dan mendatangkan profit,

teknologi KDD dan Data Mining masih memiliki tantangan-tantangan yang harus
diatasi. Riset untuk menyempurnakan KDD diperlukan antar lain untuk mengatasi :
a) Basisdata yang berukuran besar, dengan ratusan tabel, jutaan record dan berukuran
sampai dengan multigigabyte.
b) Dimensi yang besar, basisdata tidak hanya memiliki jutaan rekord tetapi juga jumlah
field (atribut, variabel) yang besar.
c) Data dan pengetahuan yang berubah terus sehingga pola-pola yang telah ditemukan
sebelumnya menjadi tidak berlaku lagi.
d) Data yang hilang dan banyak salah, hal ini banyak terjadi pada basis data.
e) Relasi antar-field basisdata yang kompleks. Saat ini data mining masih dirancang
untuk relasi yang cukup sederhana.
f) Integrasi dengan sistem lain. Sistem KDD standalone bisa jadi agak kurang
bermanfaat. Integrasi yang dimaksud bisa terjadi dengan DBMS, kakas-kakas
spreadsheet dan visualisasi, serta pencatat sensor waktu-nyata.
10. KESIMPULAN
Data mining, yang hadir sebagai teknologi untuk memanfaatkan ketersediaan data
bisnis yang melimpah, telah membantu para pelaku bisnis untuk mempertahankan dan
mengembangkan bisnis mereka. Akan tetapi, agar teknologi data mining dan KDD ini
dapat dimanfaatkan terus dengan baik, teknologi ini harus terus dapat “bekerja”
berdampingan dengan bidang lain di dunia teknologi informasi yang berkembang
dengan sangat cepat. Penyempurnaan di sana-sini masih terus diperlukan, karena itu
peluang riset di bidang ini masih terbuka lebar.
B. DATA WARE HOUSE
Data warehouse adalah kumpulan data yang dirancang untuk mendukung

pengambilan keputusan manajemen. Data warehouse berisi data yang berbeda-beda
yang memberikan gambaran kondisi bisnis pada saat tertentu.
Datawarehouse mendukung kemampuan melakukan query untuk mendukung
pengambilan keputusan, data warehouse lebih mudah dipahami oleh customer dilihat
kebutuhan informasi mereka dalam menaksir keadaan finansial, produk dan layanan,
serta waktu untuk memasarkan produk dan layanan baru. Yang terpenting – mungkin
juga harapan yang beresiko – data warehousing dapat dilihat sebagai teknologi, dengan
kemampuan unik untuk mengolah informasi, bertujuan untuk menghasilkan pendapatan
yang tinggi dan memperbesar keuntungan.
Pengembangan data warehouse meliputi pengembangan sistem untuk
mengekstrak data dari sistem dan instalasi sistem basisdata warehouse yang
memungkinkan manajer dapat mengakses data secara fleksibel. Secara umum istilah
data warehouse mengacu kepada basis data yang berbeda-beda yang dikumpulkan dari
seluruh bagian perusahaan.(dna)
16
1. MEMANFAATKAN HUBUNGAN REFLEXIVE
Saya masih ingat, betapa suksesnya kami (waktu itu saya masih di Indonesia)
mengerjakan proyek yang sama untuk sejumlah bank.; yaitu memproses penutupan
akhir hari dipusat komputer (system adalah terpusat, centralized), menyampaikan
informasi (laporan) kesemua cabang untuk buka kantor disetiap esok hari kerja. Laporan
berisi misalnya posisi rekening nasabah yang hari sebelumnya mengadakan transaksi.
Juga disiap- dan disebar-kan laporan sejenis untuk kantor wilayah yang mencakup
cabang-cabang dibawah naungannya, dan seterusnya berantai mengikuti jenjang
otonomi sistem perkantorannya.
Laporan ini berjenis-jenis, meskipun semuanya menggunakan sumber data yang
sama. Selain format (layout), strukturnya juga bervariasi. Ada yang diurutkan berdasar
besarnya transaksi, jenis laporan lain berdasar tipe rekening, dan untuk kantor wilayah
misalnya diurutkan dan dikelompokkan per kantor cabang.
Selain penggunaan sumber data yang sama, ada sebagian proses yang sama
diulang untuk setiap cabang (job stream sama sekali terpisah), terutama proses untuk
mengambil data yang dibutuhkan (extraction) dari database milik sistem operasional
bank (yang disiang harinya dipakai untuk menangani segala macam transaksi, baik atas
permintaan pelanggan melalui kantor cabang, ATM maupun internet banking, juga
proses administrasi oleh bank sendiri). Situasi ini dapat digambarkan sebagai berikut.
Mengapa mengambil dan memproses data yang sama berulang kali? Pertanyaan inilah
yang menjadi alasan utama mengapa data warehouse diperlukan.
Ada alasan lain, akibat situasi diatas, yang selalu menimbulkan keraguan pemakai
tingkat-atas (senior manager, misalnya kepala wilayah) akan kebenaran informasi yang
diperolehnya. Laporan harian pada contoh bank-bank diatas diatas dijadikan sumber
data oleh fungsi-fungsi dikantor cabang dan wilayah, untuk membuat laporan yang lain
untuk keperluan masing-masing. Akibat berantainya penggunaan dan pemrosesan
individu ini (terutama re-entry manual, perbedaan pengertian nilai data (definisi dan
makna) dan formula perhitungan), maka bila mereka mengadakan rekonsiliasi kembali
berdasar laporan individu tersebut (misalnya waktu rapat manajemen antar fungsi),
hampir selalu muncul masalah inconsistency informasi.
Sistem gudang data (Data Warehouse) dibangun untuk mengatasi masalah teknis dan
bisnis dalam kasus-kasus sejenis diatas, yaitu kasus kasus yang berkaitan dengan
17
pengunaan data dan informasi untuk mengambil keputusan bisnis dan manajemen.
Bandingkan gambar 2 berikut ini dengan
gambar 1.
Data hanya diambil dan diproses sekali, disimpan didalam data warehouse
(proses ini disebut ETL = Extract, Transform, Load); hanya bagian proses yang unik
dari setiap pemakaian data yang dilaksanakan masing-masing (biasanya menggunakan
software khusus – specialized tool).
Fungsi utama Data Warehouse adalah: Mengambil (termasuk data dari luar yang
dibutuhkan, misalnya daftar kode pos dari kantor pos), mengumpulkan, mempersiapkan
(transforming, seperti membersihkan, mengintegrasikan, decoding), menyimpan
(loading), dan menyediakan data untuk pemakai atau aplikasi yang bersifat
query/reporting (read-only); hanya satu data terpercaya ini yang digunakan oleh semua
yang membutuhkan (single version of truth), untuk pelaporan, analisa informasi dan
mengambil keputusan (analytical application).
Seperti digambarkan di Gambar 2, sekali data masuk kedalam data warehouse, data
yang memang dirancang dan ditujukan untuk bukan hanya satu atau sejumlah
pemakaian yang sudah diketahui, dapat digunakan untuk aplikasi mendatang dan belum
pernah sebelumnya terpikirkan- bandingkan ini dengan pembangunan aplikasi
operasional (fungsional)!
2. EMPAT KARAKTERISTIK DATA WAREHOUSE
Ada 4 sifat yang mencirikan data yang disimpan didalam data warehouse – ini
didefinisikan oleh salah satu mahaguru data warehousing (Bill Inmon).
18
Subject oriented: Aplikasi untuk operasi perusahaan (operational system) berorientasi
pada proses (mengotomasi fungsi-fungsi dari proses bersangkutan – function oriented).
Misalnya di bank, aplikasi kredit mengotomasi fungsi-fungsi: verifikasi lamaran dan
credit checking, pemeriksaan kolateral, approval, pendanaan, tagihan, dan seterusnya.
Didalam data warehouse data-data yang dihasilkan dari proses kredit ini, diatur kembali
(dikelompokkan) dan diintegrasikan (digabung) dengan data-data dari fungsi-fungsi
lain, agar berorientasi pada misalnya nasabah dan produk.
Integrated: Data dari macam-macam aplikasi transaksi (untuk bank misalnya:

tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada
yang spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk
kredit ada kolateral, untuk rekening koran ada overdraft) – didalam data warehouse
data-data yang sama harus diintegrasikan disatu database, termasuk misalnya
diseragamkan formatnya (sederhana tetapi paling sering terjadi – aplikasi-aplikasi
sering dibeli vendor berbeda, dibuat dengan/dijalankan di teknologi berbeda-beda).
Time variant: Data warehouse menyimpan sejarah (historical data). Bandingkan

dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir!
Waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse.
Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu
transaksi terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan
masuk ke data warehouse; juga hampir selalu disimpan versi, misalnya terjadi
perubahan definisi kode pos, maka yang lama dan yang baru ada semua didalam data
warehouse kita. Sekali lagi, data warehouse yang bagus adalah yang menyimpan
sejarah!
Non-volatile: Sekali masuk kedalam data warehouse, data-data, terutama data tipe
transaksi, tidak akan pernah di update atau dihapus (delete).
Terlihat, bahwa keempat karakteristik ini saling terkait – kesemuanya harus

diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk
mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini
membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem
operasional.
19
BAB III
PENUTUP
A. KESIMPULAN
Pada proses Data Mining hal yang paling penting adalah pada tahap “Data
Mining” dengan menggunakan teknik-teknik yang diaplikasikan untuk
mengekstrak pola-pola potensial yang berguna. Kesimpulan pembahasan ini adalah
penggunaan data mining bagi menyusun strategi pemasaran (marketing). Dimana
data mining dapat mempermudah suatu perusahaan (bank) dalam mengambil
sebuah keputusan tepat sehingga meninggkatkan keuntungan perusahaan (bank).
A. SARAN
Berikut adalah saran yang mungkin perlu dilakukan dalam
pengembangan selanjutnya dimasa yang akan datang terhadap aplikasi data
mining dengan metode clustering:
Dimasa yang akan datang dalam pengembangan selanjutnya, guna lebih
memaksimalkan pendukung keputusan yang akan diambil, misalkan untuk
kepentingan memudahkan kegiatan promosi bisa ditambahkan sebuah fasilitas
berupa fasilitah pengiriman email kepada customer
DAFTAR PUSTAKA
20
Fayyad, U., Piatetsky-Shapiro, G. dan Smyth, P. (1996), From Data Mining to
Knowledge Discovery in Databases, AAAI and The MIT Pres, 37-53.
Kadir. Abdul, 2008, Mudah Menjadi Programmer Visual Basic, Andi Offset
Yogyakarta. Yogytakarta,
Turban, E., and Aronson, J.E., 2001, Decission Support System and |Intelligent
System, 6th Edition, Prentice Hall Inc., New Jersey.
Indrajani,S.Kom.,MM.(2011).Pengantar dan Sistem Basis Data.PT Elex Media

Komputindo,Jakarta.
http://blog-elok.blogspot.co.id/2015/01/makalah-data-mining.html
21

Andis Work Pti Paper Fix

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Andis Work Pti Paper Fix

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS

MATA KULIAH PTI

JURUSAN TEKNIK INFORMATIKA

Tahun 90-an telah melahirkan “gunungan” data di bidang ilmu pengetahuan,

Penulisan Paper ini bertujuan adalah sebagai

1. Untuk mengetahui kebutuhan bisnis

3. Untuk mengetahui kebutuhan dan kesempatan untuk data mining

Batasan masalah dalam penulisan makalah ini adalah pengertian data

2. 2. PEMAHAMAN PERMASALAHAN DAN KONSEP DASAR SOLUSI

(1) Bagaimana menyajikan advertensi kepada target yang tepat sasaran.

c. Asosiasi (juga dinamakan analisis keranjang-pasar).

f. Estimasi dan Prediksi.

3. KEBUTUHAN DAN KESEMPATAN UNTUK DATA MINING

Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan)

A. BAHASAN UMUM DATA MINING

1. Definisi Data Mining

Berdasarkan beberapa pengertian diatas dapat ditarik kesimpulan bahwa data

2. Ruang Lingkup Data Mining

Data mining (penambangan data), sesuai dengan namanya, berkonotasi sebagai

Mengotomatisasi penemuan pola-pola yang tidak diketahui sebelumnya. Kakas data

3. Cara Kerja Data Mining

Bagaimana tepatnya data mining “menggali” hal-hal penting yang belum

4. BAHASAN TEKNIS DATA MINING

Hubungan Data Mining dan Knowledge Data Discovery (KDD)

1. Pemahaman terhadap domain dari aplikasi, relevansinya terhadap pengetahuan yang

5. Metodologi Data Mining

6. Tugas Utama Data Mining

c) Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan

d) Peringkasan melibatkan metodologi untuk menemukan deskripsi yang ringkas dari

Komponen Algoritma Data Mining

Untuk setiap representasi model, metodologi pencarian parameter diinstansiasi untuk

7. METODOLOGI DATA MINING YANG POPULER

a. Aturan dan Pohon Keputusan

b. Metodologi Klasifikasi dan RegresiNon-linier

Kedua metodologi ini terdiri dari sekumpulan teknik-teknik untuk memprediksi

Kekurangan pada metodologi berbasis sampel (misalnya jika dibandingkan dengan

d. Model Kebergantungan Grafik Probabilistik

Model grafik menspesifikasikan kebergantungan probabilistik yang mendasari

e. Model Belajar Relasional

8. TEKNOLOGI YANG MENDATANGKAN PROFIT

a) Perusahaan farmasi dapat menganalisis aktivitas penjualan terkininya dan

Walaupun telah banyak diaplikasikan di dunia bisnis dan mendatangkan profit,

B. DATA WARE HOUSE

Data warehouse adalah kumpulan data yang dirancang untuk mendukung

2. EMPAT KARAKTERISTIK DATA WAREHOUSE

Integrated: Data dari macam-macam aplikasi transaksi (untuk bank misalnya:

Time variant: Data warehouse menyimpan sejarah (historical data). Bandingkan

Terlihat, bahwa keempat karakteristik ini saling terkait – kesemuanya harus

Indrajani,S.Kom.,MM.(2011).Pengantar dan Sistem Basis Data.PT Elex Media

Anda mungkin juga menyukai