Anda di halaman 1dari 11

BAB 1

PENDAHULUAN

1.1 LATAR BELAKANG

Data warehousing dan data mining merupakan dasar-dasar arsitektural bagi sistem-sistem
pendukung keputusan. Keduanya memiliki hubungan simbiotik dimana data warehouse
menyiapkan tahapan untuk kegiatan data mining yang efektif. Teknologi data warehouse telah
memungkinkan sebuah organisasi untuk mengelola dan menyimpan data bisnis dalam volume
yang sangat besar dalam bentuk yang dapat dianalisa. Kematangan dalam bidang kecerdasan
buatan telah pula menciptakan sekumpulan teknik machine learning (mesin pembelajaran) yang
berguna untuk mengotomatisasi kegiatan-kegiatan penting dan melelahkan guna mengungkapkan
pola-pola dalam database.

Data warehouse adalah suatu konsep dan kombinasi teknologi yang memfasilitasi organisasi
untuk mengelola dan memelihara data historis yang diperoleh dari sistem atau aplikasi
operasional [Ferdiana, 2008].  Pemakaian teknologi data warehouse hampir dibutuhkan oleh
semua organisasi, tidak terkecuali Perpustakaan. Data warehouse memungkinkan integrasi
berbagai macam jenis data dari berbagai macam aplikasi atau sistem.

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan
data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata
mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar
material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu
seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data
mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap
pola-pola tersembunyi.

1
1.2 Rumusan Masalah
Untuk mengetahui pengertian, keuntungan dan manfaat dari Data Warehouse dan Data
Mining di kehidupan sehari-hari.

1.3 Tujuan Penulisan

Tujuan dari penelitian ini adalah untuk mencari pengertian data warehouse dan data
mining kegunaannya dan kelebihannya. Penulis juga ingin mencari tahu apakah data warehouse
data mining ini bisa menjadi solusi bagi latar belakang diatas

2
BAB II
PEMBAHASAN

2.1 Pengertian Data Warehouse


Menurut Inmon (2005:29), data warehouse adalah sekumpulan dari data yang subject-
oriented, integrated, time-variant, dan non-volatile untuk mendukung proses pembuatan
keputusan manajemen. Sedangkan menurut McLeod & Schell (2008:249), data warehouse
merupakan perkembangan dari konsep database yang menyediakan suatu sumber data yang lebih
baik bagi para user dan memungkinkan user untuk memanipulasi dan menggunakan data tersebut
secara intuitif. Dikutip dari jurnal Al-Debei (2011:164), data warehouse sangat dikenal sebagai
sebuah infrastruktur, beberapa aplikasi bisa dijalankan dalam data warehouse seperti CRM dan
DSS. Disisi lain, beberapa teknik yang bisa digunakan untuk ekstraksi business intelligence
dalam data warehouse seperti data mining, OLAP dan dashboard. Data warehouse digunakan
oleh manager dikarenakan mendukung dalam proses pengambilan keputusan. Jadi, dapat
disimpulkan bahwa data warehouse merupakan sebuah arsitektur data yang digunakan untuk
menyediakan kebutuhan informasi yang diperlukan dalam mendukung proses analisis data dan
pengambilan keputusan.

2.2 Keuntungan Data warehouse


Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data
yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk
penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan
menggunakan data warehouse tersebut dibawah ini (Ramelho).
1. Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan
transaksi.
2. Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat
diatasi.
3. Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data
apabila data dipindahkan dari database OLTP ke data warehouse.
4.   Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

3
Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan,
karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut
melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean
Nolan,Tom Huguelet):
1. Kemampuan untuk mengakses data yang besar
2. Kemampuan untuk memiliki data yang konsistent
3. Kemampuan kinerja analisa yang cepat
4. Mengetahui adanya hasil yang berulang-ulang
5.   Menemukan adanya celah pada business knowledge atau business process.
6. Mengurangi biaya administrasi
7.   Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada
mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.

2.3 Perancangan Data Warehouse


Petunjuk membangun data warehouse :

1. Menentukan misi dan sasa-ran bisnis bagi pembentukan data warehouse.


2.  Mengidentifikasi data dari basis data operasional dan sumber lain yang diperlukan bagi data
warehouse.
3. Menentukan item-item data dalam perusahaan dengan melakukan standarisasi pena maan
data dan artinya
4. Merancang basis data untuk data warehouse
5.   Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan tak
menjadi terlalu besar dan agar pengambilan keputusan tidak menjadi terlalu lamban.
6.   Menarik data produksi (operasional) dan meletakkan ke basis data milik data warehouse

2.4 Konsep dan Arsitektur Data Warehouse


1. Data warehouse : kumpulan data yang berorientasi subjek, terintegrasi, time-variant,
dan non volatile untuk mendukung proses pengambilan keputusan.
Data warehouse mengorganisasi-kan subjek utama perusahaan (pe-langgan, produk, dan
penjualan), bukan area aplikasi utama (faktur pelanggan, pengawasan stock, dan penjualan

4
produk). Hal ini meng-gambarkan kebutuhan untuk me-nyimpan data pendukung keputus-ab
daripada aplikasi yang berorien-tasi data.
2.     Integrated
   pengambilan secara bersamaan sumber data yang berasal dari sis-tem aplikasi berbagai
perusaan be-sar yang berbeda. Sumber data sering tidak konsisten, misal berbe-da format.
Sumber data yang terin-tegrasi harus dapat dibuat konsis-ten untuk menggambarkan view
gabungan data ke pemakai.
3.     Time variant
   data warehouse hanya akurat dan valid pada saat tertentu atau beberapa interval waktu
tertentu.
4.     Non volatile
   data tidak diperbaharui secara real time tetapi diperbaharui dari sistem operasional secara
regular. Data baru selalu ditambahkan sebagai lampiran pada basis data, bukan menggantikan
data lama

2.5 Tujuan Data Warehouse


1. Mempermudah pengaksesan informasi perusahaan

2. Menyediakan informasi perusahaan secara konsisten

3. Mampu beradaptasi dan tahan terhadap perubahan

4. Mampu mengamankan informasi Perusahaan

5. Mampu memberikan dukungan dalam pengambilan keputusan

6. Dapat diterima dan dioperasikan dengan baik oleh pengguna

2.6 Mekanisme Data Pada Data Warehouse


  Data warehouse memiliki empat level data (kimball, 2004), yaitu :

1. Level Operasional

Level ini khusus menyimpan data yang berorientasi pada aplikasi secara detil dan
diutamakan untuk memenuhi kebutuhan operasional. Akses pada level operasional pada

5
umumnya memiliki frekuensi yang sangat tinggi. Level ini sering juga disebut dengan OLTP
(Online Analytical Transactional Processing)

2. Level Integrasi

Level ini menyimpan data historis yang terintegrasi serta berorientasi subjek. Data pada level
ini lebih sederhana daripada di level operasional dan tidak dapat di-update.
3. Level data mart

Level ini dirancang sesuai dengan kebutuhan dari pengguna dan merupakan data agregasi.
4. Level Individual

Level ini merupakan tempat terjadinya analisis dan reporting. Data pada level ini bersifat
temporal, ad hoc, heuristik, dan non retitif

3.1 Pengertian Data Mining


Banyak sekali definisi mengenai apa itu data mining. Data mining merupan suatu alat
yang memungkinkan para pengguna untuk mengakses secara cepat data dengan jumlah yang
besar. Pengertian yang lebih khusus dari data mining, yaitu suatu alat dan aplikasi menggunakan
analisis statistik pada data. Data mining adalah suatu proses ekstraksi atau penggalian data dan
informasi yang besar, yang belum diketahui sebelumnya, namun dapat dipahamidan berguna dari
database yang besar serta digunakan untuk membuat suatu keputusanbisnis yang sangat penting.
Data mining menggambarkan sebuah pengumpulan teknik-teknik dengan tujuan untuk
menemukan pola-pola yang tidak diketahui pada data yang telah dikumpulkan. Data mining
memungkinkan pemakai menemukan pengetahuan dalam data database yang tidak mungkin
diketahui keberadaanya oleh pemakai.

Data mining merupakan proses semi otomatik yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi
informasi pengetahuan potensial dan berguna yang tersimpan di dalam database besar. (Turban
et al, 2005 ). Data mining adalah bagian dari proses KDD ( Knowledge Discovery in Databases)
yang terdiri dari beberapa tahapan seperti pemilihan data, pra pengolahan, transformasi, data
mining, dan evaluasi hasil (Maimon dan Last, 2000). KDD secara umum juga dikenal sebagai
pangkalan data.

6
3.2 Fungsi dan Tujuan Data Mining

1. Fungsi Data mining

Data Mining mengidentifikasi fakta- fakta atau kesimpulan-kesimpulan yang di sarankan


berdasarkan penyaringan melalui data untuk menjelajahi pola-pola atau anomali-anomali data.
Data Mining mempunyai 5 fungsi:
a.       Classification
Classification, yaitu menyimpulkan definisi-definisi karakteristik sebuah grup. Contoh:
pelanggan-pelanggan perusahaan yang telah berpindah kesaingan perusahaan yang lain.
b.     Clustering
Clustering, yaitu mengindentifikasikan kelompok-kelompok dari barang-barang atau produk-
produk yang mempunyai karakteristik khusus(clustering berbeda dengan classification, dimana
pada clustering tidak terdapat definisi-definisi karakteristik awak yang di berikan pada waktu
classification.)
c.       Association
Association, yaitu mengidentifikasikan hubungan antara kejadian-kejadian yang terjadi pada
suatu waktu, seperti isi-isi dari keranjang belanja.
d.      Sequencing
Hampir sama dengan association, sequencing mengidentifikasikan hubungan-hubungan yang
berbeda pada suatu periode waktu tertentu, seperti pelanggan-pelanggan yang mengunjungi
supermarket secara berulang-ulang.
e.       Forecasting
Forecasting memperkirakan nilai pada masa yang akan datang berdasarkan pola-pola dengan
sekumpulan data yang besar, seperti peramalan permintaan pasar.
2. Tujuan Data Mining
Tujuan data mining antara lain:
a.Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick up
meningkat di colorado.
b. Confirmatory

7
Untuk mempertegas hipotesis, seperti halnya 2 kali pendapatan keluarga lebih suka di pakai
untuk membeli peralatan keluarga, di bandingkan dengan satu kali pendapatan keluarga.
c. Exploratory
Menganalisis data untuk hubungan yang baru yang tidak di harapkan, seperti halnya pola apa
yang cocok untuk kasus penggelapan kartu kredit.

3.3 Penerapan Data Mining

Dalam bidang apasaja data mining dapat diterapkan? Berikut beberapa contoh bidang penerapan
data mining:
a.      Analisa pasar dan manajemen
Solusi yang dapat di selesaikan dengan Data Mining, diantaranya: Menembak target pasar,
Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer,
Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
b.    Analisa Perusahaan dan Manajemen resiko
Solusi yang dapat diselesaikan dengan data mining diantaranya: Perencanaan keuangan dan
evaluasi aset, perencanaan sumber daya (resource planning), persaingan (competition).
c. Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi
yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual
d.   Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data
mining untuk menambang triliyunan dari berbagai subyek seperti property, rekening bank dan
transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan
(Seperti money laundry)
e.       Asuransi
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi
layanan lesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi.
f.        Olahraga
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA
( jumlah shots blocked, assists dan fouls ) dalam rangka mencapai keunggulan bersaing
( competitive advantage ) untuk tim New York Knicks dan Miami Heat.

8
3.4   Proses Data Mining

Fase-fase dimulai dari data mentah dan berakhir dengan pengetahuan atau informasi yang
telah diolah, yang didapatkan sebagai hasil dari tahapan-tahapan berikut:
a. Data Cleansing, juga dikenal sebagai data cleansing, ini adalah sebuah fase dimana data-
data tidak lengkap, mengndung error dan tidk konsisten dibuang dari koleksi data,
sehingga data yang telah bersih relevan dapat digunakan untuk diproses ulang untuk
penggalian pengetahuan(discovery knowledge)
b. Data Integration, pada tahap ini terjadi integrasi data,dimana sumber-sumber data yang
berulang(multiple data), file-file yang berulang(multiple file), dapat dikombinasikan dan
digabungkan kedalam suatu sumber.
c. Data Selection, pada langkah ini, data yang relevan terhadap analisis dapat dipilih dan
diterima dari koleksi data yang ada.
d. Data Transformation, juga dikenal sebagai data consolidation. Pada tahap ini, dimana
data-data yang telah terpilih, ditransformasikan kedalam bentuk-bentuk yang cocok untuk
prosedur penggalian (meaning proedure) dengan cara melakukan normalisasi dan
agregasi data.
e. Data Mining, tahap ini adalah tahap yang paling penting, dengan menggunakan teknik-
teknik yang diaplikasikan untuk mengekstrak pola-pola potensial yang berguna.
f. Pattern Evaluation, pada tahap ini, pola-pola menarik dengan jelas mempresentasikan
pengetahuan telah diidentifikasi berdasarkan measure yang telah diberikan.
g. Knowledge Representation, ini merupakan tahap terakhir dimana pengetahuan yang telah
ditemukan secara visual ditampilkan kepada user.Tahap penting ini menggunakan teknik
visualisasi untuk membantu user dalam mengerti dan menginterpresentasikan hasil dari
data mining.

3.5 Teknik Data Mining


Dalam data mining terdapat dua tipe teknik yaitu:

1. Teknik Klasik (Classical Technique) yang terdiri atas:


a. Statistic

9
Statistik adalah cabang ilmu matematika yang mempelajari tentang sekumpulan dan deskripsi
data yang akan digunakan dalam membuat laporan tentang informasi yang penting agar
seseorang dapat membuat keputusan yang berguna. Salah satu keuntungan statistik adalah
menampilkan database dalam tampilan ber-level tinggi yang menyediakan informasi-informasi
yang berguna tanpa perlu mengerti setiap record secara detail.
b. Nearest Neighbour
Teknik prediksi pengelompokan dan nearest neighbour merupakan teknik yang tertua yang
digunakan dalam data mining. Nearest neighbour merupakan teknik prediksi yang hampir sama
dengan pengelompokan, untuk memperkirakan apakah nilai prediksi ada dalam satu record,
mencari kesamaan nilai prediktor didalam basis data historis dan menggunakan nilai prediksi
dari record yang “Terdekat” untuk tidak membagi-bagikan record.
c. Pengelompokan (Clustering)
Pengelompokan merupakan metode yang mengklasifikasikan data kedalam kelompok-kelompok
berdasarkan kriteria masing-masing data. Biasanya,teknik ini dipakai untuk memberikan
pengguna akhir sebuah gambaran level atas dari apa yang telah terjadi didalam basis data.
Pengelompokan terkadang digunakan untuk segmentasi.
2.Teknik generasi selanjutnya (The Next Generation Technique)
Decision Tree (Pohon Keputusan)
Pohon keputusan merupakan model prediktif yang dapat digambarkan seperti pohon, dimana
setiap node didalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk
menggolongkan data. Struktur ini dapat digunakan untuk membantu memperkirakan
kemungkinan nilai setiap atribut data.
Beberapa hal menarik tentang tree:
a. Tree ini membagi data pada setiap cabangnya tanpa kehilangan data sedikit pun. Jumlah total
record pada node parent sama dengan jumlah total record yang ada node children.
b. Sangat mudah dimengerti bagaimana sebuah model dibangun, kebalikan dengan model dari
neural network atau dari statistik standar.
c. Mudah untuk menggunakan model ini jika kita mempunyai target pelanggan yang sepertinya
tertarik dengan penawaran marketing.

10
BAB III

PENUTUP

4.1 KESIMPULAN
Keberadaan data warehouse sangat penting sebagai tools dari DSS, karena data warehouse
memang digunakan untuk itu. Dengan adanya data warehouse, diharapkan suatu perusahaan
dapat lebih unggul dari kompetitornya dan lebih jeli lagi dalam melihat peluang pasar.

Pada proses Data Mining hal yang paling penting adalah pada tahap “Data Mining” dengan
menggunakan teknik-teknik yang diaplikasikan untuk mengekstrak pola-pola potensial yang
berguna.

11

Anda mungkin juga menyukai