Anda di halaman 1dari 18

DATA MINING

Apakah Data Mining?

Data mining adalah suatu proses pengerukan atau pengumpulan informasi penting dari suatu data
yang besar. Proses data mining seringkali menggunakan metode statistika, matematika, hingga
memanfaatkan teknologi artificial intelligence.
Nama alternatifnya yaitu Knowledge discovery (mining) in databases (KDD), knowledge extraction,
data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence,
dan lain-lain.

Pada gambar di atas terlihat bahwa proses data mining menggunakan banyak konsep dan Teknik.
Proses tersebut membutuhkan beberapa langkah untuk mendapatkan sebuah data yang di inginkan,
yaitu melakukan pembersihan data, integrasi data, seleksi data, transformasi, penambangan data,
evaluasi pola, dan presentasi pengetahuan.
Fungsi Data Mining

Data mining memiliki banyak sekali fungsi, Tetapi fungsi utamanya adalah:

1. Descriptive
Adalah fungsi untuk memahami lebih jauh tentang data yang di amati, dengan cara
melakukan sebuah proses tertentu yang diharapkan akan dapat mengetahui perilaku dari
data tersebut. Dari proses tersebut nantinya dapat diketahui karakteristik dari data yang
dimaksud, sehingga nantinya bisa ditemukan pola tertentu yang tersembunyi dalam sebuah
data, dan jika pola tersebut berulang dan bernilai, maka karakteristik sebuah data bisa di
ketahui.

2. Predictive
Adalah fungsi untuk menemukan pola tertentu dari suatu data. Pola-pola tersebut dapat di
ketahui dari berbagai bentuk yang diprediksi adalah variabel-variabel yang ada pada data.
Ketika pola dapat ditemukan, maka pola yang didapat tersebut bisa di gunakan untuk
memprediksi variabel lain yang belum di ketahui nilainya ataupun jenisnya. Oleh karena
itulah fungsi ini di katakan sebagai fungsi prediksi. Fungsi ini juga bisa di gunakan untuk
memprediksi sebuah variabel tertentu yang tidak ada dalam suatu data. Sehingga fungsi ini
memudahkan dan menguntungkan bagi siapapun yang memerlukan prediksi yang akurat
untuk membuat hal penting tersebut menjadi lebih baik.

Metode Data Mining


Dalam melakukan pengumpulan data dan atau informasi terdapat banyak metode, metode tersebut
digunakan untuk membantu dalam proses menemukan data, mulai dari perencanaan ide hingga
implementasi akhir.
1. Proses pengambilan Data
Pengambilan data dilakukan dengan Knowledge discovery (mining) in databases (KDD).
Proses atau tahapan-tahapan tersebut di mulai dari data mentah dan berakhir dengan
pengetahuan atau informasi yang telah di olah. Nah proses tersebut sebagai berikut :
a. Data Cleansing, proses pembersihan data dimana data-data yang tidak lengkap,
mengandung error dan tidak konsisten di buang dari koleksi data.
b. Data Integration, proses integrasi data dimana data yang berulang akan di
kombinasikan.
c. Selection, proses seleksi atau pemilihan data yang relevan terhadap analisis untuk di
ambil dari koleksi data yang ada.
d. Data Transformation, proses transformasi data yang sudah di pilih ke dalam bentuk
mining procedure melalui cara dan agresi data.
e. Data Mining, proses yang paling penting dimana akan dilakukan berbagai teknik yang di
aplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data
yang berguna.
f. Pattern Evolution, proses di untuk mendapatkan pola-pola yang menarik yang
sebelumnya sudah di temukan dengan identifikasi berdasarkan pengukuran yang telah
diberikan.
g. Knowledge Presentation, Merupakan proses tahap terakhir, dalam hal ini di gunakan
teknik visualisasi yang bertujuan membantu user untuk mampu memahami dan
menginterpretasikan hasil dari penambangan data.
2. Teknik dalam Proses Penambangan Data
a. Predictive Modeling, terdapat dua teknik yaitu Classification dan Value Prediction
b. Database Segmentation, melakukan partisi database menjadi sejumlah segmen, cluster,
atau record yang sama
c. Link analysis, teknik untuk membuat hubungan antara record yang individu atau
sekumpulan record dalam database.
d. Deviation detection, teknik untuk mengidentifikasi outlier yang mengekspresikan
sebuah deviasi dari ekspektasi yang sudah di ketahui sebelumnya.
e. Nearest Neighbour, teknik untuk memprediksi pengelompokan, teknik ini adalah teknik
yang tertua yang di gunakan dalam data mining.
f. Clustering, merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria
masing-masing data.
g. Decision Tree, teknik terbaru, adalah sebuah model prediktif yang dapat di gambarkan
seperti pohon, setiap node yang terdapat dalam struktur pohon tersebut mewakili
sebuah pertanyaan yang di gunakan untuk menggolongkan data.

Permasalahan dalam Data Mining

Bukan ssesuatu yang mudah dalam mengumpulkan informasi dan melakukan penambangan data
yang nantinya data tersebut dapat bermanfaat. Banyak sekali permasalahan yang bisa di temui saat
melakukan penambangan data, antara lain:

1. Reliabilitas atau ketahanan hardware atau server yang di gunakan untuk memproses data
mining. Pemilihan server adalah poin penting yang harus diperhatikan karena hal ini
berhubungan dengan kecepatan pemrosesan data.

2. Metodologi Mining:
a. Menambang berbagai jenis pengetahuan dari berbagai tipe data
b. Kinerja: efisiensi, efektivitas, dan skalabilitas
c. Evaluasi pola: masalah ketertarikan
d. Memasukkan pengetahuan latar belakang
e. Menangani kebisingan dan data yang tidak lengkap
f. Metode penambangan paralel, terdistribusi dan tambahan
g. Fusi pengetahuan: Integrasi pengetahuan yang di temukan dengan yang ada

3. User interaction:
a. Bahasa kueri penambangan data dan penambangan ad-hoc
b. Ekspresi dan visualisasi hasil penambangan data
c. Penambangan pengetahuan interaktif di berbagai tingkatan abstraksi

4. Applications and social impacts:


a. Penambangan data khusus domain & penambangan data tak terlihat
b. Perlindungan keamanan data, integritas, dan privasi

Contoh Penerapan Data Mining

Penambangan data bisa dilakukan dan digunakan di berbagai sektor, mulai dari sektor bisnis,
manajemen, keuangan dan lainnya. Berikut ini contoh penerapan data mining di beberapa sektor :
1. Market Analysis dan Management
Dalam sektor pemasaran biasanya data mining di gunakan untuk:
a. Target Pemasaran, misalnya untuk menemukan kelompok pelanggan yang memiliki
karakteristik yang sama: minat, tingkat pendapatan, kebiasaan belanja, dll. atau
menentukan pola pembelian pelanggan dari waktu ke waktu.
b. Analysis lalu lintas pasar, misalnya untuk menemukan hubungan antara produk
penjualan, & prediksi berdasarkan asosiasi tersebut.
c. Profiling pelanggan, misalnya untuk menemukan jenis pelanggan apa yang membeli
produk apa (pengelompokan atau klasifikasi)
d. Analisis kebutuhan pelanggan, misalnya untuk mengidentifikasi produk terbaik untuk
berbagai kelompok pelanggan, memprediksi faktor apa yang akan menarik pelanggan
baru, penyediaan informasi ringkas, laporan ringkasan multidimensi, Informasi ringkasan
statistik (kecenderungan dan variasi pusat data)

2. Corporate Analysis & Risk Management


Penerapan Data mining dalam sektor perusahaan biasanya di gunakan untuk prediksi,
retensi pelanggan, underwriting yang lebih baik, kontrol kualitas, analisis kompetitif.
a. Perencanaan keuangan dan evaluasi aset, misalnya analisis dan prediksi arus kas,
analisis klaim kontinjensi untuk mengevaluasi aset, analisis cross-sectional dan time
series (rasio keuangan, tren analisis, dll.)
b. Planning Perencanaan sumber daya, misalnya merangkum dan membandingkan
sumber daya dan pengeluaran
c. Persaingan, Misalnya memantau pesaing dan arah pasar, mengelompokkan pelanggan
ke dalam kelas dan penetapan harga berbasis kelas prosedur, dan mengatur strategi
penetapan harga di pasar yang sangat kompetitif.

3. Fraud Detection & Mining Unusual Patterns


Data mining juga berfungsi untuk mencari dan mendeteksi fraud pada sebuah sistem.
Dengan menggunakan data mining maka akan bisa terlihat dari jutaan transaksi yang masuk.
a. Pendekatan: Clustering & konstruksi model untuk penipuan, analisis outlier
b. Aplikasi: Layanan kesehatan, ritel, layanan kartu kredit, telecomm. Misalnya Asuransi
otomatis, Pencucian uang, Asuransi kesehatan, Telekomunikasi, Analisis pola yang
menyimpang dari norma yang diharapkan, Industri retail, Dll.
BIG DATA
Apakah Big Data?

Big data adalah istilah untuk menyebut kumpulan informasi dalam volume data yang besar yang
nantinya dapat dimanfaatkan dalam mengambil keputusan. Tapi bukan jumlah datanya yang
penting, melainkan tujuan yang dilakukan oleh seseorang dengan data tersebut. Artinya big data
adalah teknologi canggih dengan kapasitas besar yang berisi kumpulan data yang kompleks.

Kumpulan data ini memiliki cakupan yang sangat luas sehingga perangkat lunak pengolah data
tradisional tidak akan mampu mengelolanya. Kapasitas data yang sangat besar ini dapat digunakan
untuk mengatasi masalah bisnis yang mungkin tidak bisa ditangani sebelumnya.

Mengapa Big Data itu Penting?

Big data adalah salah satu niche yang paling banyak diminati dalam pengembangan dan pelengkap
perangkat lunak perusahaan saat ini. Big data adalah fenomena sosial-teknologi yang dipicu oleh
cepatnya pertumbuhan volume informasi.

Dunia teknologi mengalami perubahan yang sangat pesat dan cepat, dan big data adalah solusi
dalam otomatisasi dan pengembangan teknologi AI (Artificial Intelligence). Contohnya Google dan
perusahaan tingkat atas lainnya sudah menggunakan machine learning process untuk mendapatkan
ketepatan yang lebih akurat dalam memberikan layanan.

Ketika teknologi di seluruh dunia menjadi lebih sinkron dan dapat dioperasikan, big data akan
menjadi inti yang menghubungkan segala sesuatunya. Dengan kemampuan untuk mengumpulkan
data internasional dalam volume besar secara efisien, akan bisa lebih dipahami cara mengelola
berbagai fenomena.

Karakteristik Big Data


Big data memiliki 5 karakteristik sebagai berikut:

1. Volume
Di era revolusi industri 4.0 ini, bisa dilihat pertumbuhan eksponensial dalam penyimpanan
data karena data sekarang lebih dari sekadar data teks. Contohnya akan ditemukan data
dalam format video, musik, dan gambar berukuran besar di dalam social media. Saat ini,
kapasitas penyimpanan data dalam ukuran terabytes atau petabytes pada sistem di
perusahaan dianggap wajar. Ketika database mengalami pertumbuhan, aplikasi dan
arsitektur yang dibangun untuk mendukung data pun perlu dievaluasi kembali.

2. Velocity
Pertumbuhan data dan popularitas media sosial telah mengubah cara kita melihat data.
Saluran berita dan radio memungkinkan untuk menyampaikan berita lebih cepat. Saat ini,
banyak orang yang berlomba-lomba membalas suatu postingan di media sosial untuk
memperbarui informasi di media sosialnya dengan kejadian terkini. Di media sosial,
terkadang pesan yang dikirim beberapa jam atau beberapa menit yang lalu dianggap sebagai
“pesan lama”. Intinya, regulasi data sekarang hampir real time dan rentang waktu
pembaruan sangat cepat dengan satuan waktu sepersekian detik.

3. Variety
Data kini sudah bisa disimpan dalam berbagai format. Misalnya database, excel, csv, atau file
teks sederhana lainnya. Namun, terkadang dibutuhkan data yang tidak tersedia dalam
format tradisional, misalnya dalam bentuk video, SMS, pdf atau sesuatu yang mungkin
belum terpikirkan. Maka menjadi kewajiban suatu organisasi untuk mengatur data-data
tersebut. Hal itu akan sangat mudah dilakukan jika mereka memiliki data dalam format yang
sama atau mengatasi variasi format file tersebut dengan big data yang merupakan teknologi
canggih.

4. Value
Value artinya big data memiliki nilai yang tinggi jika diolah dengan cara yang tepat atau juga
bisa disebut suatu data sangat bermakna. Contohnya, biodata suatu karyawan di salah satu
perusahaan layanan hosting tidak akan bernilai untuk kepentingan analisis prediksi
penjualan ke customer. Data tersebut mungkin dianggap tidak penting, namun bisa sangat
bernilai untuk hal lain. Data yang tidak memiliki nilai di berbagai aspek akan terfilter di
sistem analisis big data.

5. Veracity
Yaitu kerentanan dari sisi keakuratan dan kevaliditasan sehingga memerlukan kedalaman
untuk menganalisanya agar dapat menghasilkan keputusan yang tepat.

Konsep Big Data

Konsep big data secara menyeluruh terdiri dari integrasi, pengelolaan, dan analisis data. Konsep
lengkap dari big data adalah sebagai berikut:

1. Integrasi data
Big data menyatukan data dari banyak sumber dan aplikasi yang berbeda. Mekanisme
integrasi data tradisional, seperti ETL (extract, transform, dan load) sudah tidak relevan jika
diterapkan pada konsep big data. Dibutuhkan strategi dan teknologi baru untuk
menganalisis big data pada skala terabyte, atau bahkan petabyte. Selama integrasi, data
dimasukkan, diproses, dan memastikan bahwa formatnya tersedia dalam bentuk yang
diperlukan untuk analis.

2. Pengelolaan data
Big data membutuhkan tempat penyimpanan yang bisa menyimpan data dalam bentuk apa
pun. Dengan big data, kita dapat melakukan pemrosesan yang diinginkan. Banyak orang
memilih solusi penyimpanan big data seperti Cloud. Cloud secara bertahap mendapatkan
popularitas karena mendukung persyaratan komputasi yang kita butuhkan saat ini dan
memungkinkan kita untuk menggunakan fitur sesuai kebutuhan.

3. Analisis data
Nilai praktis big data akan terasa ketika kita menganalisis dan menindaklanjuti data kita.
Karena di situlah kita akan mendapatkan kejelasan baru dengan analisis visual dari beragam
set data. Kita bisa menjelajahi data lebih dalam untuk membuat penemuan baru dan
membagikan temuan itu dengan orang lain. Kita juga dapat membangun model data dengan
machine learning dan kecerdasan buatan.

Arsitektur Big Data

Adalah struktur keseluruhan yang merepresentasikan logical dan physical sistem dari big data itu
sendiri, dikelola dengan penggunaan teknologi storage yang baik, jaringan server yang bisa diakses
kapan saja, dan algoritma yang canggih.

Ada beberapa poin penting ilustrasi arsitektur big data, yaitu :

1. Data source atau sumber data. Sumber data ini berasal dari berbagai sumber contohnya
seperti data diri dari calon konsumen toko online.

2. Data aggregator. Adalah alat pengolah big data. Alat ini akan menerima data tersebut dan
menyalurkannya. Ada 2 cara yang bisa digunakan yaitu:
a. Real time streaming processor (menganalisis data secara real time).
b. Hadoop, yaitu tempat penyimpanan data yang sangat besar.

3. Jika data terhitung ringan, tahapan setelah real time streaming processor adalah data akan
langsung disimpan dalam data store atau tempat penyimpanan data.

4. Jika datanya sangat besar, maka akan melalui Hadoop. Data juga harus diproses dengan
sistem non-real time processor. Lalu, setelah itu data baru bisa disimpan di data store.

5. Data yang disimpan pada data source dapat diakses dalam waktu singkat. Namun dengan
syarat pengelolaan datanya harus berjalan dengan baik, karena jika tidak data akan kacau
dan kurang memberi manfaat.

Fungsi Big Data


Hadirnya big data di kehidupan mampu mempermudah segala aktivitas penggunanya. Apa saja itu?
Berikut daftar fungsi big data:
1. Menemukan penyebab suatu masalah secara real time
Pertama, fungsi big data adalah penemu masalah real time. Pemanfaatan dari adanya big
data ini juga bisa meminimalisir kegagalan. Setelah menganalisisnya, hasil analisis dapat
ditampilkan secara langsung atau real time.

2. Mendeteksi suatu anomali dalam struktur bisnis


Selanjutnya, fungsi big data adalah untuk mendeteksi bentuk atau proses kegiatan yang
menyimpang dan berhenti yang disebabkan karena adanya kesalahan dari sisi teknis
maupun non teknis, kemudian big data akan merencanakan beberapa opsi untuk mengatasi
anomali tersebut dengan lebih cepat dan tepat demi membantu aktivitas bisnis perusahaan.

3. Membantu dalam pengambilan sebuah keputusan secara tepat


Fungsi terakhir big data adalah membantu pengambilan keputusan. Saat ini big data sering
digunakan untuk sistem teknologi cerdas seperti IoT (internet of things) dan AI (artificial
intelligence), yang tugasnya untuk memberi dan menyimpan data/informasi yang
dibutuhkan dalam pengembangan sebuah produk.

Manfaat Big Data

Big data sudah diimplementasikan di hampir setiap industri seperti:

1. Healthcare: Mengumpulkan data kesehatan masyarakat untuk respons yang lebih cepat
terhadap masalah kesehatan individu dan mengidentifikasi penyebaran penyakit baru secara
global;
2. Perbankan: Memantau pasar keuangan;
3. Pendidikan: Memantau dan melacak kinerja siswa dan memetakan minat siswa dalam
berbagai mata pelajaran;
4. Retail: Menganalisis perilaku konsumen dan rantai pasokan dan mempersonalisasikan e-
commerce mereka untuk pengalaman yang lebih baik;
5. Asuransi: Menangani klaim melalui analitik prediktif;
6. Media dan Hiburan: Mengikuti tren terbaru;
7. Transportasi dan Logistik: Perencanaan rute, pemantauan, dan manajemen lalu lintas;
8. Manufaktur: Mengalokasikan sumber daya produksi secara optimal.

Contoh Penggunaan Big Data

Beberapa hal yang dianggap sebagai penerapan atau penggunaan big data adalah sebagai berikut:
1. Penggunaan internet
Setiap harinya kita semua terhubung dengan internet, data-data yang muncul dalam hasil
pencarian dalam Google itu merupakan data yang disimpan oleh Google.

2. Media social
Di zaman yang serba teknologi ini, media sosial sudah menjadi bagian dari hidup manusia.
Update status atau foto dan membagikannya ke sosial media adalah bagian dari data. Tidak
hanya itu, kita juga bisa mendapatkan data tentang apa yang sedang kita cari, kontak,
kebiasaan, hingga biodata kita dari sosial media.

3. Digitalisasi media
Sebelum internet marak penggunaannya seperti saat ini, DVD dan CD digunakan untuk
menonton video. Dengan DVD dan CD maka kita tidak akan meninggalkan jejak digital
apapun. Namun sekarang kita mungkin menonton video dari Netflix, mendengarkan lagu
dari Spotify, dimana keduanya pasti mencatat apa saja yang kita tonton dan dengarkan.
Dengan begitu mereka memiliki data yang nantinya bisa digunakan untuk meningkatkan
layanan mereka.

4. Penggunaan smartphone
Hampir semua orang memiliki smartphone yang memiliki jumlah data sangat besar.
Smartphone menyimpan Berbagai aplikasi, serta data sms dan telepon. Contohnya GPS yang
akan mengumpulkan data-data yang berkaitan dengan lokasi.
5. Smart devices
Smart device banyak sekali macamnya, seperti smart TV, smart car, smart fridge yang bisa
mengatur sendiri keperluannya. Semua barang tersebut akan menyimpan data, misal smart
fridge yang mengatur temperatur dengan konsumsi daya rendah agar produsen bisa
memperbaiki layanannya dan menawarkan teknologi terbaiknya untukmu.

Cara Kerja Big Data

Ada beberapa tahap dalam cara kerja big data, antara lain:

1. Tentukan strategi big data


Strategi big data adalah rencana yang dirancang untuk membantu mengawasi dan
meningkatkan pengoperasian data di dalam bisnis. Kita juga harus mempertimbangkan
tujuan dan inisiatif bisnis di masa depan.

2. Identifikasi sumber big data


Kita dapat mengidentifikasi dari mana sumber big data berasal, misal data sosial media
berasal dari interaksi di Youtube, Facebook, Instagram atau yang lainnya

3. Kelola data
Untuk mengelola data dengan benar, pastikan faktor terpenting seperti tidak lupa
menyimpan data. Untuk dana terbatas cloud storage bisa menjadi salah satu solusinya.

4. Analisis data
Kita harus bisa membuat pemodelan data menggunakan machine learning dan AI sehingga
bisa dianalisis dengan baik, dari sini kita akan menemukan banyak input, insight, dan
penemuan baru untuk kemajuan perusahaan.

5. Ambil keputusan berdasarkan data


Untuk menjaganya tetap kompetitif, bisnis perlu merebut nilai penuh dari data besar dan
beroperasi dengan cara membuat keputusan berdasarkan bukti tersaji oleh data besar
daripada berdasarkan insting.

Tools untuk Mengembangkan Big Data


Terdapat beberapa tools yang dapat digunakan terkait penggunaan big data. Beberapa tools yang
bisa kita coba dan gunakan untuk mengembangkan big data adalah : Xplenty, Pentaho, Looker,
Knime, Cassandra, Tableau, RapidMiner, Skytree, Domo, Sisense.
Sebenarnya masih banyak tools lain, namun jika kita menginginkan penyimpanan lebih besar,
teknologi cloud cukup direkomendasikan, seperti menggunakan software dari Google, BigTable yang
berbasis cloud base.

Tantangan Big Data


Beberapa tantangan big data adalah sebagai berikut:

1. Pengelolaan yang cukup rumit


Tantangan big data yang pertama adalah pengelolaannya yang cukup rumit. Namun,
teknologi terkini sudah mampu membantu proses pengelolaannya menjadi lebih mudah,
hanya saja perkembangannya cukup pesat sehingga platform dan infrastruktur yang tidak
sesuai akan menjadi kendala.

2. Sistem big data harus selalu diperbarui


Hasil dari perkembangan data membuat update big data adalah hal yang wajib, terutama
data yang tidak relevan. Akan tetapi, untuk melakukan update data secara rutin ini,
diperlukan ruang penampung yang cukup besar.

3. Rentannya keamanan dan privasi data


Karena bisa diakses oleh siapapun, maka akan ada risiko keamanan seperti aksi cyber crime.

4. Kurangnya SDM ahli


Tantangan big data adalah kurangnya SDM yang ahli dalam bidang tersebut. Big data tidak
dapat diolah secara manual karena akan kurang efektif. Sayangnya, sekarang ini SDM ahli
dalam bidang big data masih kurang.
DATA WAREHOUSE
Data warehouse adalah sistem penyimpanan data yang umumnya dipakai oleh perusahaan-
perusahaan dalam mengelola data berjumlah besar agar lebih terstruktur dan juga terpusat.

Namun sebenarnya, kegunaan dan fungsi data warehouse tak hanya sebagai penyimpanan informasi
semata. Sistem ini akhirnya akan mempengaruhi aktivitas manajemen suatu perusahaan, seperti
dalam hal pengambilan keputusan.

Pengertian Data Warehouse

Warehouse (gudang) menjadi tempat khusus dalam menyimpan berbagai macam hal yang nantinya
akan didistribusikan ke berbagai tempat sesuai dengan kebutuhannya. Hal ini juga diterapkan pada
data warehouse. Data warehouse adalah sistem yang membantu banyak pihak dalam mengorganisir
berbagai macam dokumen berskala besar.

Tak hanya sekadar menyimpan data-data saja, di dalam data warehouse juga terdapat proses analisa
supaya data lebih terstruktur. Sehingga, pihak yang memanfaatkan data warehouse bisa dengan
mudah sekaligus terarah dalam mengambil keputusan saat ingin menggunakan rangkaian data.

Namun, sampai saat ini, masih banyak orang yang menyalah artikan pengertian data warehouse
sebagai data operasional. Padahal, terdapat perbedaan di antara keduanya, yaitu:

1. Data operasional mencakup isian detail dan rincian data, sedangkan data warehouse adalah
sistem yang berfokus pada desain dan model data.
2. Data operasional juga lebih difokuskan pada aplikasi-aplikasi tertentu. Berbeda dengan data
warehouse yang mencakup subjek utama pada sebuah sistem data.
3. Data operasional menampilkan rincian data dan data warehouse menampilkan history
dalam proses pengolahannya.

Karakteristik Data Warehouse

Data warehouse adalah sistem dengan beragam karakteristik. Yaitu:

1. Integrated
Meskipun banyak ragam data yang terkumpul di data warehouse, setiap komponennya
tetap saling terintegrasi satu sama lain, sehingga tercipta satu kesatuan yang membentuk
konsep data warehouse itu sendiri. Maksudnya, proses integrasi antar data di data
warehouse tidak mampu dipecah karena dibutuhkan sebuah konsistensi yang menjadikan
setiap bagiannya saling terhubung satu sama lain. Hal ini dapat ditunjang dengan cara
menerapkan konsistensi dalam pemberian nama variabel, atribut fisik, ukuran variabel, dan
struktur pengkodean.

2. Subject Oriented
Sebagai tempat penyimpanan data dan berperan melakukan proses analisa, data warehouse
mempunyai karakteristik subject oriented (berorientasi pada subjek). Dalam sebuah desain
sistem, data warehouse akan menerapkan analisa secara detail terkait subyek-subyek
utama. Misalnya saja seperti pengelolaan sistem penjualan. Nantinya, data warehouse akan
melakukan analisa secara satu per satu mengenai subyek utamanya, seperti produk-produk
yang dijual, jumlah transaksi penjualan dan pemasukan, serta biaya operasional jika bisnis
tersebut membuka cabang toko lainnya.

3. Non-Volatile
Setiap kumpulan data di data warehouse tidak dapat dilakukan pembaharuan karena
mempunyai karakteristik non-volatile (tidak berubah). Jika ada beberapa data baru yang
akan ditambahkan, data warehouse hanya akan disatukan dengan file sebelumnya. Hal ini
dikarenakan data warehouse hanya mampu melakukan manipulasi data pada bagian access
dan load data saja. Nantinya, data-data baru yang diinput dimasukan pada sebuah database,
setelah itu data warehouse akan secara otomatis melakukan proses penambahan data.

4. Time Variant
Salah satu penunjang validitas sebuah data adalah berdasarkan waktu input ke dalam
sistem. Bisa dipastikan keseluruhan data pada data warehouse terbukti akurat, bahkan
dapat diketahui waktu data warehouse tersebut diciptakan hingga data terbaru yang
terakhir diinput. Tentunya rentang waktu (time variant) pada data warehouse menjadi
elemen sangat penting ketika sistem akan melakukan proses penganalisaan data, terutama
jika analisa yang dilakukan menganut sistem periodik.

Fungsi Data Warehouse

Kegunaan dan fungsi data warehouse sangat penting, terutama bagi para penggiat bisnis atau
pemilik perusahaan yang membutuhkan media penyimpanan data berskala besar untuk dilakukan
proses analisis secara mendalam. Berikut ini terdapat ragam fungsi data warehouse adalah:

1. Mempercepat proses-proses pengaksesan data, sehingga lebih efisien dari segi waktu.
cepatnya pengaksesan data akan mempengaruhi analisa yang nantinya akan mempermudah
dalam proses pengambilan keputusan secara tepat.

2. Menyajikan informasi secara akurat dan terperinci.

3. Adanya historical intelligence yang memudahkan kita ketika akan melakukan proses analisa
data dalam periode tertentu, sehingga mampu melakukan forecasting (prediksi bisnis) yang
lebih akurat.

4. Mempertahankan konsistensi data karena memanfaatkan satu format tunggal setelah


mengumpulkan ragam data dari berbagai macam sumber. Tujuan dari penggunaan satu
format tunggal adalah supaya semua data mempunyai standar yang serupa dan terjaga
konsistensinya.

Data warehouse mampu menjadi tempat penyimpanan data-data berskala besar karena adanya
komponen penyusun di dalamnya. Setiap komponen tersebut mempunyai perannya tersendiri untuk
memaksimalkan kinerja data warehouse supaya lebih optimal dalam proses analisis data.

1. Warehouse Data Management


Adalah bagian paling kompleks karena harus mengatur banyaknya data dalam sebuah
sistem. Pengolahan data juga tidak bisa sembarangan sebab ada beberapa aspek yang wajib
untuk diperhatikan, seperti pengelolaan recovery dan backup, pembaharuan hingga
keamanan data.

2. Warehouse
Menjadi tempat utama dalam penyimpanan data-data, warehouse pun mempunyai ragam
bentuk yang dapat disesuaikan dengan kebutuhan, seperti bentuk warehouse cloud hosted,
analytic, dan appliance.

3. Access Tool
Jika memanfaatkan tim developer dalam mengelola data warehouse, tentunya access tool
sangat bermanfaat karena dapat dikembangkan dan diterapkan pada OLAP dan data mining.

4. Metadata
Adalah komponen data warehouse yang memberikan gambaran secara singkat terkait
sebuah data. Tujuan penggunaan metadata supaya kita dapat melihat konteks informasi
yang disuguhkan, sehingga bisa lebih terorganisir dan selaras dengan data-data lainnya.

5. Tools ETL
Extract-Transform-Load (ETL) mampu melakukan proses pengambilan data dari berbagai
macam sumber dan diubah formatnya supaya sesuai dengan standarisasi yang diterapkan
pada sebuah data warehouse. Tools ETL mempengaruhi beberapa aspek, seperti metode,
tipe, dan waktu dari pengolahan data tersebut.

Skema Data Warehouse

Data warehouse mempunyai tiga ragam skema yang paling populer, yaitu:

1. Skema Snowflake
Sama seperti struktur dari sebuah snowflake (kepingan salju) yang dimulai dari susunan
terbesar hingga terkecil, skema data warehouse tipe ini memanfaatkan tabel dimensi yang
bentuknya lebih kecil di sekitar tabel utama.

2. Skema Star
Skema star memanfaatkan tabel utama di bagian tengah, lalu di sisi atas-bawah dan kanan-
kiri terdapat tabel penjelasan dari berbagai aspek yang dibahas secara singkat di tabel
utama, sehingga penjabarannya lebih spesifik.

3. Skema Fact Constellations


Strukturnya jauh lebih kompleks dibandingkan snowflake dan star. Hal ini disebabkan oleh
banyak fakta yang terhubung oleh ragam dimensi dan tercakup dalam beberapa tabel.
DBMS
Pengertian DBMS

DBMS adalah singkatan dari Database Management System (Sistem Manajemen Basisdata).
Database atau basisdata adalah kumpulan informasi yang disimpan dalam sebuah komputer dan
kemudian akan diolah dengan perintah tertentu. Sedangkan, pengertian DBMS adalah sebuah sistem
atau software yang dirancang untuk menghubungkan database dengan pengguna sehingga data
dapat diolah dengan baik. Dalam bahasa database, setidaknya terdapat 2 bahasa yang lazim
digunakan, yaitu Database Definition Language (DDL) dan Database Manipulation Language (DML).
Database Definition Language (DDL) adalah desain database secara menyeluruh yang menyebabkan
pembuatan tabel baru, indeks tertentu, dan berbagai kegiatan umum database lainnya dapat terjadi.
Sedangkan, Database Manipulation Language (DML) adalah bahasa database yang digunakan untuk
memanipulasi penghimpunan data yang tersedia dalam database, seperti penghapusan data dan
juga penjumlahan data.

Pengertian DBMS menurut para ahli

Selain pengertian di atas, para ahli juga turut memberikan definisi tentang apa itu DBMS, yaitu
sebagai berikut.
1. Pengertian DBMS menurut A. Attre
DBMS adalah semua hal yang berhubungan dengan software, hardware, firmware serta
berbagai prosedur yang digunakan untuk mengelola database. Firmware sendiri merupakan
software yang sudah menjadi modul yang tertanam pada hardware atau ROM.

2. Pengertian DBMS menurut Gordon C. Everest


DBMS adalah manajemen yang efektif untuk mengorganisir semua sumber data. Dengan
kata lain, dapat diartikan pula bahwa DBMS adalah sistem pengolahan data pada komputer.

3. Pengertian DBMS menurut C. J. Date


DBMS adalah sebuah wadah untuk sekumpulan berkas data yang telah di handle dengan
baik yang tujuannya memelihara berbagai informasi serta membuat informasi baru,
terutama jika informasi tersebut sedang dibutuhkan.

Contoh DBMS

DBMS sangat bermanfaat dalam kehidupan sehari-hari. Jika dapat dimanfaatkan dengan baik, maka
bisa memberikan keuntungan sangat baik bagi penggunanya. Beberapa contoh penerapan DBMS
adalah sebagai berikut:

1. Sistem manajemen perpustakaan


2. Sistem otomatis pada mesin kasir
3. Pemulihan data pada computer
4. Sistem reservasi tiket penerbangan
5. Sistem pencatatan suku cadang
Fungsi DBMS

Beberapa fungsi DBMS adalah:

1. Pendefinisian dan pengolahan data


2. Menangani berbagai permintaan pengguna untuk mengelola dan mengakses data
3. Penanganan keamanan dan integritas data
4. Menangani dan mengawasi pembaharuan data
5. Mengontrol pengaksesan data yang dilakukan secara bersama-sama
6. Pengawasan back up database dan pemulihan pencadangan database dari kesalahan
7. Menunjukkan dictionary data
8. Melakukan pengerjaan dan pengaksesan data seefisien mungkin

Jenis DBMS
Berikut beberapa jenis contoh DBMS adalah:

1. Hierarchical database
Hierarchical database atau basis data bentuk hirarki adalah database yang sistem kerja di
dalamnya menggunakan bentuk data hirarki, yaitu dengan struktur hubungan induk dan
anak. Sehingga, dalam setiap grup database akan memiliki ibu dan anaknya masing-masing.
Contoh pengolahan data dengan jenis ini adalah IMS-2 (Information Management System)
tahun 1968 oleh IBM.

2. Network database
Network database atau basis data jaringan adalah turunan dari basis data hirarki. Karena
struktur jaringan ini akan membentuk entitas di dalamnya. Dalam basis data berikut, setiap
ibu dan anak boleh memiliki hubungan lebih dari satu entitas lainnya. Contoh basis data
jaringan adalah IDMS (Integrated Database Management System) tahun 1972 oleh Cullinet
Software.

3. Relational database
Dalam basis data ini pengolahannya dilakukan dengan adanya pengelompokkan hubungan
data. Untuk mengoperasikan relational database, seperti menambah, mengurangi,
menghapus, dan memanipulasi data, user perlu menggunakan Structured Query Language
(SQL). Basis data ini sering digunakan karena terdapat kemudahan dalam melakukan
integrasi data antara satu sama lain. Contoh pengolahan basis data ini adalah DBASE II oleh
Ashton-Tate, 1981, ORACLE oleh Relational Software Inc, 1979, System-R oleh IBM Research,
1975, dan INGRE oleh UN of CA & Relational Tech. 1973.

Komponen DBMS

Komponen DBMS tersebut antara lain:

1. Hardware, digunakan untuk mengakses dan menyimpan basis data yang terdiri dari jaringan
yang memiliki 1 server pusat dan beberapa program pengguna yang terdapat di desktop
komputer.
2. Software dan peralatannya, software merupakan DBMS yang aktual, sehingga mampu
menjembatani pengguna dan database.

3. User, sejumlah orang atau user yang dapat mengakses data sesuai kebutuhan aplikasi dan
interface oleh DBMS adalah database administrator, end user, dan programmer aplikasi.

4. Prosedur, mengatur dan mengontrol berbagai jalannya sistem sebagai praktik nyata yang
diikuti user untuk mengolah berbagai data.

5. Data, jantung dari DBMS, terdiri dari 2 jenis, yaitu kumpulan informasi yang dibutuhkan dan
juga meta data.

6. Database Manager, menerima query dari processor, kemudian menguji berbagai faktor
eksternal & konseptual untuk menentukan apakah rekaman yang ada tersebut dibutuhkan
untuk memenuhi permintaan kemudian file manager akan melanjutkannya hingga selesai.

7. File Manager, memanipulasi ruang penyimpanan file serta mengalokasi ruang penyimpanan
agar tetap dapat digunakan secara optimal.

8. Query Processor, membantu database untuk mengubah query menjadi instruksi yang sesuai
untuk database.

9. DDL Compiler, mengubah berbagai data pernyataan DDL menjadi kumpulan data tabel yang
berbentuk meta atau data dictionary.

10. DML Processor, proses untuk mengubah berbagai perintah DML agar dapat diteruskan
dengan menempelnya pada program aplikasi dalam bentuk fungsi.

11. Dictionary Manager, mengontrol pengaksesan data dan memeliharanya.

Macam-macam DBMS

Dalam penggunaannya, terdapat banyak macam-macam DBMS yang dapat digunakan. Berikut
adalah beberapa macam contohnya:
1. MySQL
MySQL merupakan software yang sering digunakan untuk mengakses DBMS dengan instalasi
lebih dari 6 juta pengguna karena bersifat gratis dengan fitur yang sudah cukup lengkap.
MySQL sangat cocok untuk yang ingin menggunakan DBMS untuk bisnis yang baru mulai
berkembang. Meskipun gratis, kestabilan dari kecepatan dan keamanannya cukup baik.
Tetapi ada bahasa pemrograman yang tidak kompatibel seperti Foxpro, Visual Basic (VB),
serta Delphi. Selain itu, MySQL sedikit kesulitan untuk memproses data yang berjumlah
besar.

2. Oracle
Jenis DBMS ini merupakan software yang berbayar. Software ini dapat mengikuti fleksibilitas
berbagai perusahaan besar. Berbagai komputerisasi rumit bisa diproses melalui software
Oracle.
3. Microsoft SQL Server
Software ini hanya dapat digunakan pada OS Windows. Microsoft SQL Server dapat
mengolah berbagai data berjumlah besar serta berbagai pengamanan data yang sangat baik
karena memiliki sebuah sistem untuk backup data. Software ini banyak digunakan untuk
jenis DBMS Relational.

4. Firebird
Firebird bekerja untuk jenis DBMS berbentuk relasional dan bersifat open source. Firebird
dapat melakukan berbagai perintah untuk DBMS, antara lain bisa mendukung proses
database seperti di database komersial, menggunakan sintaks standard untuk membuat
suatu foreign, dan banyak lagi. Firebird bisa digunakan baik pada Linux maupun Windows.

Elemen dalam DBMS

Untuk kalangan yang awam teknologi, wajar jika masih banyak yang kurang mengetahui tentang cara
kerja DBMS. Pada nyatanya, banyak elemen yang mendukung untuk kerjanya DBMS, elemen dalam
DBMS adalah:

1. Atribut
Atribut adalah sifat yang mewakili berbagai entitas. Atribut ini diperlukan agar data lebih
mudah untuk diproses dan ditemukan ketika pengguna membutuhkan data tersebut.

2. Entitas
Entitas atau entity ini adalah elemen yang mampu membuat objek, seperti nama tempat,
kondisi, atau orang yang nanti akan direkam untuk disimpan dalam DBMS.

3. Field
Setelah menjadi atribut, data akan direpresentasikan oleh field. Field akan mencerminkan
berbagai data dengan lebih spesifik, seperti nama dan keterangan lain di database yang
tersedia.

4. Karakter
Karakter merupakan sebuah komponen terkecil dalam data, yang biasanya dapat berbentuk
numerik atau berbagai huruf lain dan ketika sudah disatukan akan membentuk suatu item
dari data yang ada.

Kelebihan dan Kekurangan DBMS

Dalam penggunaannya terdapat berbagai kelebihan dan kekurangan DBMS yang tentu saja perlu
untuk diketahui. Hal ini bisa menjadi pertimbangan apakah perlu menggunakan DBMS atau tidak.
Kelebihan DBMS

1. Mengurangi terjadinya pengulangan data


2. Dapat mengambil beberapa data dan informasi dengan cepat
3. Meningkatkan keamanan data
4. Menyeimbangkan berbagai kebutuhan dan membandingkannya dengan skala ekonomi
5. Data yang diberikan konsisten
6. Pemulihan data yang rusak lebih cepat
7. Mempermudah pengambilan keputusan
Kekurangan DBMS

1. Software yang berlaku mayoritas mahal


2. Konfigurasi hardware cukup besar
3. Penggunaannya kompleks
4. Terdapat berbagai biaya tambahan, tergantung dari fungsi dan kebutuhan
5. Kinerja menurun seiring berjalannya waktu
6. Harus sering melakukan pembaharuan

Anda mungkin juga menyukai