DW-BAB1

BAB I
PENDAHULUAN
1.1. Latar Belakang

1.1.1. Data Warehouse
Data warehouse merupakan suatu kumpulan data yang bersifat subject-
oriented, terintegrasi, terus-menerus dan time variant yang membantu enterprise
atau organisasi dalam membuat keputusan. Sebagai pembuat keputusan maka
dibutuhkan query beberapa nilai dari satu subjek untuk melakukan proses analisis
secara real-time. Data warehouse dengan model multidimensional biasanya
diimplementasikan dalam bentuk star scheme agar memenuhi persyaratan. Pada
model multidimensional, data warehouse biasanya menyimpan data dalam bentuk
database relasional (Ni, dkk, 2011).
Data warehouse didefinisikan sebagai sekumpulan data yang bersifat
subject-oriented, terintegrasi, time variant, nonvolatile yang melayani sebagai
implementasi fisik dari sebuah model data untuk mengambil keputusan dan
menyimpan informasi untuk kebutuhan enterprise atas keputusan yang bersifat
strategis. Teknologi dalam data warehouse meliputi data cleaning, integrasi data,
dan OLAP sebagai teknik analisis dengan fungsi seperti menyimpulkan,
konsolidasi dan agregasi sebaik kemampuan memandang informasi dari berbagai
sudut (Reddy, dkk, 2010).
1.1.2. Karakteristik Data Warehouse

Dalam bukun yang berjudul Data Warehousing Fundamentals, karakteristik-
karakteristik dari data warehouse dapat dijelaskan sebagai berikut (Poniah, 2001):
a. Subject Oriented
Gambar 1.1 Karakteristik Subject-Oriented Data Warehouse
Pada sistem operasional, data disimpan berdasarkan aplikasi yang dibangun

secara individual. Selain itu dalam dalam database operasional, data disediakan
untuk semua fungsi yang dibutuhkan seperti untuk memasukkan pesanan,
mengecek persediaan, verifikasi kredit konsumen dan lain-lain. Akan tetapi dalam
data warehouse hanya mengandung data yang dibutuhkan untuk fungsi yang
berhubungan dengan sebagian aplikasi. Dapat dikatakan bahwa dalam database
operasional terdapat aplikasi tertentu yang mengandung data tertentu sementara
dalam data warehouse terdapat berbagai data yang melintasi semua aplikasi
individu yang ada.
b. Data Terintegrasi
Gambar 1.2 Karakteristik Data Terintegrasi Data Warehouse

Untuk pembuatan keputusan, data yang akan dimasukkan ke dalam data
warehouse dapat diambil dari berbagai aplikasi yang berhubungan dengan
keputusan yang akan dibuat. Data didalam data warehouse akan memiliki
perbedaan database, file dan segmentasi. Dikarenakan data untuk data warehouse
diambil dari aplikasi yang berbeda maka akan berbeda pula platform dan sistem
operasi yang digunakan aplikasi tersebut yang juga akan memunculkan perbedaan
pada tampilan file, representasi kode karakter, penamaan field tentunya. Oleh
karena itu, sebelum data yang dibutuhkan untuk data warehouse yang berasal dari
berbagai sumber data akan digunakan maka harus dilakukan penghapusan terhadap
data yang tidak konsisten dan harus dilakukan proses standardisasi untuk berbagai
elemen data. Sehingga data yang akan digunakan untuk data warehouse harus
melewati beberapa proses yaitu transformasi, konsolidasi dan integrasi dengan
sumber data lainnya.
c. Time Variant
Pada sistem operasional, data yang disimpan hanya mengandung nilai saat
ini saja. Namun tentu saja sistem operasional masih menyimpan beberapa data yang
sifatnya masa lalu. Akan tetapi secara esensial sistem operasional menggambarkan
informasi saat ini karena sistem mendukung operasi setiap hari nya. Pada data
warehouse, disebabkan oleh tujuan natural nya, data warehouse mengandung data
historis, tidak hanya nilai saat ini. Data disimpan sebagai gambaran masa lalu dan
periode saat ini. Setiap struktur data dalam data warehouse mengandung elemen
waktu. Secara alamiah, karakteristik time variant dalam data warehouse adalah
mengizinkan untuk menganalisis masa lalu, menghubungkan informasi saat ini, dan
memungkinkan untuk memprediksi masa depan.
d. NonVolatile
Data diekstraksi dari berbagai sistem operasional dan data yang bersumber
dari luar (eksternal) yang kemudian ditransformasi, diintegrasi, dan disimpan ke
dalam data warehouse. Data di dalam data warehouse tidak dirancang untuk
menjalankan bisnis setiap harinya. Sehingga dalam data warehouse tidak ada proses
pembaharuan data untuk setiap kali proses transaksi berjalan
Gambar 1.3 Karakteristik Non Volatile Data Warehouse

Arsitektur data warehouse meliputi alat untuk mengekstrak data dari
berbagai sumber data baik eksternal maupun database operasional, untuk
membersihkan data, transformasi dan mengintegrasikan data, untuk memasukkan
data ke dalam data warehouse, dan secara periodic untuk memperbaharui gudang
untuk mencerminkan pembaharuan pada sumber data dari gudang. Sebagai
tambahannya, dalam data warehouse dimungkinkan untuk membuat data marts
untuk beberapa departemen. Data di dalam data warehouse dan data marts disimpan
dan diatur oleh satu atau lebih server gudang yang menyajikan gambaran data
secara multidimensional ke dalam bentuk atau format seperti query, penulisan
laporan, alat untuk analisis, dan alat untuk data mining. Pada akhirnya terdapat
media penyimpanan dan mengatur metadata serta alat untuk memantau dan
administrasi sistem warehouse.
1.1.3. Arsitektur Data Warehouse

Umumnya sebuah sistem data warehouse terdiri dari tiga komponen utama,
yaitu alat back-end, data warehouse, dan alat front-end.
Gambar 1.4 Arsitektur Data Warehouse
Alat back-end adalah sekumpulan perangkat lunak akuisisi data dengan tiga
tugas utama: meng-ekstrak data dari sumber-sumber eksternal,
mengkonsolidasikan data ke dalam sebuah skema global, dan memuat data ke
dalam data warehouse (Garcia-Molina et al. 2002). Aktivitas-aktivitas ini umumnya
dikenal sebagai proses ETL (Extract, Transform, and Load). Modul-modul yang
bertanggung jawab untuk proses ekstraksi, konsolidasi dan pemuatan tersebut
adalah wrapper/monitor dan integrator (Widom 1995). Modul wrapper bertugas
mengubah sumber-sumber informasi dari format asalnya menjadi format dan model
data yang digunakan oleh sistem data warehouse. Ada beberapa proses yang
dilakukan pada saat berlangsungnya konversi, yaitu pemformatan ulang, pencucian,
pengintegrasian, dan peringkasan sumber-sumber informasi (Dunham 2003).
Peranan modul monitor adalah untuk mendeteksi secara otomatis setiap perubahan
dalam sumber informasi dan melaporkannya kepada modul integrator, yang
kemudian melakukan sederetan operasi seperti penyaringan, peringkasan,
penggabungan, dan penginstalasian informasi ke dalam data warehouse.
Untuk memenuhi keperluan sekelompok pemakai tertentu atau untuk tugas
pengambilan keputusan, sistem data warehouse mungkin juga menyediakan data
marts dalam bentuk data terpakai untuk analisis pengguna akhir. Data mart
merupakan sub-divisi dari data warehouse menurut tingkat departemental, regional,
atau fungsional yang dapat menyokong jenis aplikasi analitik yang lebih spesifik
secara efisien. Dari sudut pandangan bisnis, data mart adalah tingkat ritel dimana
konsumer data (dalam hal ini pengguna akhir) memperoleh informasi spesifik dari
data warehouse (Moody & Kortink 2000).
Alat front-end terdiri dari perangkat lunak klien yang dapat digunakan untuk
mengakses informasi yang disimpan di dalam data warehouse atau data mart.
Sistem data warehouse biasanya menyediakan berbagai alat aplikasi untuk
mengakomodasi tingkat kemahiran pengguna akhir yang berbeda-beda. Tergantung
pada bagaimana data disimpan di dalam data warehouse, alat-alat tersebut dapat
mengakses server data warehouse untuk melakukan kueri. Server itu kemudian
melakukan konsultasi ke tempat penyimpanan metadata dan database untuk
menjawab kueri tersebut.
Tempat penyimpanan metadata digunakan dalam data warehouse untuk
mencatat deskripsi data baik dari sumber-sumber informasi maupun dari data
warehouse itu sendiri. Metadata itu seperti kartu katalog perpustakaan yang
menunjuk ke sebuah lokasi dan makna dari berbagai objek informasi di dalam data
warehouse (Barquin & Edelstein 1997). Alat-alat back-end dan front-end
melakukan permintaan informasi berdasarkan pemilihan yang dibuat dari katalog
tersebut. Sebagai contoh, alat back-end dapat berkonsultasi dengan penyimpanan
metadata tentang lokasi sebuah data tertentu, waktu untuk memperoleh data
tersebut, format data dalam sumber informasi dan transformasi atau tindakan lain
yang harus dilakukan terhadap data tersebut bilamana data itu dimuat ke dalam data
warehouse. Manakala alat front-end mungkin perlu mengetahui tentang deskripsi
item data tertentu, format data tersebut dalam data warehouse, informasi yang
sesuai yang diperlukan untuk memungkinkan pemilihan kueri pengguna yang
akurat, cara peringkasan data, dan bagaimana menyajikan hasil yang diperoleh
untuk memberi jawaban terbaik terhadap kueri.
1.1.4. Data Mining

Data mining adalah bagian dari proses KDD (Knowledge Discovery in
Databases) yang terdiri dari beberapa tahapan seperti pemilihan data, pra
pengolahan, transformasi, data mining, dan interpretasi hasil (Maimon & Last
2000). Pemilihan data bertujuan untuk memilih data yang akan dianalisa dengan
cara menentukan rekod dan atribut yang diperlukan. Setelah melalui proses
pemilihan, kemudian dilakukan pra pengolahan terhadap data yang dipilih tersebut
dengan cara membersihkannya dari nilai-nilai yang hilang atau tidak diketahui,
serta mencari dan membuang atau memperbaiki data pencilan (outliers data).
Apabila terdapat butir-butir data yang bersifat temporal (misalnya tanggal), maka
selanjutnya dilakukan proses transformasi ke dalam bentuk periode waktu sehingga
dapat dilakukan analisis deret berkala (time series). Proses transformasi ini
merupakan prasyarat untuk dapat dilakukannya proses data mining yang berhasil.
BAB II
PEMBAHASAN
2.1. Perancangan Data Warehouse Untuk Mendukung Perencanaan

Pemasaran Perguruan Tinggi
2.1.1. Pendahuluan
Salah satu indikasi perguruan tinggi yang besar adalah dilihat dari jumlah
mahasiswa di perguruan tinggi tersebut. Karena mahasiswa baru merupakan salah
satu sumber daya yang menentukan berjalannya sebuah perguruan tinggi. Setiap
tahunnya STMIK AMIKOM Purwokerto selalu melakukan penerimaan calon
mahasiswa. Data calon mahasiswa baru tersebut disimpan dalam suatu aplikasi SIA
PMB dalam bentuk data SQL server. Selama ini, data calon mahasiswa baru
tersebut tidak terkelola dengan baik. Padahal data calon mahasiswa baru tersebut
sangat berguna bagi bagian pemasaran sebagai informasi untuk evaluasi kegiatan
pemasaran berikutnya.
Berdasarkan hal tersebut, maka di manajemen STMIK AMIKOM
Purwokerto merasa perlu peningkatan penggunaan teknologi informasi untuk
menganalisa data historikal mahasiswa baru. Salah satu penerapan penggunaan
teknologi informasi tersebut menggunakan data warehouse yang terintegrasi
dengan (On-Line Analytical Processing) OLAP yang dapat digunakan untuk
menganalisis informasi yang berpotensi menunjang strategi pemasaran yang efektif
dan efisien. Data warehouse memiliki kemampuan untuk melakukan analisa
terhadap data transaksi yang telah lalu dan juga bisa memberikan laporan yang
bersifat dinamis dan bisa dilihat dari berbagai dimensi, sehingga dapat digunakan
untuk memdukung proses analisis bagi para pengambil keputusan.
2.1.2. Analisis Sistem

Dari analisis data, sumber data yang digunakan berasal dari sumber data
SIA PMB yaitu tabel calonsiswa. Sumber data tersebut di konversi dalam Ms-excel.
Terdapat 2 (dua) sumber data dalam format Ms-excel, yaitu sumber data
Pendaftaran dan Registrasi. Masing-masing tabel mewakili kegiatan transaksional
yang terjadi dalam penerimaan calon mahasiswa baru. permasalahan dan penyebab
masalah yang muncul dalam Penerimaan Mahasiswa Baru (PMB) sebagai berikut:
Identifikasi penyebab Alternatif pemecahan
NO. Masalah yang dihadapi
masalah masalah
Data yang ada pada
perguruan tinggi yang
Belum tersedianya
1. semakin besar dan banyak
data warehouse.
membutuhkan alokasi tempat
penyimpanan
Pengolahan data mahasiswa Data warehouse dan
belum optimal khususnya aplikasi OLAP
Belum tersedianya
2. pengolahan data yang Penerimaan Mahasiswa
aplikasi OLAP yang
berhubungan dengan analisis Baru (PMB)
digunakan dalam
historikal mahasiswa baru
penerimaan
Data penerimaan mahasiswa
Mahasiswa Baru
baru tidak dapat disajikan
3. (PMB)
dalam bentuk multi
dimensional
Tabel 2.1 Hasil Identifikasi Permasalahan

Hasil analisa masalah dan identifikasi penyebab masalah yang ada dapat
diambil suatu alternatif pemecahan masalah yaitu dengan membangun data
warehouse Penerimaan Mahasiswa Baru (PMB) yang dapat digunakan untuk
menemukan pengetahuan maupun analisis data.
2.1.3. Perancangan Sistem

Dalam Implementasi ini diperlukan rancangan data warehouse yang terdiri
dari beberapa tahap agar perancangan data warehouse menjadi teratur. Tahap-tahap
dalam perancangan data warehouse ini mengacu kepada Kimball yang dikutip oleh
(Connolly, 2005), yaitu Nine-Step Methodology (kimball, 1996).
Perancangan dalam data warehouse penerimaan calon mahasiswa baru ini
menggunakan Star Schema, bentuk ini dipilih karena tabel dimensinya tidak
mengandung ringkasan atau tidak memiliki perbedaan tingkat ukuran sehingga
tidak memerlukan tabel sub dimensi. Skema ini merupakan skema yang mudah
dipahami daripada skema yang lain. Dengan menggunakan Star Schema, performa
proses querynya menjadi lebih dan waktu pemrosesan menjadi lebih cepat, secara
garis besar Star Schema terdiri dari satu tabel fakta dan beberapa tabel dimensi.
2.1.4. Analisis Hasil Data Warehouse

Analisis pada data warehouse pada penelitian ini dilakukan dengan Pentaho
Report Designer adalah tools untuk merancang laporan sesuai dengan business
requirement. Selain relative mudah penggunaannya, Pentaho Report Designer juga
dapat menghasilkan outputan ke banyak format (.pdf, .xls, .html, dll). Adapun
contoh report yang telah dibuat adalah sebagai berikut:
Gambar 2.1 Laporasn Penjurusan Berdasarkan Per-informasi
2.1.5. Pengujian Sistem

Hasil uji sistem data warehouse penerimaan mahasiswa baru berupa
kuisioner data penilaian fungsi yang digunakan dalam reporting data warehouse,
didapatkan data sebagai berikut:
a. Pengujian Karakteristik Functionality
∑ X1 = 101,2 (Jumlah rata-rata skor pertanyaan)
n = 11 (Jumlah Responden)
Skor = 99,6 / 11
= 9,05
b. Pengujian Reability
∑ X1 = 96,17 (Jumlah rata-rata skor pertanyaan)
Skor = 96,17 / 11
= 59,9
c. Pengujian Usability
∑ X1= 103,4 (Jumlah rata-rata skor pertanyaan)
Skor = 103,4 / 11
= 4,50
d. Pengujian Efficiency
∑X1 = 95,8 (Jumlah rata-rata skor pertanyaan)
Skor = 95,8 / 11
= 4,17
e. Pengujian Maintainbility
∑ X1 = 92 (Jumlah rata-rata skor pertanyaan lampiran 7)
Skor = 92 / 11
=4
f. Pengujian Portability
∑ X1= 87,2 (Jumlah rata-rata skor pertanyaan lampiran 8)
Skor = 96,17 / 11
= 3,79
2.2. Penerapan Data Mining Dengan Metode Klasifikasi Menggunakan

Decision Tree dan Regresion
2.2.1. Pendahuluan
Indonesia dengan kekayaan gas alam yang sangat besar, seharusnya
pengadaan enegi gas dapat dimaksimalkan untuk memenuhi kebutuhan dalam
negeri. Namun masyarakat masih sedikit yang memanfaatkan program konversi
BBM ke Bahan Bakar Gas (BBG). Diawali dengan keinginan pemerintah untuk
mengkonversi Bahan Bakar Minyak (BBM) ke Bahan Bakar Gas (BBG), sehingga
BUMN (Badan Usaha Milik Negara) khususnya di kabupaten Cilacap pada tahun
2009 berusaha untuk memaksimalkan keinginan pemerintah yang kemudian akan
memberikan secara cuma-cuma kompor gas dan tabung gas untuk golongan yang
tidak mampu, dan kemudian BUMN pun melakukan survey secara menyeluruh
untuk mendapatkan data yang valid kelompok masyarakat mana yang
diprioritaskan pertama untuk mendapatkan bantuan tersebut.
Data Mining (Penambangan data) merupakan bidang ilmu multidisplin,
menggambarkan area-area kerja yang termasuk didalamnya adalah teknologi basis
data, pembelajaran mesin, statistik, pengenalan pola, pengambilan informasi,
jaringan saraf tiruan, sistem berbasis pengetahuan, kecerdasan buatan, komputasi
kinerja-tinggi, dan visualisasi data (Han & Kamber, 2006).
Ada banyak metodologi Data Mining, salah satu yang populer adalah Pohon
Keputusan (Decision Tree). Pohon keputusan merupakan salah satu metode
klasifikasi yang sangat menarik yang melibatkan konstruksi pohon keputusan yang
terdiri dari node keputusan yang di hubungkan dengan cabangcabang dari simpul
akar sampai ke node daun (akhir). Pada node keputusan attribut akan diuji, dan
setiap hasil akan menghasilkan cabang. Setiap cabang akan diarahkan ke node lain
atau ke node akhir untuk menghasilkan suatu keputusan (Larose, 2005).
2.2.2. PreProcessing
PreProcessing yang dilakukan yaitu proses pembersihan data mengalami
tiga tahap pembersihan yaitu: Incomplete, Noisy dan Inconsisten. Berikut dibawah
ini penjelasan dan prosesnya.
a. Incomplete
Pada tahap ini, penulis membersihkan data berdasarkan data yang tidak lengkap
atau data yang tidak terisi. Kesimpulan dari tahap ini adalah pembersihan data,
dalam artian bahwa jika attribute data tersebut kosong atau tidak terdapat nilai
didalamnya maka attribute data tersebut akan dihapus. Hal tersebut di atas
dikarenakan penulis tidak memiliki data pendukung untuk mengisi attribute data
yang kosong.
b. Noisy dan Inkonsistensi Data
Merupakan suatu data yang memiliki kelainan, hal ini dikarenakan karena
kesalahan operator dalam memasukkan data kedalam database, permasalahan pada
pentransmisian data, keterbatasan teknologi, atau tidak dilakukannya
penyeragaman data, seperti data wilayah, jenis kelamin, dan lain sebagainya.
Proses pembersihan data ini menggunakan suatu tools data mining yaitu Orange.
2.2.3. Pengubahan Data menjadi Numeric

Pada langkah selanjutnya data yang sudah dibersihkan akan diubah value
nya menjadi bentuk numeric, hal ini dimaksudkan agar pengolahan data pada
MatLab dapat lebih mudah dan cepat, karena MatLab hanya memproses data-data
numeric.
2.2.4. Transformasi Data

Tahapan Transformasi data adalah pengubahan format data tersimpan
menjadi bentuk standar format file yang sesuai dengan aplikasi yang akan
digunakan. Pada penelitian kali ini, penulis menggunakan aplikasi MatLab untuk
melakukan proses data mining dengan Proses Aturan Prediksi menggunakan
Regresi Linear, aturan Klasifikasi menggunakan Decision Tree. Pengubahan atau
Transformasi data ke dalam format file yang sesuai adalah mengubah format file
data sebelumnya yang merupakan bentuk file Tab Delimited yaitu Text atau .txt
menjadi bentuk .dat.
2.2.5. Proses Data Mining

Pada tahapan ini Peneliti mencoba membuat proses aturan klasifikasi pada
data mining menggunakan decision tree. Algoritma klasifikasi akan menggunakan
data tersebut untuk menghasilkan pengetahuan. Pengetahuan yang hendak
dihasilkan dalam klasifikasi adalah untuk menggolongkan bagaimana ketentuan
seorang warga mendapatkan suatu bantuan, baik itu bantuan secara materiil ataupun
bantuan yang bersifat pelatihan agar warga tersebut dapat meningkatkan
kesejahteraan hidupnya. Pada proses ini, Peneliti mengambil attribute kelurahan,
pendidikan, pekerjaan dan pengeluaran untuk menentukan siapa warga yang
memiliki ketentuan tersebut diatas berhak menerima bantuan. Berikut ini
merupakan tahapan awal sampai akhir proses klasifikasi dengan decision tree
dengan menggunakan Orange.
2.2.6. Penarikan Informasi

Berdasarkan hasil yang didapat pada 3 langkah data mining diatas, maka
dapat ditarik beberapa kesimpulan atau informasi yang dapat dijadikan pengetahuan
untuk diambil suatu keputusan, informasi tersebut dapat dijabarkan sebagai berikut.
a. Klasifikasi dengan Pohon Keputusan/Decision Tree.
Berdasarkan proses software Orange dengan menggunakan widget
Classification Tree Viewer dan Classification Tree Graph bahwa keputusan yang
dapat diambil oleh kepala kecamatan tentang kelurahan yang akan diberikan
bantuan dengan skala prioritas adalah Kelurahan Bajing Kulon, Kedawung,
Pekuncen, Pesanggarahan dan seterusnya.
b. Klasifikasi dengan Regresi Linear
Untuk mendapatkan informasi yang dibutuhkan dalam pengambilan
keputusan dengan menggunakan Regresi Linear maka data yang ada yaitu data Pada
Kecamatan Kroya dengan 17 kelurahannya harus di pecah menjadi data per
kelurahan saja. Data per Kelurahan inilah nantinya akan dihitung dengan regresi
linear pada Aplikasi Data Mining yang Peneliti rancang, yang kemudian hasil dari
proses tersebut satu per satu Kelurahan yang ada di Kecamatan Kroya akan
dibandingan secara keseluruhan. Hasil dari regresi linear ini adalah mencari nilai
dari Variabel Y terkecil di kelurahan yang ada.
2.3. Optimasi Pemrograman Query Untuk Algoritma Apriori Berbasis

Asosiasi Data Mining
2.3.1. Pendahuluan
Aturan asosiasi dalam data mining bertujuan untuk menemukan pola
frekuensi, asosiasi, korelasi dan struktur hubungan antar item atau obyek dari
sekumpulan item yang ada dalam transaksi database, database relasional maupun
informasi dari tempat penyimpanan yang lain.Setiap item atau obyek adalah
variabel bernilai Boolean yang merepresentasikan ada tidaknya item tersebut dalam
transaksi. Setiap transaksi dapat direpresentasikan oleh nilai vektor Boolean untuk
setiap variabelnya. Vektor Boolean dapat dianalisis untuk menemukan pola dari
item-item yang cenderung muncul bersamaan dengan nilai frekuensi.
Salah satu faktor yang memberikan konstribusi untuk menentukan apakah
suatu pola menarik atau tidak adalah kesederhanaannya dalam pemahaman
manusia. Semakin kompleks struktur sebuah aturan, maka semakin sulit untuk
diinterpretasikan sehingga pola yang dibentuk semakin tidak menarik. Setiap pola
yang disajikan harus mempunyai sebuah nilai pengukuran yang memberikan
kepastian bahwa pola tersebut layak dipercaya sebagai pola yang terbaik atau tidak.
Dengan adanya berbagai perkembangan teknologi di bidang database
server, maka penelitian ini ingin menggali lebih lanjut teknik selain iteratif yang
dapat diimplementasikan dalam penyelesaian masalah asosiasi data. Tentunya hasil
akhir yang ingin dicapai dari penelitian ini adalah efektifitas teknik pemrograman
dan juga efisiensi waktu penyelesaian analisis.
2.3.2. Hasil dan Pembahasan

Implementasi dalam bentuk program terbagi menjadi 2 bagian yang
terumuskan dalam bentuk form yaitu form untuk menampilkan informasi transaksi
yang tercatat dalam database dan form untuk analisis untuk mencari
pengelompokan barang. Form untuk mengimplementasikan sistem informasi
pendataan dilengkapi dengan 3 pilihan untuk pengguna sistem yaitu pilihan
menampilkan keseluruhan data transaksi dari rekaman data, pilihan untuk
menampilkan data transaksi berdasarkan pilihan periode waktu dan pilihan
berdasarkan kata kunci nama barang yang akan digunakan.
Gambar 2.2 Form Informasi Transaksi
Form data transaksi barang dilengkapi dengan 3 pilihan dalam bentuk
Option Button yaitu pilihan seluruh transaksi, transaksi berdasarkan tanggal dimana
pengguna dapat memilih periode transaksi berdasarkan tanggal tertentu dan pilihan
hanya untuk transaksi barang tertentu saja.
Setelah pengguna memilih pilihan, maka tombol atau button Tampilkan
Data digunakan untuk melakukan pemrosesan terhadap pilihan yang diberikan.
Data akan ditampilan secara terurut descending berdasarkan tanggal Di bawah ini
adalah kode program dalam bentuk query untuk menampilkan data pada tombol
Tampilkan Data.
Hasil analisis dapat dipilih oleh pengguna oleh karena sistem menyediakan
3 pilihan bentuk analisis yaitu analisis seluruh iterasi, analisis per iterasi dan analisis
berdasarkan range iterasi yang diberikan. Secara mendasar, ketiga pilihan
mempunyai kode program yang sama, yang membedakan adalah proses
menampilkan hasil analisis. Pengguna dapat menampilkan secara kontinyu seluruh
proses iterasi algoritma apriori atau proses ditampilkan secara per iterasi maupun
hanya iterasi-iterasi tertentu saja. Hasil analisis ditampilkan dalam bentuk tabel
hasil analisis, dimana tabel tersebut menampilkan data kombinasi setiap item
barang dan jumlah atau frekuensi transaksi yang memuat kombinasi tersebut.
Gambar 2.3 Form Analisis Apriori
Hasil perhitungan dalam bentuk program diujicobakan dalam bentuk

pengujian hasil untuk melihat hasil perhitungan algoritma apriori secara
menyeluruh. Data yang dianalisis adalah data dengan sample 20 item barang dan
50 item barang yang diambil secara acak atau random berdasasarkan pertimbangan
bahwa data-data tersebut dapat mewakili jumlah transaksi keseluruhan.
Rekomendasi sistem minimal dalam menjalankan sistem ini, khususnya prosesor
dan memori ditetapkan sesuai dengan standar minimal Visual Basic sebagai
perangkat dasar yang digunakan dalam mengembangkan sistem ini. Rekomendasi
sistem minimal dari Visual Basic adalah Prosesor: 133 Mhertz dan jumlah Memori:
128 Mbyte. Sistem operasi yang digunakan adalah sistem operasi windows.
Perhitungan yang dilakukan melalui proses sistem, akan berbeda karena
dipengaruhi oleh spesifikasi komputer yang digunakan, data yang dianalisis, dan
banyaknya sampel yang digunakan dalam proses analisis data mining. Perhitungan
di bawah ini menggunakan spesifikasi komputer berkecepatan 1 Gigahertz dengan
besar ukuran memori 1 Gigabyte.
Dari hasil perhitungan yang disampaikan pada pembahasan di jurnal, maka

algoritma apriori dapat menyelesaikan semua perhitungan sesuai dengan sample
data yang diberikan. Proses perhitungan membutuhkan penggunaan sumber daya
komputer yang cukup besar, baik kecepatan prosesor maupun jumlah memori yang
lebih banyak.
Hasil perhitungan bervariasi, namun secara umum dapat dilihat bahwa:
a. Semakin banyak item barang yang dianalisis, maka waktu pemrosesan akan
semakin lama baik oleh proses query maupun proses looping.
b. Semakin kecil nilai Minimum Support Count, maka proses perhitungan
membutuhkan waktu yang lebih lama.
c. Semakin kecil nilai Minimum Support Count dan semakin sedikit item
barang yang dianalisis, akan berpengaruh pada proses perhitungan
algoritma yang lebih cepat.
Proses query menggunakan optimasi yang sangat baik bila dibandingkan
dengan proses looping. Proses looping cenderung hanya berjalan sampai proses
iterasi 3 dengan 3 kombinasi item sedangkan proses iterasi berikut sudah tidak
memungkinkan. Dengan proses query, maka optimasi setiap iterasi masih
dimungkinkan walaupun dengan waktu yang cenderung lebih lama.
Dari hasil perhitungan algoritma juga dapat dianalisis bahwa proses yang
membutuhkan sumber daya yang sangat besar dan waktu analisis yang lama adalah
proses join antar item barang. Dengan proses kombinasi item barang yang semakin
banyak menyebabkan kombinasi antar item juga semakin banyak. Hasil akhir
menunjukkan perhitungan 50 item barang membutuhkan waktu yang lebih banyak
dibandingkan perhitungan 20 item barang.
BAB III
PENUTUP
3.1. Kesimpulan
a. Dengan dibangunnya Data Warehouse maka penelusuran informasi
dapat dilakukan dengan mudah dan lebih fleksibel.
b. Informasi yang terdapat pada Data Warehouse dapat digunakan untuk
evaluasi dan perencanaan untuk perkembangan atau project yang
dilakukan di kemudian hari.
c. Setelah melalui tahap perancangan sistem dan implementasi diperoleh
hasil optimasi pemrograman query pada penelitian jurnal di atas, waktu
yang digunakan menjadi lebih singkat karena semua data disimpan
dalam bentuk tabel kemudian diolah dengan cara mengoptimalkan
proses asosiasi antar item dan tingkat keakurasian hasil asosiasi menjadi
lebih tinggi.
d. Dengan adanya Data Warehouse dan Data Mining penelitian yang
dilakukan oleh peneliti dapat terlaksana dengan baik dan tujuan peneliti
dapat tercapai. Hasil yang didapat dari penelitian sangat lah baik dan
jelas seperti yang dijelaskan pada pembahasan jurnal.
DAFTAR PUSTAKA

DW-BAB1

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

DW-BAB1

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I

1.1. Latar Belakang

1.1.2. Karakteristik Data Warehouse

Gambar 1.1 Karakteristik Subject-Oriented Data Warehouse

Pada sistem operasional, data disimpan berdasarkan aplikasi yang dibangun

Gambar 1.2 Karakteristik Data Terintegrasi Data Warehouse

Gambar 1.3 Karakteristik Non Volatile Data Warehouse

1.1.3. Arsitektur Data Warehouse

1.1.4. Data Mining

2.1. Perancangan Data Warehouse Untuk Mendukung Perencanaan

2.1.2. Analisis Sistem

Tabel 2.1 Hasil Identifikasi Permasalahan

2.1.3. Perancangan Sistem

2.1.4. Analisis Hasil Data Warehouse

Gambar 2.1 Laporasn Penjurusan Berdasarkan Per-informasi

2.1.5. Pengujian Sistem

2.2. Penerapan Data Mining Dengan Metode Klasifikasi Menggunakan

2.2.3. Pengubahan Data menjadi Numeric

2.2.4. Transformasi Data

2.2.5. Proses Data Mining

2.2.6. Penarikan Informasi

2.3. Optimasi Pemrograman Query Untuk Algoritma Apriori Berbasis

2.3.2. Hasil dan Pembahasan

Gambar 2.3 Form Analisis Apriori

Hasil perhitungan dalam bentuk program diujicobakan dalam bentuk

Dari hasil perhitungan yang disampaikan pada pembahasan di jurnal, maka

Anda mungkin juga menyukai