Anda di halaman 1dari 8

Contoh Soal Datawarehouse

Mungkin temen-temen ada yang butuh, ini saya share kisi-kisi soal UTS DW
1. Sebutkan karakteristik datawarehouse
- integrated
- non volatile
- subject oriented
- time variant - memiliki rentang waktu(history)
2. Jelaskan mengenai ETL
1) Extract yaitu seluruh proses untuk mengambil data dari sumber data menjadi
sebuah format standar yang mudah untuk diproses
2) Transform yaitu proses untuk mengubah format, struktur dan arsitektur data agar
sesuai dengan spesifikasi yang ditentukan di datwarehouse
3) Load yaitu proses untuk memasukkan data ke dalam datawarehouse
3. apa saja nilai datawarehouse yang bisa kita dapat jika dikombinasikan
dengan bisnis intelligent
1) memahami apa yang terjadi pada bisnis
2) menentukan trend bisnis
3) prediksi kesempatan di maasa datang
4) mengukur performance

4. ciri-ciri data yang sehat


1) tidak terjadi data ganda (redundant)
2) penamaan tidak berasal dari objek (misal:manusia,tempat,dll)
3) data harus akurat
4) tidak ada data yang error

5. Apa saja nilai datawarehouse yang bisa kita dapat jika dikombinasikan dengan Bisnis
Intelligence
jawaban nya :
dapat membuat, mengembangkan laporan, analisa dan aplikasi yang memanfaatkan
datawarehouse
6. mengapa datwarehouse disebut memiliki sifat heteroginitas
karena dalam datawarehouse dimana data nya dibagi dalam subject area

7. apa yang dimaksud dengan data purging


data purging adalah pembuangan data pada data lama, namun data lama
tidak akan dihapus melainkan dipidah ke media lain namun bisa saja dihapus
sesuai dengan organinsasi

SOAL-SOAL DATAWAREHOUSE
1. Jelaskan tentang OLAP !
jawab :
Data warehouse menyediakan suatu tool yang disebut OnLine Analytical Processing(OLAP)
untuk melakukan analisis data multidimensional secara interaktif yang nantinya akan menjadi
fasilitas yang memudahkan untuk melakukan proses data mining (Reddy, dkk, 2010).
Pada dasarnya, user membutuhkan kemampuan untuk menampilkan analisis multidimensional
dengan kalkulasi yang kompleks, tetapi pada kenyataannya dalam media atau alat penulisan
laporan, query, spreadsheets tidak mampu memenuhi kebutuhan itu. Melihat kepada
kenyataan tersebut maka dibutuhkan suatu alat tambahan yang mampu menjawab semua
persoalan tersebut. Dibutuhkan sekumpulan alat yang secara khusus dapat melakukan analisis
secara serius. Untuk itulah OLAP dibutuhkan.

OLAP (OnLine Analytical Processing) merupakan sebuah kategori software yang memungkinkan
analis, manajer dan eksekutif untuk mendapat keuntungan dari dalam data secara cepat,
konsisten, dan interaktif dengan berbagai kemungkinan yang ada pada pandangan terhadap
informasi yang ditransformasi dari data mentah ke dalam bentuk nyata yang dapat dipahami
olehuser (Ponniah, 2001).

2. bagaimana analisis kinerja penjualan dengan data warehouse ?


jawab :
Data warehouse menyajikan sebuah pondasi untuk berbagai jenis dari analisis dan laporan
mengenai penjualan beserta prediksi nya. Laporan dan analisis penjualan beserta prediksi nya
menyajikan pandangan bagi bagian penjualan perusahaan, mengintegrasikan informasi dari
penjualan, konsumen dan keuangan untuk melengkapi gambaran kinerja penjualan (Nasir, dkk,
2006).

Dalam jurnalnya yang berjudul Data Warehouse Design For Sales Performance Analysis, Nasir, dkk
menyatakan bahwa analisis kinerja penjualan menggabungkan konsep dari proses analitis
dan data warehouse untuk mendukung proses pembuatan keputusan dalam organisasi.
Perancangan dari analisis kinerja penjualan dengan data warehouse memberikan dampak yang
1
langsung pada kemampuan perusahaan untuk menampilkan analisis penjualan produk secara
khusus. Namun tidak ada aturan khusus untuk merancang data warehouse yang akan dipakai
dalam analisis kinerja penjualan.

3Data warehouse memiliki salah satu karakteristik yaitu Time Variant. Jelaskan apa maksud
dariTime Variant ?
jawab :
Pada sistem operasional, data yang disimpan hanya mengandung nilai saat ini saja. Namun tentu
saja sistem operasional masih menyimpan beberapa data yang sifatnya masa lalu. Akan tetapi
secara esensial sistem operasional menggambarkan informasi saat ini karena sistem
mendukung operasi setiap hari nya. Pada data warehouse, disebabkan oleh tujuan natural
nya, data warehouse mengandung data historis, tidak hanya nilai saat ini. Data disimpan
sebagai gambaran masa lalu dan periode saat ini. Setiap
struktur data dalam data warehousemengandung elemen waktu. Secara alamiah,
karakteristik time variant dalam data warehouse adalah mengizinkan untuk menganalisis masa
lalu, menghubungkan informasi saat ini, dan memungkinkan untuk memprediksi masa depan.

Soal- Soal Data Warehouse

1.Jelaskan 2 pengertian overflow storage + contoh.


Kombinasi dari data historis dan data rinci yang menghasilkan tingkat pertumbuhan yang
fenomenal
Sebagai data yang tumbuh besar, subsisdi alami dapat terjadi antara data aktif dan tidak
aktif yang digunakan
Contoh :
o Low peformance disk storage -> FAT Storage
o Line Storage -> Robot yang dikendalikan dengan Catridge Based Sequential Tape
o Sequential Tape -> Lebih canggih dari Line Storage
2. Jelaskan makna inactive data !
Data tidak aktif adalah data yang tidak muncul di file tree dan juga dikenal sebagai direktori atau
struktur data. Meskipun data ini berada pada hard drive Anda, data ini tidak dapat diakses oleh
sistem operasi dan juga tidak bisa di maintain. Data yang dihapus atau data yang ada sebelum
memformat sistemadalah dua contohnya. Pada dasarnya, data yang tidak dapat diakses / tidak
dapat dilihat, tetapi masih disuatu tempat di dalam hard drive diklasifikasikan sebagai inavtive
data.

3. Jelaskan makna feedback loop !


Feedback Loop dapat meningkatkan atau memberikan perubahan yang terjadidalam suatu
sistem. Umpan balik yang positif dapat meningkatkan ataumemperkuat perubahan, hal
ini cenderung untuk membuat sistem menjadikeadaan seimbang dan membuatnya lebih stabil.
Sedangkan umpan balik yangnegatif cenderung untuk
meredam atau memberikan perubahan, akan tetapi perubahan perubahan yang diberikan
membuat keadaan menjadi tidak seimbang dan tidak stabil.
4. Jelaskan beberapa feedback loop techniques !
Bentuk bagian pertama dari gudang data dengan sangat kecil, langkah-langkah yang sangat
cepat, dan hati-hati mendengarkan komentar pengguna akhir 'di akhir setiap langkah
pembangunan.
Jika tersedia, gunakan prototyping dan memungkinkan feedback loopuntuk memfungsikan
penggunaan pengamatan yang dikumpulkan dari prototipe.
Lihatlah bagaimana orang lain telah membangun tingkat granularity merekadan belajar dari
pengalaman mereka.
Pergi ke proses umpan balik dengan memanfaatkan user yang berpengalaman yang
menyadari proses yang sedang terjadi.
Lihatlah apa organisasi yang kini muncul dapat bekerja, dan menggunakan persyaratan
fungsional sebagai panduan.
Jalankan joint application design (JAD) dan mensimulasikan output untuk mencapai umpan
balik yang diinginkan.
5. Jelaskan makna raw estimate !
Suatu aktivitas yang di gunakan untuk menentukan tingkat kerincian dengan cara melakukan
estimasi pada jumlah baris data dan DASD(Direct Acces Storage Device) di dalam data
warehouse
6. Jelaskan 4 teknik melakukan raw estimate !
Identifikasi semua tabel yang akan dibangun : Mencari tahu semua informasi table yang
akan di bangun atau buat.
Perkirakan ukuran masing-masing baris dalam table : Membuat perkiraan mengenai
besarnya ukuran setiap table.
Dalam kurun waktu satu tahun, perkirakan jumlah maksimum dan minimum dari baris
dalam table : Tentukan banyaknya jumlah maksimal dan minimal yang akan di pakai dalam
table.
Hitung ruang proyeksi data indeks : Menentukan besarnya ruang yang di butuhkan untuk
proyeksi data indeks agar tidak terjadi kekurangan tempat.
2
7. Jelaskan makna input to the planning process !
Suatu kegiatan dimana kita memasukan suatu informasi seperti estimasi tempat dan estimasi
baris serta informasi-informasi lainnya kedalam suatu proses perencanaan untuk mendukung
rencana yang telah dibuat agar tidak terjadi kesalahan seperti kekurangan DASD,waktu yang
tidak cukup,dll dalam rencana yang telah di rancang.oleh karena itu kita perlu melakukan input
kedalam proses perencanaan kita seperti menentukan DASD yang di butuhkan,waktu yg di
perlukan untuk menjalankan rencana tersebut dan tingkat rincian yang di perlukan.

1. Apa hubungan antara OLAP dan OLTP?

Jawaban ::
Sebelum kita membahas tentang hubungan antara OLAP dan OLTP, kita harus mengetahui
terlebih dahulu definisi atau pengertian dari OLAP dan OLPT.
a) OLAP
Suatu jenis perangkat lunak yang melakukan pemrosesan untuk menganalisa data bervolume
besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data
multidimensi yang berfungsi sebagai data analasis (select) (Ardi, 2010). Data multidimensi
adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran. Contoh atribut
dimensi adalah nama barang dan warna barang, sedangkan contoh atribut ukuran adalah
jumlah barang.
b) OLTP (Online Transaction Processing Systems)
adalah suatu sistem yang memproses suatu transaksi secara langsung (insert, update, delete)
melalui komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang
memproses suatu transaksi secara langsung melalui komputer yang terhubung dalam jaringan
(Ardi, 2010). Seperti misalanya kasir pada sebuah super market yang menggunakan mesin
dalam proses transaksinya. OLTP mempunyai karakteristik beberapa user dapat creating,
updating, retrieving untuk setiap record data, lagi pula OLTP sangat optimal untuk updating
data.
Jadi, hubungan antara OLAP dan OLTP adalah pemrosesan dalam suatu sistem yang saling
berkaitan. OLTP digunakan untuk memprosesan suatu transaksi yang menginput atau
memasukkan data menggunakan OLAP yang berfungsi untuk menganalisis. Sehingga dengan
menggunakan OLPT user dapat creating, updating, retrieving untuk setiap data record dari
OLAP.

2. Jelaskan tahapan-tahapan utama pengumpulan data pada Data Warehouse.

Jawaban ::
Integrasi data adalah penggabungan datadari berbagai sumber penyimpanan datauntuk
menjadi satu kesatuan data yangkoheren.
Reduksi data. Teknik reduksi data diterapkan untuk memperoleh representasi tereduksi
dari sejumlah data yang berimplikasi pada volume yang jauh lebih kecil.
Pembersihan Data. Proses ini merupakan tahapan pembersihan data, yaitu
mengisi data yang hilang, mengatasi data yang kotor dan rusak, mengidentifikasi atau
membuang data pencilan*, *memperbaiki data yang tidak konsisten.
Transformasi data yaitu prosespengubahan data menjadi bentuk yang tepat.Proses ini
dilakukan agar kondisi data tetapkonsisten dan dapat digunakan untuk proses.

3. Apa kaitan antara Data Warehouse, Data Mining dan Data Mart?

Jawaban ::
Sebelum membahas kaitan antara Data Warehouse, Data Mining, Data Mining kita lihat dahulu
pengertian masing-masing Data tersebut :
1. Data Warehouse : merupakan metode dalam perancangan database, yang menunjang
DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data
warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda.
Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data
warehousenormalisasi bukanlah cara yang terbaik.
2. Data Mining : Perangkat Lunak yang digunakan untuk menemukan pola-polater sembunyi
maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan
aturan-aturan yang digunakan untuk memperkirakan perilaku di masa yang akan datang.
3. Data Mart : Merupakan bagian dari data warehouse yang mendukung kebutuhan pada
tingkat departemen atau fungsi bisnis tertentu dalam perusahaan.
Jadi, kaitan Data Warehouse, Data Mining, Data Mart adalah ketiganya merupakan perangkat
lunak yang saling menunjang. Data Warehouse yang merancang database, Data Mining
digunakan untuk basis data yang besar dalam perangkat lunak tersebut, sedangkan Data Mart
untuk mendukung kebutuhan fungsi bisnis dalam suatu perusahaan.

4. Sebutkan model-model Data Mining

3
Jawaban ::
a. Association Rules
Sering disebut juga dengan Link Analysis atau Market-basket Analysis
Merupakan pendekatan diskriptif yang mengekplorasi data untuk mencari hubungan antar
data yang ada
Banyak digunakan untuk melakukan penganalisaan terhadap transaksi pemesanan/retail
b. Clustering
Sering disebut dengan unsupervised classification
Telah banyak diimplementasikan di berbagai bidang mulai dari ekonomi sampai biologi
Ada beberapa jenis: hierarchical, partitional dan density estimation-based clustering
c. Decision Trees
Sering disebut juga Regression Tree
Merupakan metode yang terkelompok ke dalam supervised classification
Fungsinya sama dengan Neural Networks dalam hal klasifikasi
Sudah banyak diterapkan di dalam berbagai macam pemodelan terapan
d. Neural Networks
Merupakan metode yang terkelompok dalam supervised classification
Bisa digunakan untuk klasifikasi dan bias juga digunakan untuk melakukan prediksi
Merupakan pemodelan yang mencontoh otak manusia (hewan)
e. Bayesian Networks
Merupakan pemodelan dengan menggambarkan variable sebagai bagian dari suatu jaringan
Bisa dikatakan sebagai gabungan dari neural networks dan decision trees
Berguna untuk melakukan pemodelan yang kompleks, dimana variables yang dianalisa
mempunyai hubungan kompleks dan tidak hanya hubungan satu arah

1. Apa itu Convenience field dalam eksplorasi data warehouse?


2. Apakah data warehouse dan data marts harus di letakkan pada machine yang sama ? atau
harus terpisah? jelaskan!
3. Jelaskan lifecycle of data dari operation sampai data warehouse!
4. Apakah penting melakukan testing pada data warehouse? jelaskan
5. Bagaimana data warehouse di gunakan dalam e-business?
6. Jelaskan Tugas Granularity manager dalam data warehouse?
7. Jelaskan mengenai system of record
8. Buat contoh data untuk pivot table
9. Jelaskan karakteristik EIS
10. Sebutkan dan jelaskan 2 dasar aktifitas yang harus di penuhi perusahaan untuk memenuhi
standard informasi
11. Gambarkan tahapan dalam implementasi sebuah project?
12. Jelaskan 8 langkah membuat teknikal architecture
13. Sebutkan 5 kesalahan umum dalam melaksanakan project data warehouse?

Jawaban
1. Convenience field adalah field yang dibuat dalam analisis untuk kenyamanan analis, bidang
kenyamanan terdiri dari elemen data rinci yang berasal dari sumber non analitis
2 harus terpisah, karena untuk meningkatkan ketersedianya data. Yang akan banyak di pakai oleh
subject area tertentu.
3. Life Cycle of Data

4
Capture : mengambil data yang diinput
Edit: memodifikasi data yang telah diinput
Load into application : memindahkan data yang telah di edit kedalam applikasi
Online Access: mengakses data yang telah di load kedalam database.
Integrated with other application : mengabungkan data yang ada pada corporate menjadi satu
kesatuan data
Load into data warehouse : memindahkan data kedalam data warehouse, lalu melakukan analisis
seberapa sering sebuah data di tampilkan
Frequancy of usage drops: data yang paling sering masuk ke dalam posisi ini.
Near line storage : data yang agak jarang di panggil maka akan di masukkan kesini , contoh data
yang dipanggil dalam seminggu sekali, dua minggu sekali atau sebulan sekali atau setahun
sekali.
Archival storage : data yang disimpan disini data yang sangat jarang ditampilkan dan biayanya
berisikan data-data detail dari setiap summary.
4. Cukup penting adanya testing dalam datawarehouse karena ketelitian dari data sangat
dibutuhkan jika menyangkut hubungannya dengan bank, karena tidak mungkin applikasi
dengan datawarehouse langsung diterapkan tanpa ditest terlebih dahulu karena bisa saja
terjadi human error saat melakukan Transformasi data.
5. Manfaat Data Warehouse pada dalam E-Business
Sebagai tempat penyimpanan data dan segala aktivitas dalam pengunaan Web
Sebagai salah satu tempat penyimpanan data yang akan digunakan untuk tujuan analisis data
(baik untuk pengambilan keputusan atau perencanaan strategi)
Meningkatkan performance web.
Meningkatkan availability data dalam web.
Mengurangi response time.
Penerapan Datawarehouse pada E-bisnis
Dengan menggunakan software Granularity Manager, software yang dapat digunakan untuk
mengelola aliran data Web log clickstream sebelum masuk ke dalam lingkungan data
warehouse.
hal- hal yang dilakukan dalam GM meliputi :
Edits out extraneous data
Creates a single record out of multiple, related clickstream log records
Edits out incorrect data
Converts data that is unique to the Web environment, especially key
data that needs to be used in the integration with other corporate data
Summarizes data
Aggregates data
Ringkasannya, cara menerapkan DWH dalam web terdiri dari 3 hal yaitu
1. Data yang dikumpulkan ke web log.
2. Log data diproses dengan melewati Granularity Manager .
3. The Granularity Manajer kemudian melewati refined data ke dalam data warehouse.
6.Tugas Granularity Manager:
5
Menghapus Data clickstream asing(Delete)
Merangkum data yang clickstream(Summary)
Mengagregat Data clickstream(Aggregating)
Menggabungkan data clickstream yang sudah tepat(Merge)
Menyatukan data clickstream yang sudah tepat(Compact)
7.
System of Record adalah definitif sumber informasi untuk setiap nilai yang diberikan sebuah
informasi
8.Contoh Pivot Table
Merah Biru
Baju 2 3
Celana 1 4

Sum of Color
8

4 Sum of Biru
Sum of Merah
3

0
Total

9.Karakteristik EIS
Harus mampu melakukan
Trend Analysis and Detection
Key Ratio Indicator measurement and tracking
Drill-down Analysis
Problem Monitoring
Competitive analysis
Key Performance indicator monitoring
Sehingga EIS mampu menjalankan fungsinya sebagai pembantu pengambilan keputusan dan
memonitoring masalah yang terjadi dan pengukuran performa sekaligus menganalisa trend
yang sedang terjadi.

10. 2 aktivitas
Financial Complience
berkaitan dengan pencatatan, prosedur, dan pelaporan transaksi keuangan.
Jenis kegiatannya
1. Mencatat tanggal transaksi
2. Mencatat jumlah transaksi
3. Merekam peserta dalam transaksi
4. Klasifikasi transaksi
Aspek dalam transaksi Keuangan
1. Masa lalu dan masa kini. (past and present)
Transaksi saat ini di mana organisasi bergerak. bahwa ketika transaksi terjadi,harus tunduk pada
serangkaian audit yang . Setelah menyelesaikan audit dan prosedur, data keuangan bisa
dipindahkan kedalam data warehouse

2. Melihat kembali Data keuangan dari waktu ke waktu


Dalam hal ini, memeriksa data keuangan yang lebih tua adalah fokus. Tentu, data warehouse
menjadi fokus di sini. Data warehouse adalah tempat alami untuk memulai karena data
warehouse memegang berikut:
a. Historical data
b. Granular data
c. Integrated data

Auditing Corporate Communications


6
Berkaitan dengan proses terjadi nya transaksi keuangan
Dibagi dari sumber datanya
a. terstruktur
i. Email
ii. Telepon
iii. Kontrak
iv. proposal
b. tidak terstruktur
i. gambar
ii. celotehan
iii. lagu
iv. video

untuk mengatasi itu maka ada 3 cara untuk mengumpulkan data tidak terstruktur
1. Sebuah indeks sederhana
Memegang referensi kembali ke kata atau frase. Misalkan kata "akun" telah ditemukan.
Sederhana Indeks hanya menunjuk kembali ke dokumen atau email di mana kata itu dijumpai.
2. Sebuah indeks konteks
Kata-kata dan frase di mana ada kekritisan dirasakan informasi. Misalnya, kalimat "kontingen
dijual" ditemukan. Dalam referensi konteks, teks sebelum dan sesudah frase ditangkap.
3. Salinan pesan atau komunikasi
Bisa dibuat jika ditentukan bahwa penemuan sebuah kata atau frase sangat penting. Misalkan
pesan berikut diterima: ". Kami memiliki rencana untuk menggelapkan perusahaan" Dalam hal
ini, seluruh pesan ditangkap dan disimpan.

Setelah sudah mampu didapat data tidak terstruktur akan di transform menjadi data terstruktur
dan akan di load ke dalam data warehouse sama seperti data terstruktur

11.
12. 8 step membangun Technical Architecture
1. Establish an Architecture Task Force
Proses seorang teknical designer berkerjasama dengan, staging designer dan analis developer
applikasi menyatukan menyelesaikan arsitektur dan memastikan fungsi dan bentuk backend
dan frontend
2. Collect Architecture-Related Requirements
Arsitektur dibuat untuk mendukung kebutuhan bisnis yang bernilai tinggi. Fokus utama adalah
untuk mengungkap implikasi arsitektur yang terkait dengan kebutuhan bisnis yang kritis dan
memanfaatkan kebutuhan bisnis untuk mendefinisikan secara jelas sebuah proses,maka
dilakukan wawancara tambahan dalam organisasi TI
3. Document Architecture Requirements
Mendokumentasikan wawancara tambahan dari langkah sebelumnya.
4. Develop a High-Level Architectural Model
Setelah itu merumuskan model untuk mendukung kebutuhan yang teridentifikasi maka step
kedua menjadi komponen utama , seperti data staging, data access, metadata, dan
infrastuktur

7
5. Design and Specify the Subsystems
Sekarang kita mengerti bagaimana bagian-bagian utama akan hidup berdampingan, sekarang
saatnya untuk melakukan desain rinci dari subsistem.
6. Determine Architecture Implementation Phases
Kita harus menyediakan element penting dalam arsitektur untuk membantu kebutuhan akhir dari
iterasi awal project
7. Document the Technical Architecture
Kita perlu untuk mendokumentasikan arsitektur teknis, termasuk tahapan pelaksanaan yang
direncanakan.dokumen rencana untuk arsitektur teknis harus mencakup detil yang memadai
sehingga para profesional yang terampil dapat melanjutkan pembangunan framework
8. Review and Finalize the Technical Architecture
Rencana arsitektur harus dikomunikasikan dengan baik keberbagai tingkat detail, kepada tim
proyek, TI rekan, sponsor bisnis, dan memimpin bisnis.

13. Kesalahan Umum yang terjadi saat pembanguan project data warehouse
1. Tidak memiliki sponsor bisnis yg kuat
2. Tidak memiliki motivasi bisnis yg kuat untuk membangun data warehouse
3. Tidak layaknya data , tidak layaknya secara teknis dan sumber daya
4. Kurangnya komunikasi orang bisnis dan IT
5. Tidak siapnya budaya analisis yg sedang ada di perusahaan

Anda mungkin juga menyukai