Anda di halaman 1dari 7

PENILAIAN AKHIR SEMESTER

Nama : Hani Rismawati


NPM 1957201025
Prodi : Sistem Informasi
Semester V
MK : Sistem Data Warehouse

SOAL :
1. Apa yang kamu ketahui dengan Gudang Data ?
Jawab :
Definisi umum dari gudang data atau data warehouse adalah sistem komputer yang
bertugas untuk mengarsipkan dan menganalisis sebuah data historis untuk keperluan
suatu organisasi atau bisnis tertentu. Informasi yang dikelola dapat berupa data terkait
penjualan, gaji, serta informasi harian lainnya.

Dengan menganalisa sebuah data secara terstruktur, maka dapat menghasilkan


informasi yang lebih akurat untuk menunjang pengambilan keputusan oleh suatu
perusahaan. Itulah mengapa, gudang data termasuk dalam salah satu parameter
penunjang kegiatan business intelligence.

Gudang data sendiri pertama kali digunakan dan ditemukan pada tahun 1980-an yang
saat itu juga banyak bisnis besar yang menerapkan DSS (Decision Support System).
Hingga saat ini, banyak perusahaan yang menerapkan strategi tersebut untuk
membantu dalam meningkatkan kualitas dan produktivitas kerja.

2. Sebutkan dan jelaskan secara singkat tugas-tugas yang dilakukan data


warehouse?
Jawab :
Fungsi Data Warehouse

1. Membantu dalam Mengambil Keputusan


Fungsi pertama dari data warehouse adalah untuk dapat mengambil sistem keputusan
yang tepat. Dimana, informasi tersebut haruslah kredibel dan berdasarkan fakta yang
ada. Tujuannya ialah agar dapat membuat keputusan yang benar dalam segmentasi
pasar, manajemen inventaris, dan manajemen keuangan (finansial).

2. Mudah dan Cepat dalam Mengakses Data


Fungsi yang kedua adalah mudah untuk diakses, dimana pengguna dapat berinteraksi
dengan sumber secara cepat dan lebih efisien. Yang mana, keefektifan tersebut dapat
memberikan impact pada pengambilan keputusan yang lebih cepat daripada
kompetitor bisnis anda.

3. Menciptakan Konsistensi Data


Dikarenakan data warehouse merupakan sistem yang dapat mengumpulkan berbagai
informasi dari platform yang berbeda, sehingga dapat diubah menjadi format tunggal
agar dapat digunakan dengan baik.

Kemudian, untuk kedepannya perusahaan anda dapat memperoleh hasil yang


maksimal dan konsisten satu sama lainnya. Ketika standarisasi data telah terbentuk,
maka anda dapat menaruh kepercayaan yang tinggi pada tingkat keakuratan gudang
data untuk dapat membuat keputusan bisnis yang jelas dan tepat.

4. Menghasilkan ROI yang Optimal


ROI (Return of Investment) adalah tingkat rasio antara jumlah laba bersih dan biaya
investasi yang dihasilkan dari beberapa investasi pada resource (sumber daya) yang
ada. Jika dihubungkan dengan data warehouse sendiri, memiliki fungsi khusus untuk
memberikan pengembalian investasi yang lebih menguntungkan.

5. Menyediakan Historical Intelligence


Fungsi yang terakhir adalah sebagai penyedia mayoritas historical data agar anda
dapat menganalisis setiap periode atau tren waktu yang berbeda, untuk dapat
membuat prediksi bisnis (forecasting) di masa yang akan datang.

3. Berikan 4 contoh dan penjelasan implementasi datamining?


Jawab :
Dalam bidang apasaja data mining dapat diterapkan? Berikut beberapa contoh bidang
penerapan data mining:

1. Analisa pasar dan manajemen

Solusi yang dapat diselesaikan dengan data mining, diantaranya:

 Menembak target pasar.


 Melihat pola beli pemakai dari waktu ke waktu,
 Cross-market analysis.
 Profil Customer.
 Identifikasi kebutuhan customer.
 Menilai loyalitas Customer.
 Informasi Summary

2. Analisa Perusahaan dan Manajemen resiko

Solusi yang dapat diselesaikan dengan data mining, diantaranya:

 Perencanaan keuangan dan Evaluasi aset.


 Perencanaan sumber daya (Resource Planning).
 Persaingan (Competition).

3. Telekomunikasi

Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan
transaksi yangmasuk, transaksi mana sajakah yang masih harus ditangani secara
manual.

4. Keuangan

Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini


menggunakan data mining untuk menambang trilyunan dari berbagai subyek seperti
properti, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-
transaksi keuangan yang mencurigakan (seperti money laundry).

4. Apa itu Amazon RedShift ? Bagaimana kinerja Amazon Redshift dibandingkan


dengan sebagian besar database tradisional dalam hal gudang data dan analisis
?
Jawab :
Amazon Redshift adalah gudang data berskala petabyte yang cepat dan dikelola
sepenuhnya, memudahkan dan menghemat biaya dalam menganalisis semua data
Anda menggunakan alat kecerdasan bisnis yang Anda miliki. Anda dapat memulai
dengan harga termurah sebesar USD0,25 per jam tanpa komitmen dan dengan skala
hingga petabyte sebesar USD1.000 per terabita per tahun, kurang dari sepersepuluh
biaya solusi tradisional. Pelanggan biasanya bisa melakukan kompresi hingga 3x,
sehingga mengurangi biaya mereka hingga USD333 per terabita yang tidak
dikompresi tiap tahun.

Amazon Redshift menggunakan berbagai inovasi untuk mencapai kinerja hingga


sepuluh kali lebih tinggi dari database tradisional dalam hal beban kerja gudang data
dan analitik:
 Paralel masif: Amazon Redshift memberikan kinerja kueri yang cepat pada dataset
dengan beragam ukuran mulai gigabyte hingga exabyte. Redshift menggunakan
penyimpanan kolom, kompresi data, dan peta zona untuk mengurangi jumlah I/O
yang diperlukan untuk melakukan kueri. Amazon RedShift menggunakan arsitektur
gudang data pemrosesan paralel masif (MPP), yang memparalelkan dan
mendistribusikan operasi SQL untuk memanfaatkan semua sumber daya yang
tersedia. Perangkat keras dasarnya dirancang untuk pemrosesan data berkinerja tinggi
menggunakan penyimpanan terpasang lokal untuk memaksimalkan throughput antara
CPU dan drive, dan jaringan jala bandwidth tinggi untuk memaksimalkan throughput
di antara node.
 Machine learning: Amazon Redshift menggunakan machine learning untuk
memberikan throughput yang tinggi, terlepas dari beban kerja atau penggunaan
konkuren Anda. Redshift memanfaatkan algoritme rumit untuk memprediksi waktu
penjalanan kueri yang masuk dan memberikannya pada antrean optimal untuk
pemrosesan tercepat. Misalnya, kueri seperti dasbor dan laporan dengan persyaratan
konkurensi tinggi dirutekan ke antrean ekspres untuk pemrosesan segera. Saat
konkurensi semakin meningkat, Amazon Redshift memprediksikan kapan antrean
akan dimulai dan menerapkan sumber daya sementara secara otomatis dengan fitur
Pengembangan Konkurensi untuk memastikan kinerja cepat yang konsisten, terlepas
dari keragaman permintaan pada klaster.
 Caching hasil: Amazon Redshift menggunakan caching hasil untuk memberikan
waktu respons sepersekian detik untuk kueri yang berulang. Dasbor, visualisasi, dan
alat kecerdasan bisnis yang menjalankan kueri berulang mengalami dorongan kinerja
yang signifikan. Saat kueri dijalankan, Redshift mencari cache untuk memeriksa
apakah ada hasil yang disimpan dalam cache dari proses sebelumya. Jika hasil yang
disimpan dalam cache ditemukan dan data tidak berubah, hasil tersebut akan segera
dikembalikan dan tidak dilakukan kueri ulang.

5. Bagaimana saya dapat mengakses klaster gudang data yang sedang


berjalan? Jawab :
Setelah klaster gudang data tersedia, Anda dapat mengambil titik akhir serta string
koneksi JDBC dan ODBC dari AWS Management Console atau dengan
menggunakan API Redshift. Anda kemudian dapat menggunakan string koneksi
dengan alat database, bahasa pemrograman, atau alat Kecerdasan Bisnis (BI) favorit
Anda. Anda perlu memberi izin permintaan jaringan pada klaster gudang data Anda
yang sedang berjalan.

6. Sebutkan karakteristik
datawarehouse ! Jawab :
4 Karakteristik Data Warehouse yang Perlu Diketahui Perusahaan
Perusahaan memiliki banyak data dari berbagai departemen, seperti departemen
keuangan, produk, penjualan, marketing, dan lain-lain. Untuk menyimpan data dan
mengolah data tersebut, perusahaan membutuhkan bantuan teknologi agar dapat
menyimpan dan mengolah data dengan aman, tepat, dan cepat. Data warehouse adalah
sebuah sistem penyimpanan data yang dapat terintegrasi dengan berbagai sumber dan
dapat menganalisis kumpulan data yang tersedia, sehingga mampu menghasilkan
laporan yang berguna untuk pengambilan keputusan bisnis. Sebelum memanfaatkan
data warehouse sebagai tempat penyimpanan data perusahaan Anda, berikut 4
karakteristik data warehouse yang perlu diketahui untuk membantu Anda lebih
memahami fungsi dari data warehouse.

1. Berorientasi pada subjek


Data warehouse mampu menganalisa data pada suatu subjek dan menyediakan
informasi mengenai subjek tersebut. Subjek yang dimaksud adalah seperti penjualan,
pemasaran, distribusi, pendapatan, dan lain-lain. Data warehouse fokus pada analisis
data dan permodelan suatu subjek untuk membuat berbagai keputusan dengan mudah
dan tepat.

2. Mengintegrasikan data
Data warehouse dapat mengintegrasikan data dari berbagai sumber data. Kemampuan
integrasi data ini dapat meningkatkan efektivitas analisis data.

3. Memiliki rentang waktu yang akurat


Data yang disimpan pada data warehouse tercatat waktunya, baik itu harian,
mingguan, bulanan, dan tahunan. Rentang waktu data warehouse sangat luas jika
dibandingkan dengan sistem tradisional. Ketika mengolah data, data warehouse
mampu menyediakan rentang waktu yang dibutuhkan secara akurat.

4. Integritas data dapat dipastikan


Data yang disimpan dalam data warehouse bersifat permanen dan tidak dapat diubah.
Jika ada data terbaru yang disimpan dengan subjek yang sama, maka data warehouse
menganalisis data tersebut berdasarkan waktu. Data akan diurutkan berdasarkan
waktunya. Jadi, perusahaan dapat memastikan keaslian data dan integritasnya tetap
terjaga.

7. Jelaskan mengenai ETL !


Jawab :
ETL adalah singkatan dari extract, transform, dan load. Melansir IBM, ia merupakan
proses integrasi data.

Di sana, data akan dikombinasikan dari berbagai sumber. Setelah itu, mereka
disimpan di tempat bernama data warehouse.

Dalam proses ini, kata, ada tools yang bisa kamu gunakan. Misalnya, MarkLogic,
Oracle, Amazon RedShift, dan lain-lain.

Di perusahaan, orang yang bertanggung jawab atasnya merupakan ETL developer.

8. Apa saja nilai datawarehouse yang bisa kita dapat jika dikombinasikan dengan
bisnis intelligent
Jawab :
Menurut Steve dan Nancy Williams (2007, p31-32), keuntungan dari
penggunaan Business Intelligence dalam sebuah bisnis atau perusahaan adalah:
 Meningkatkan proses manajemen (perencanaan, pengendalian, pengukuran,
pemantauan dan atau mengubah) sehingga manajemen dapat meningkatkan
pendapatan dan atau mengurangi biaya.
 Meningkatkan proses operasional (seperti deteksi penipuan, eksekusi promosi
penjualan, pemrosesan pesanan pelanggan, pembelian, dan/atau pengelolaan hutang
piutang) sehingga bisnis ini dapat meningkatkan pendapatan dan atau mengurangi
biaya, dengan kata lain, nilai bisnis Business Intelligence terletak pada
penggunaannya dalam proses manajemen yang mempengaruhi proses operasional
yang mendorong pendapatan atau mengurangi biaya, dan/atau dalam penggunaannya
dalam proses-

9. Apa hubungan antara OLAP dan


OLTP? Jawab :
a) OLAP
Suatu jenis perangkat lunak yang melakukan pemrosesan untuk menganalisa data
bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut
analisis data multidimensi yang berfungsi sebagai data analasis (select) (Ardi, 2010).
Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan
atribut ukuran. Contoh atribut dimensi adalah nama barang dan warna barang,
sedangkan contoh atribut ukuran adalah jumlah barang.

b) OLTP (Online Transaction Processing Systems)


adalah suatu sistem yang memproses suatu transaksi secara langsung (insert, update,
delete) melalui komputer yang terhubung dalam jaringan. OLTP berorientasi pada
proses yang memproses suatu transaksi secara langsung melalui komputer yang
terhubung dalam jaringan (Ardi, 2010). Seperti misalanya kasir pada sebuah super
market yang menggunakan mesin dalam proses transaksinya. OLTP mempunyai
karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record
data, lagi pula OLTP sangat optimal untuk updating data.

Jadi, hubungan antara OLAP dan OLTP adalah pemrosesan dalam suatu sistem yang
saling berkaitan. OLTP digunakan untuk memprosesan suatu transaksi yang
menginput atau memasukkan data menggunakan OLAP yang berfungsi untuk
menganalisis. Sehingga dengan menggunakan OLPT user dapat creating, updating,
retrieving untuk setiap data record dari OLAP.

10. Jelaskan tahapan-tahapan utama pengumpulan data pada Data Warehouse.


Jawab :
 Integrasi data adalah penggabungan datadari berbagai sumber penyimpanan datauntuk
menjadi satu kesatuan data yangkoheren.
 Reduksi data. Teknik reduksi data diterapkan untuk memperoleh representasi
tereduksi dari sejumlah data yang berimplikasi pada volume yang jauh lebih kecil.
 Pembersihan Data. Proses ini merupakan tahapan pembersihan data, yaitu
mengisi data yang hilang, mengatasi data yang kotor dan rusak, mengidentifikasi atau
membuang data pencilan*, *memperbaiki data yang tidak konsisten.
 Transformasi data yaitu prosespengubahan data menjadi bentuk yang tepat.Proses ini
dilakukan agar kondisi data tetapkonsisten dan dapat digunakan untuk proses.

11. Apa kaitan antara Data Warehouse, Data Mining dan Data
Mart? Jawab :
Sebelum membahas kaitan antara Data Warehouse, Data Mining, Data Mining kita
lihat dahulu pengertian masing-masing Data tersebut :
1. Data Warehouse : merupakan metode dalam perancangan database, yang menunjang
DSS(Decission Support System) dan EIS (Executive Information System). Secara
fisik data warehouse adalah database, tapi perancangan data warehouse dan database
sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi,
sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.

2. Data Mining : Perangkat Lunak yang digunakan untuk menemukan pola-polater


sembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan
menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa
yang akan datang.

3. Data Mart : Merupakan bagian dari data warehouse yang mendukung kebutuhan pada
tingkat departemen atau fungsi bisnis tertentu dalam perusahaan.

Jadi, kaitan Data Warehouse, Data Mining, Data Mart adalah ketiganya merupakan
perangkat lunak yang saling menunjang. Data Warehouse yang merancang database,
Data Mining digunakan untuk basis data yang besar dalam perangkat lunak tersebut,
sedangkan Data Mart untuk mendukung kebutuhan fungsi bisnis dalam suatu
perusahaan.

Anda mungkin juga menyukai