Anda di halaman 1dari 3

Kelompok 5

- Wahyu Aji Sasongko (01918146460)


- M. Faishal Farras (01918146516)

TUGAS II MANAJEMEN INFORMASI BERBASIS BIG DATA


Database Management System
1. Describe a database and a database management system (DBMS).
Database atau basis data adalah kumpulan data yang dikelola sedemikian
rupa berdasarkan ketentuan tertentu yang saling berhubungan sehingga
mudah dalam pengelolaannya. Melalui pengelolaan tersebut pengguna dapat
memperoleh kemudahan dalam mencari informasi, menyimpan informasi dan
membuang informasi. DBMS adalah sistem software yang digunakan untuk
menyimpan, mengatur, dan memastikan data-data tersebut tersimpan dengan
aman.
2. Explain what an online transaction-processing (OLAP) system does.
Inti dari sebagian besar database OLAP adalah kubus OLAP, yang
memungkinkan pengguna untuk dengan cepat membuat kueri, melaporkan,
dan menganalisis data multidimensi. Misalnya, angka penjualan mungkin
memiliki beberapa dimensi yang terkait dengan wilayah, waktu dalam
setahun, model produk, dan lainnya.

Kubus OLAP memperluas format baris demi kolom dari skema database
relasional tradisional dan menambahkan lapisan untuk dimensi data lainnya.
Misalnya, sementara lapisan atas kubus dapat mengatur penjualan menurut
wilayah, analis data juga dapat "menelusuri" ke dalam lapisan untuk
penjualan menurut negara bagian/provinsi, kota, dan/atau toko tertentu. Data
historis dan teragregasi untuk OLAP ini biasanya disimpan dalam skema
bintang atau skema kepingan salju.
3. Why are data in databases volatile?
Data dalam database bersifat volatil (mudah berubah) karena dapat
diperbarui jutaan kali setiap detik, terutama jika merupakan sistem
pemrosesan transaksi (TPS)
4. Explain what processes DBMSs are optimized to perform.
 Pemfilteran dan pembuatan profil data
Memeriksa data untuk kesalahan, inkonsistensi, redundansi, dan informasi
yang tidak lengkap.
 Integritas dan pemeliharaan data
Memperbaiki, menstandarisasi, dan memverifikasi konsistensi dan
integritas data.
 Sinkronisasi data
Mengintegrasikan, mencocokkan, atau menautkan data dari sumber yang
berbeda.
 Keamanan data
Memeriksa dan mengendalikan integritas data dari waktu ke waktu.
 Akses data
Menyediakan akses resmi ke data baik secara terencana maupun ad hoc
dalam waktu yang dapat diterima.
5. What are the business costs or risks of poor data quality?
 Kerusakan reputasi
Kerusakan reputasi dapat berkisar dari kerusakan kecil sehari-hari hingga
bencana hubungan masyarakat yang besar. Sebagai contoh, data yang
buruk di sebuah bank sebut saja nama bank tersebut adalah Bank
Amanah, dalam praktiknya menjalankan proses perbankan ternyata Bank
Amanah melakukan perdagangan yang tidak disengaja dengan pemodal
teroris yang dikira adalah sebuah instansi milik pemerintah tetapi karena
Bank Amanah tidak memiliki informasi yang cukup akurat tentang
pelanggan yang mereka ajak berdagang dan ternyata malah bekerja sama
dengan teroris yang dicurigai pemerintah. Akhirnya, hal tersebut
mengakibatkan PR dijatuhi denda hukuman dan reputasi bank tersebut
menjadi rusak di mata masyarakat sehingga mengakibatkan kepercayaan
dan loyalitas masyarakat sebagai nasabah menjadi berkurang.
 Peluang terlewatkan
Perusahaan mungkin kehilangan peluang penting untuk pengembangan
produk baru atau kebutuhan pelanggan yang disebabkan perusahaan
tersebut memiliki kualitas data yang buruk. Ternyata di sisi lain,
perusahaan pesaing memiliki kualitas pengelolaan data yang baik
sehingga peluang yang disebutkan diawal malah dimanfaatkan oleh
perusahaan pesaing dan hal ini sangat merugikan.
 Kehilangan pendapatan
Data yang buruk dapat menyebabkan hilangnya pendapatan dalam
berbagai perspektif. Misalnya, sebuah komunikasi yang gagal dikonversi
menjadi penjualan karena data pelanggan yang mendasarinya salah dan
hal ini disebabkan karena kualitas data yang buruk. Sebagai contoh, dalam
bidang asuransi, informasi properti yang buruk dapat menyebabkan
hilangnya pendapatan dari premi jika ditetapkan terlalu rendah karena data
tersebut.
6. Describe the data life cycle.
Siklus hidup data adalah urutan tahapan yang dilalui oleh unit data tertentu
dari generasi awal atau penangkapan hingga pengarsipan dan/atau
penghapusan pada akhir masa manfaatnya.
7. What is the function of master data management (MDM)?
Fungsi Master Data Management (MDM) adalah untuk memastikan integritas
penyimpanan data perusahaan, sehingga semua layanan dapat mengakses
data yang akurat, relevan, dan terkini setiap saat, dari satu titik akses.

Data Warehouse and Big Data Analysis


1. Why are human expertise and judgment important to data analytics?
Give an example.
Keahlian dan penilaian manusia diperlukan untuk menginterpretasikan
keluaran analitik. Data tidak berharga jika manusia tidak dapat menganalisis,
menafsirkan, memahami, dan menerapkan hasilnya dalam konteks. Sebagai
contoh, beberapa percaya bahwa hasil Super Bowl pada bulan Februari
memprediksi apakah pasar saham akan naik atau turun tahun itu. Jika
Konferensi Sepak Bola Nasional (NFC) menang, pasar naik; jika tidak, saham
akan turun. Melihat hasil selama 30 tahun terakhir, paling sering NFC
memenangkan Super Bowl dan pasar naik. Apakah ini berarti apa-apa?
Tidak.
2. What is the relationship between data quality and the value of analytics?
Data kotor menurunkan nilai analitik. "Kebersihan" data sangat penting untuk
penambangan data dan proyek analisis.
3. Why do data need to be put into a meaningful context?
Manajer membutuhkan konteks untuk memahami bagaimana menafsirkan
data tradisional dan besar. Jika analisis atau kumpulan data yang digunakan
salah, hasilnya akan menjadi tidak masuk akal, seperti pada contoh
pemenang Super Bowl dan kinerja pasar saham.
4. What are the differences between databases and data warehouses?
Database (basis data) dirancang dan dioptimalkan untuk memastikan bahwa
setiap transaksi segera dicatat dan disimpan. Bersifat Volatile (mudah
berubah) karena data terus diperbarui, ditambahkan, atau diedit. Memiliki
sistem OLTP dimana perusahaan menengah dan besar biasanya memiliki
banyak database dari berbagai jenis. Data Warehouse (gudang data)
dirancang dan dioptimalkan untuk analisis dan respons cepat terhadap
pertanyaan. Tidak mudah menguap, artinya stabilitas ini penting untuk dapat
menganalisis data dan membuat perbandingan. Saat data disimpan, data
tersebut mungkin tidak akan pernah diubah atau dihapus untuk melakukan
analisis tren atau membuat perbandingan dengan data yang lebih baru.
5. Explain ETL and CDC
 ETL mengacu pada tiga prosedur - Ekstrak, Transformasi, dan Muat -
digunakan dalam memindahkan data dari database ke gudang data. Data
diekstraksi dari database yang ditunjuk, diubah dengan format standar,
membersihkan data, mengintegrasikannya, dan dimuat ke dalam gudang
data.
 CDC, singkatan dari Change Data Capture, mengacu pada proses yang
menangkap perubahan yang dibuat pada sumber data dan kemudian
menerapkan perubahan tersebut di seluruh penyimpanan data perusahaan
untuk menjaga sinkronisasi data. CDC meminimalkan sumber daya yang
diperlukan untuk proses ETL dengan hanya menangani perubahan data.

Anda mungkin juga menyukai