Anda di halaman 1dari 4

UJIAN TENGAH SEMESTER

BIG DATA

Nama : Faiz Ahmad


NIM : 0110219055
Program Studi : Teknik Informatika 01-2019
Mata Kuliah : Big Data
Prodi : Informatika
Semester : 2021/2022 Ganjil
Jadwal Perkuliahan : Senin, 08:00 - 09:40
Dosen : Imam Haromain, S.Si., M.Kom.
Sifat Ujian : Open Book
Jenis Ujian : Teori
Bobot :
*Untuk bobot nilai dapat di taruh diatas atau di taruh dimasing - masing soal.
___________________________________________________________________________

SOAL :
1. (10%) Apa yang dimaksud dengan Big Data dan sebutkan 5 Karakteristik Big Data (5V) ?
2. (10%) Jelaskan grafik pada karakteristik Big Data pada gambar berikut ?

3. (10%) Jelaskan apa yang dimaksud dengan Data Warehouse dan apa manfaat dari Data Warehouse
serta berikan contoh Data Warehouse ?
4. (10%) Data Warehouse adalah berorientasi pada subjek. Apa yang akan menjadi subjek utama
bisnis pada Perusahaan Perdagangan jika menggunakan teknologi Data Warehouse (buatlah
minimal 5 subjek utama pada perusahaan tsb), dan jelaskan mengapa subjek tersebut membutuhkan
teknologi Data Warehouse ?
5. (10%) Buatlah pemodelan Data Multidimensi pada Perusahaan Perdagangan, jelaskan pemodelan
yang anda buat ?
6. (10%) Mengapa penggunaan SQL pada Relational Database Management System tidak cukup
menangani Big Data ?
7. (20%) Jelaskan apa yang dimaksud dengan ?
• ETL
• Hadoop
• Map Reduce
• HDFS
Jelaskan pula masing-masing kegunaannya !
8. (20%) Jika anda sebagai pengambil keputusan di dalam sebuah Perusahaan Perdagangan ingin
menerapkan teknologi Big Data, jelaskan kebutuhan BIG DATA apa yang bisa atau akan ditangani ?
JAWAB :
1. Big Data adalah suatu bidang yang didedikasikan untuk analisis, pemrosesan, dan penyimpanan
koleksi besar data yang berasal dari sumber yang berbeda. Big Data biasanya diperlukan ketika analisis
data tradisional, teknik pemrosesan dan teknologi penyimpanan tidak mencukupi.
Berikut 5 Karakteristik Big Data (5V)
• Volume : Ukuran data sangat besar dari sisi jumlah yang mencapai Milyaran Terra Byte
(Trilyunan GB).
• Velocity : Kecepatan data sangat besar dari sisi kemunculan dan perubahan.
• Variety : Variasi jenis/tipe data sangat banyak, unstructured dan multi-structured/
• Veracity : Kebenaran dan keakuratan informasi yang tidak mudah dipastikan seperti berita
bohong atau HOAX.
• Value : Nilai yang dihasilkan juga sangat besar, dari sisi manfaat dalam bentuk uang maupun
non-uang.
2. Data yang memiliki nilai kebenaran yang tinggi serta dapat dianalisis dapat menghasilkan nilai
manfaat yang besar dalam bentuk uang maupun non-uang.
3. Data Warehouse merupakan sebuah system untuk pengumpulan dan konsolidasi data secara
periodik dari sebuah system sumber data menjadi sumber data yang bersifat dimensional atau dalam
bentuk normalisasi data. (Vincent Rainardi : 2008)
Terdapat beberapa manfaat dari Data Warehouse:
 Mempertahankan sejarah data, bahkan jika sistem transaksi sumber tidak beroperasi.
 Mengintegrasikan data dari beberapa sistem sumber , memungkinkan pandangan sentral di
seluruh perusahaan.
 Meningkatkan kualitas data, dengan menyediakan kode konsisten dan deskripsi, bahkan
memperbaiki data yang buruk
Contoh dari penggunaan Data Warehouse salahsatunya perusahaan e-commerce terbesar di
Indonesia yaitu Shopee, salahsatu perusahaan yang menerapkan Data Warehouse. Dalam sistem
yang digunakan, shopee akan merekam apa yang dilihat dan dicari oleh customer. Ketika customer
mencari salahsatu jenis barang, maka sistem akan mencari berbagai barang sejenis dan akan
ditampilkan dalam beranda customer. Hal ini memudahkan customer untuk mencari suatu barang
yang ia inginkan.
4. - Supplier
- Customer
- Produk
- Sales
- Barang
5. -
6. Karena bentuk dari Big Data sangat besar maka penggunaan SQL pada Relational Database
Management System tidak cukup menangani Big Data.
7. ETL : Extract Transform Load adalah proses integrasi data yang menggabungkan data dari
berbagai sumber ke dalam satu penyimpanan yang konsisten dan dimuat ke dalam
gudang data atau sistem lainnya.
Proses ETL pada pembangunan Data Warehouse berperan melakukan ekstraksi data
dari berbagai sumber, pengubahan data ke bentuk yang sesuai dengan kebutuhan dan
pengisian ke storage Data Warehouse.
Hadoop : Hadoop adalah Open-Source Framework untuk memproses himpunan data berskala
besar (Big Data) dalam beberapa cluster hardware komputer. Dikembangkan
menggunakan bahasa Java, beberapa menggunakan C dan utilitas command line
sebagai shell-scripts. Dan dikembangkan oleh Apache Software Foundation
(apache.org).
Map Reduce : Map Reduce adalah sebuah model pemrograman yang didesain untuk dapat
melakukan pemrosesan data dengan jumlah yang sangat besar dengan cara membagi
pemrosesan tersebut ke beberapa tugas yang independen satu sama lain. Beberapa
kegunaannya sebagai Pemecahan data masukan (Splitting), Mapping, Pengacakan
atau Shuffling, dan Reducing.
HDFS : HDFS adalah open source project yang dikembangkan oleh Apache Software
Foundation dan merupakan subproject dari Apache Hadoop. Apache mengembangkan
HDFS berdasarkan konsep dari Google File System (GFS) dan oleh karenanya sangat
mirip dengan GFS baik ditinjau dari konsep logika, struktur fisik, maupun cara
kerjanya.
8. Dengan penggunaan Big Data, dalam mengambil keputusan akan lebih mudah, karena Big data
memiliki 5 Karakteristik yang membuat data menjadi lebih akurat.

Anda mungkin juga menyukai