Anda di halaman 1dari 5

UJIAN TENGAH SEMESTER (UTS)

BIG DATA

DISUSUN OLEH :

ARDI GUNAWAN
311910242
TI.19.D4

TEKNIK INFORMATIKA
UNIVERSITAS PELITA BANGSA
Jl. Inspeksi Kalimalang No.9, Cibatu, Kec. Cikarang Pusat, Bekasi,
Jawa Barat 17530
Soal:

1. Jelaskan Pengertian dan keberadaan (ada atau tidak adanya) dari Big Data, dari sudut pandang
spesifikasi hardware:
a. Jika belum memenuhi kebutuhan Big Data tersebut.
b. Jika sudah memenuhi kebutuhan Big Data tersebut.
2. Sebutkan permasalahan apa saja yang sering muncul pada Big Data?
3. Jelaskan apa yang dimaksud dengan Volume, Velocity, Variety, dan Veracity dalam Big Data!
4. Jelaskan Perbedaan antara analisis dan analitik (analytics)!
5. Apa pendapat anda antara Big Data vs Big Information vs Big Knowledge, manakah diantara
ke-3 hal tersebut yang lebih utama?
6. Berikan deskripsi sekaligus contoh, terkait data terstruktur, semi terstruktur dan tidak
terstruktur!

Jawab :
1. Big data adalah istilah yang menggambarkan volume besar data – baik terstruktur maupun
tidak terstruktur – yang membanjiri bisnis sehari-hari. Namun bukan jumlah data yang
penting. Apa yang dilakukan organisasi dengan data itulah yang penting. Big data dapat
dianalisis demi pemahaman yang mengarah kepada keputusan dan gerakan bisnis strategis
yang lebih baik. Namun dapat dipastikan bahwa big data adalah data dengan volume yang
besar yang tidak akan efektif jika disimpan menggunakan basis data model lama yaitu
relational database management system (RDBMS). Dengan demikian dapat dipastikan ada
spesifikasi khusus bagi sebuah sistem untuk dapat menerapkan big data. Hal yang paling
utama ialah kemampuan untuk menangani data dalam jumlah besar yang dapat dicapai dengan
infrastruktur yang sudah menggunakan teknologi High Performance Computing Cluster
(HPCC) atau Hadoop (Map Reduced-Based)
a. HPCC Secara sederhana High Performance Computing Clusters ialah sebuah super
computer yang dibentuk oleh lebih dari satu komputer dengan spesifikasi tertentu, dan
biasanya memiliki spesifikasi yang sama. Hal ini melakun proses pada sebuah data,
bahkan untuk data dengan volume yang besar
b. Hadoop Ialah perangkat lunak yang berupa kerangka atau framework buatan Apache.
Dalam Hadoop akan dimungkinkan terjadinya proses pendistribusian data dalam skala
yang besar yang akan diatur pada kluster -kluster komputer. Hadoop dibuat untuk
merekayasa sebuah server seolah-olah berubah mejadi ribuan mesin. Disetiap mesin
akan melakukan proses komputasi dengan lokasi penyimpanannya masing-masing. Tiap
kluster yang melambangkan mesin tersebut akan bekerja secara mandiri, dan ketika
terjadi masalah atau error di salah satu kluster maka error hanya ada pada kluster
tersebut tanpa mengganggu proses yang berjalan pada kluster lain.

2. Permasalahan yang sering muncul pada Big Data :


a) Permasalahan kurangnya pemahaman dan wawasan big data
b) Kurangnya pengalaman dalam mengalami data yang berjumlah banyak dan kompleks
c) Bingung dalam memilih teknologi dan platform big data
d) Permasalahan budget karena investasi big data memerlukan biaya yang cukup besar
e) Permasalahan upscaling & pertumbuhan data / Upscaling & data growth issues
f) Mengalami permasalahan dalam mengambil dan mengintegrasi dari data sources
g) Sulitnya menjaga kualitas data / Difficulty in Managing & maintain data quality
h) Masalah keamanan data dan privasi data

3. Volume merupakan ruang dimana data-data dan seluruh madia itu disimpan.
Velocity (Kecepatan) mengacu pada kecepatan perpindahan data dan penyusunan data.
Variety menerangkan bahwa pada big dat terdapat banyak jenis file yang berbeda sehingga
harus disusun oleh database.
Varicity Menyangkut tentang ke-valid-an sebuah data apakah bisa dipercaya atau tidak.

4. Analysis adalah proses yang diperlukan untuk menjawab pertanyaan strategis utama dalam
perusahaan, sehingga keduanya penting bagi bisnis,sedangkan
Analytics adalah metode yang diperlukan untuk memprediksi perilaku pelanggan dengan lebih
baik.

5. Menurut Pendapat saya tentang Ketiga hal tersebut adalah :


a) Big data adalah pengumpulan dan penggunaan informasi dari berbagai sumber untuk
membuat keputusan yang lebih baik. Big data bisa dibilang sebagai sebuah konsep tentang
kemampuan kita untuk mengumpulkan, menganalisa, dan mengerti jumlah data yang
cukup besar yang datang setiap harinya.
b) Big Information merekam atau mengambil Data dan Knowledge pada suatu waktu tertentu.
Sedangkan Data dan Knowledge dapat terus berubah dan bertambah dari waktu ke waktu.
c) Big Knowledge adalah apa yang kita ketahui. Anda saat ini tidak dapat menyimpan
pengetahuan dalam diri anda dalam apapun selain otak, dan untuk membangun
pengetahuan perlu informasi dan data.
Serta menurut saya pribadi ketiganya penting, namun yang paling utama adalah Big
Knowledge, karena dengan big knowledge seseorang dapat lebih mengembangkan
pengetahuan mereka seputar big data dan big information dan ikut memajukan bidang tersebut.

6. Berikut deskripsinya
a) Data tidak terstruktur
Data tidak terstruktur biasanya ada pada teks, file, video, email, laporan (report), presentasi
power point, pesan suara (voice mail), memo, dan citra. Data dapat berbentuk dalam tipe
apapun tanpa perlu mengikuti format, aturan atau alur tertentu.
Sebagai contoh data yang ditampilkan pada halaman web termasuk data tidak testruktur
dan tidak beraturan.
b) Data Semiterstruktur
Data semiterstruktur adalah data yang memiliki struktur namun belum sepenuhnya
terstruktur. Tipe data ini berisi komponen tidak terstruktur yang tersusun pada data
terstruktur.
Data semiterstruktur diatur dalam bentuk entitas. Entitas yang sama dijadikan satu
kelompok , namun dapat berbeda atributnya. Contoh dari data semitruktur adalah daftar
riwayat hidup (CV).
c) Data Terstruktur
Data terstruktur mendefinisikan tipe data atribut, yang ada pada rekord maupun tuple.
Setiap rekord memiliki field yang sama. Data ada dalam entitas dan entitas yang sama
dikelompokkan menjadi satu menggunakan relasi atau kelas. Entitas dalam kelompok yang
sama memiliki atribut yang sama pula. Deskripsi untuk semua entitas dalam skema
memiliki kesamaan format.
Penggunaan data terstruktur semakin banyak dilakukan , sejak basisdata relasional ada
untuk mengatur data dengan ukuran sangat besar. Sistem yang ada saat ini, seperti contoh
CRM (Customer Relationship Management), ERP (Enterprise Resource Planning) dan
CMS (Content Managemnt System) merupakan data terstruktur untuk pemodelan data.

Anda mungkin juga menyukai