29 Tugas 1 SaaS
XII SIJA A Pengantar Big Data Antoni Budiman, S. Pd.
Maya Yashbir, ST.
1. Jelaskan Pengertian dan keberadaan (ada atau tidak adanya) dari Big Data, dari sudut
pandang spesifikasi hardware:
a. Jika belum memenuhi kebutuhan Big Data tersebut.
b. Jika sudah memenuhi kebutuhan Big Data tersebut.
2. Sebutkan permasalahan apa saja yang sering muncul pada Big Data?
3. Jelaskan apa yang dimaksud dengan Volume, Velocity, Variety, dan Veracity dalam Big
Data!
4. Apa pendapat anda antara Big Data vs Big Information vs Big Knowledge, manakah
diantara ke-3 hal tersebut yang lebih utama?
JAWABAN
1. Big data jika diartikan memang adalah data dalam jumlah yang besar, namun
belum ada pendefinisian khusus tentang seberapa besar data tersebut hingga bisa disebut
dengan big data. Namun dapat dipastikan bahwa big data adalah data dengan
volume yang besar yang tidak akan efektif jika disimpan menggunakan basis data
model lama yaitu relational database management system (RDBMS). Dengan
demikian dapat dipastikan ada spesifikasi khusus bagi sebuah sistem untuk dapat
menerapkan big data. Hal yang paling utama ialah kemampuan untuk menangani
data dalam jumlah besar yang dapat dicapai dengan infrastruktur yang sudah
menggunakan teknologi High Performance Computing Cluster (HPCC) atau Hadoop
(Map Reduced-Based)
a. HPCC Secara sederhana High Performance Computing Clusters ialah sebuah
super computer yang dibentuk oleh lebih dari satu komputer dengan
spesifikasi tertentu, dan biasanya memiliki spesifikasi yang sama. Hal ini
dilakukan untuk saling menolong dan berbagi pekerjaan hingga dapat
melakun proses pada sebuah data, bahkan untuk data dengan volume yang
besar
b. Hadoop Ialah perangkat lunak yang berupa kerangka atau framework buatan
Apache. Dalam Hadoop akan dimungkinkan terjadinya proses pendistribusian
data dalam skala yang besar yang akan diatur pada kluster -kluster
komputer. Hadoop dibuat untuk merekayasa sebuah server seolah-olah berubah
mejadi ribuan mesin. Disetiap mesin akan melakukan proses komputasi dengan
lokasi penyimpanannya masing -masing. Tiap kluster yang melambangkan mesin
tersebut akan bekerja secara mandiri, dan ketika terjadi masalah atau error di
salah satu kluster maka error hanya ada pada kluster tersebut tanpa
mengganggu proses yang berjalan pada kluster lain.
3. Volume merupakan ruang dimana data-data dan seluruh madia itu disimpan. Velocity
(Kecepatan) mengacu pada kecepatan perpindahan data dan penyusunan data. Variety
menerangkan bahwa pada big dat terdapat banyak jenis file yang berbeda sehingga harus
disusun oleh database. Varicity Menyangkut tentang ke-valid-an sebuah data apakah bisa
dipercaya atau tidak.