Anda di halaman 1dari 4

Robi Setia Permadi Kamis, 30 Juli 2020

29 Tugas 1 SaaS
XII SIJA A Pengantar Big Data Antoni Budiman, S. Pd.
Maya Yashbir, ST.

1. Jelaskan Pengertian dan keberadaan (ada atau tidak adanya) dari Big Data, dari sudut
pandang spesifikasi hardware:
a. Jika belum memenuhi kebutuhan Big Data tersebut.
b. Jika sudah memenuhi kebutuhan Big Data tersebut.
2. Sebutkan permasalahan apa saja yang sering muncul pada Big Data?
3. Jelaskan apa yang dimaksud dengan Volume, Velocity, Variety, dan Veracity dalam Big
Data!
4. Apa pendapat anda antara Big Data vs Big Information vs Big Knowledge, manakah
diantara ke-3 hal tersebut yang lebih utama?

JAWABAN

1. Big data jika diartikan memang adalah data dalam jumlah yang besar, namun
belum ada pendefinisian khusus tentang seberapa besar data tersebut hingga bisa disebut
dengan big data. Namun dapat dipastikan bahwa big data adalah data dengan
volume yang besar yang tidak akan efektif jika disimpan menggunakan basis data
model lama yaitu relational database management system (RDBMS). Dengan
demikian dapat dipastikan ada spesifikasi khusus bagi sebuah sistem untuk dapat
menerapkan big data. Hal yang paling utama ialah kemampuan untuk menangani
data dalam jumlah besar yang dapat dicapai dengan infrastruktur yang sudah
menggunakan teknologi High Performance Computing Cluster (HPCC) atau Hadoop
(Map Reduced-Based)
a. HPCC Secara sederhana High Performance Computing Clusters ialah sebuah
super computer yang dibentuk oleh lebih dari satu komputer dengan
spesifikasi tertentu, dan biasanya memiliki spesifikasi yang sama. Hal ini
dilakukan untuk saling menolong dan berbagi pekerjaan hingga dapat
melakun proses pada sebuah data, bahkan untuk data dengan volume yang
besar
b. Hadoop Ialah perangkat lunak yang berupa kerangka atau framework buatan
Apache. Dalam Hadoop akan dimungkinkan terjadinya proses pendistribusian
data dalam skala yang besar yang akan diatur pada kluster -kluster
komputer. Hadoop dibuat untuk merekayasa sebuah server seolah-olah berubah
mejadi ribuan mesin. Disetiap mesin akan melakukan proses komputasi dengan
lokasi penyimpanannya masing -masing. Tiap kluster yang melambangkan mesin
tersebut akan bekerja secara mandiri, dan ketika terjadi masalah atau error di
salah satu kluster maka error hanya ada pada kluster tersebut tanpa
mengganggu proses yang berjalan pada kluster lain.

2. Berikut 7 tantangan teratas analisis big data yang dihadapi perusahaan:


a. Perlu sinkronisasi sumber data yang berbeda. Ketika rangkaian data menjadi
lebih besar dan beragam, ada tantangan besar untuk menggabungkannya ke dalam
platform Jika ini diabaikan akan menciptakan celah dan mengarah pada pesan dan
insight yang salah.
b. Kekurangan tenaga profesional yang memahami analisis big data. Dengan
meningkatnya data eksponensial, permintaan untuk ilmuwan dan analis big data
semakin besar. Penting bagi perusahaan untuk mempekerjakan seorang ilmuwan
data yang memiliki keterampilan yang beragam karena pekerjaan seorang
ilmuwan data bersifat multidisiplin.
c. Mendapatkan insight penting melalui analisis big data. Sangat penting bagi
perusahaan bahwa hanya departemen terkait yang memiliki akses ke informasi
ini. Data yang real-time dapat membantu peneliti dan perusahaan untuk
menyediakan insight yang terkini untuk pengambilan keputusan.
d. Mendapatkan data bervolume menjadi platform big data. Perusahaan perlu
menangani sejumlah besar data setiap hari. Jumlah dan variasi data yang tersedia
saat ini dapat membanjiri data engineer dan sangat penting untuk membuat
aksesibilitas data mudah dan nyaman bagi pemilik dan pengelola perusahaan.
e. Ketidakpastian data management landscape. Dengan munculnya big data,
teknologi dan perusahaan baru, tantangan besar yang dihadapi oleh perusahaan
dalam analisis big data adalah untuk mengetahui teknologi mana yang paling
cocok untuk mereka tanpa adanya masalah baru dan potensi resiko.
f. Penyimpanan dan kualitas data. Opsi penyimpanan data yang populer seperti
data lakes/ warehouses umumnya digunakan untuk mengumpulkan dan
menyimpan data tak terstruktur dan terstruktur dalam jumlah besar dalam format
aslinya. Data yang hilang, data yang tidak konsisten, konflik logika, dan data
duplikat semuanya menghasilkan tantangan kualitas data.
g. Keamanan dan privasi data. Big data juga melibatkan potensi risiko yang
menyangkut privasi dan keamanan data. Alat-alat big data digunakan untuk
analisis dan penyimpanan menggunakan sumber data yang berbeda. Ini akhirnya
mengarah pada risiko tinggi exposure data dan membuatnya rentan. Peningkatan
jumlah data juga meningkatkan privasi dan masalah keamanan.

3. Volume merupakan ruang dimana data-data dan seluruh madia itu disimpan. Velocity
(Kecepatan) mengacu pada kecepatan perpindahan data dan penyusunan data. Variety
menerangkan bahwa pada big dat terdapat banyak jenis file yang berbeda sehingga harus
disusun oleh database. Varicity Menyangkut tentang ke-valid-an sebuah data apakah bisa
dipercaya atau tidak.

4. Pendapat saya tentang Ketiga hal itu adalah :


 Big data adalah pengumpulan dan penggunaan informasi dari berbagai sumber untuk
membuat keputusan yang lebih baik. Big data bisa dibilang sebagai sebuah konsep
tentang kemampuan kita untuk mengumpulkan, menganalisa, dan mengerti jumlah
data yang cukup besar yang datang setiap harinya.
 Big Information merekam atau mengambil Data dan Knowledge pada suatu waktu
tertentu. Sedangkan Data dan Knowledge dapat terus berubah dan bertambah dari
waktu ke waktu.
 Big Knowledge adalah apa yang kita ketahui. Anda saat ini tidak dapat menyimpan
pengetahuan dalam diri anda dalam apapun selain otak, dan untuk membangun
pengetahuan perlu informasi dan data.

Anda mungkin juga menyukai