Anda di halaman 1dari 2

Nama : Mardian Sundaynur

Kelas : TE-4A

NIM : 4.31.15.0.15

Tugas Jobsheet 1 : Konsep Big Data

1. Buatlah ringkasan mengenai sejarah, pengertian dan komponen pada Big Data !
Secara ringkas sejarah Big Data adalah :
 1960-an, data disimpan dalam flat file yang tidak ada struktur spesifiknya.
Ketika perusahaan perlu pemahaman terperinci tentang pelanggan, mereka
harus menerapkan metode brute-force, membuat model pemrograman yang
sangat rinci untuk menganalisa nilai dari file-file tersebut.
 1970-an, banyak hal berubah dengan penemuan relational data model dan
relational database management system (RDBMS) yang memberlakukan
struktur dan metode untuk meningkatkan kinerja.
 1980-an Enterprise Content Management System berevolusi dengan
memberikan bisnis kemampuan untuk mengelola data tidak terstruktur
(dokumen-dokumen) dengan lebih baik.
 1990-an dengan munculnya web, selain dokumen, organisasi ingin
menyimpan serta mengelola konten web, gambar, audio, dan video.
Big Data adalah kemampuan untuk mengelola beragam data dengan volume besar,
pada kecepatan yang tepat, dan dalam kerangka waktu yang tepat untuk
memungkinkan analisis dan reaksi real-time. Komponen Big Data diantaranya :
Volume, Velocity dan Variety.

2. Jelaskan apa yang dimaksud dengan Volume, Velocity, Variety pada Big Data !
 Volume suatu instansi atau organisasi mengumpulkan data dari berbagai
sumber, termasuk transaksi bisnis, media sosial dan informasi dari sensor atau
mesin. Contohnya di tahun 2018 permenit 4.3 juta orang menonton video di
Youtube, 3.7 juta pencarian di Google dan 38 juta pesan dikirimkan via
Whatsapp.
 Velocity mengacu pada kecepatan di mana data dihasilkan, diproduksi, dibuat,
atau diperbarui tentunya aliran data harus ditangani dengan cepat dan tepat.
Contohnya Facebook mengklaim 600 terabyte data yang masuk per hari.
Google sendiri memproses rata-rata lebih dari "40.000 permintaan pencarian
setiap detik," yang secara kasar diterjemahkan menjadi lebih dari 3,5 miliar
pencarian per hari.
 Variety data yang dikumpulkan mempunyai format yang berbeda-beda. Mulai
dari yang terstruktur, data numerik dalam database tradisional, data dokumen
terstruktur teks, email, video, audio, transaksi keuangan dan lain-lain.

3. Berikan deskripsi sekaligus contoh, terkait data terstruktur, semi terstruktur dan tidak
terstruktur!
Data Terstruktur adalah data yang dapat disimpan, diakses dan diproses dalam bentuk
format tetap, contohnya data yang tersimpan pada RDBMS ( Relational Database
Management System )
Data Semi Terstruktur adalah data yang memiliki struktur namun belum sepenuhnya
terstruktur, tipe data ini berisi komponen tidak terstruktur yang tersusun pada data
terstruktur. Contohnya data semi terstruktur adalah Curriculum Vitae dan data pada
file XML.
Data Tidak Terstruktur adalah adalah data dengan bentuk yang tidak diketahui, data
dapat berbentuk dalam tipe apapun tanpa perlu mengikuti format, aturan atau alur
tertentu contohnya data yang ditampilkan pada halaman web berupa teks, file, video
dan gambar.

4. Buatlah ringkasan singkat komponen-komponen yang membedakan 3 produk


distribusi big data: Cloudera, Hortonworks dan MapR!
 Cloudera bisa dikatakan pioneer di bidang Hadoop Distributions. Cloudera
tidak hanya memakai software open source yang ada tetapi menambahkan
software khusus milik mereka yang disebut Impala. Impala adalah Query
Engine diatas HDFS. Atau dengan kata lain seperti Map Reduce yang bisa
dijalankan dengan low-latency atau dengan waktu yang lebih pendek
dibanding Map Reduce lainnya.
 Hortonworks seperti cloudera memberikan versi sandbox dimana pengguna
bisa mendownload dan mencoba dulu versi gratis mereka di PC atau laptop
(single node) sebelum mencoba yang versi enterprise.
 MapR didukung oleh banyak perusahaan besar. Tiga perusahaan yang
mengadopsi MapR antara lain EMC, Google dan Amazon. mapR juga
menyediakan versi sandbox untuk user coba-coba dulu. MapR seperti
Hortonworks, memberikan versi gratis bahkan untuk versi enterprisenya dan
mendapat revenue dari support dan training. Dengan digunakannya MapR oleh
dua perusahaan cloud computing yang besar Amazon dan Google, maka
MapR banyak digunakan oleh pengguna cloud computing.

5. Install file .iso CentOS 7.x pada VirtualBox yang telah Anda download!

Anda mungkin juga menyukai