Big Data 7 Mohammad Durisa

Nama : Mohammad Durisa Enama Aprilian
NIM : 2241727022
Kelas : TI 4J
1. Terdapat 4 macam jenis database NoSQL (non relasional). Sebutkan masing-masing!

NoSQL dibagi menjadi dua kelompok besar, yakni (1) Key/value atau ‘the big hash table’,
dan (2) Schema-less yang terdiri dari (a) column-based, (b) document-oriented, (c) graph-
based.
a. Key-value
Jenis database ini menyimpan database dalam pasangan key/value berbentuk tabel hash
yang sederhana. Tipe ini paling pas dipakai jika ingin menyimpan banyak data tanpa
menggunakan query rumit saat hendak memprosesnya. Masing-masing key hadir dalam
key-value unik, sedangkan value-nya bisa berupa JSON, BLOB, string, dan sebagainya.
Redis, DynamoDB, dan Riak merupakan beberapa contoh database key-value yang
populer.
b. Column-based
Column-based (dikenal juga dengan wide-column) merupakan jenis database NoSQL
yang menyimpan data dalam bentuk kolom. Sehingga column-based sangat cocok
untuk query SUM, COUNT, AVG, MIN, dan semacamnya. Banyak perusahaan
menggunakan tipe NoSQL database ini karena menawarkan fleksibilitas kolom sebagai
kelebihan utama. HBase, Cassandra, dan Hypertable adalah beberapa database column-
based yang saat ini populer digunakan.
c. Document-oriented
Jenis database ini menggunakan data yang berisi sepasang key dan value yang disimpan
di dokumen dengan format JSON atau XML. Value yang dimaksud bisa berupa banyak
hal, seperti string, angka, boolean, arrays, hingga object. Penggunaan jenis database
document-oriented sangat fleksibel sehingga umum digunakan untuk CMS, platform
blogging, analisis real-time, dan aplikasi e-commerce. Amazon SimpleDB, CouchDB,
dan MongoDB merupakan beberapa contoh database document-oriented yang populer.
d. Graph-based
Graph-based adalah jenis database NoSQL yang berfokus untuk menyimpan hubungan
antar entitas. Entitas tersebut disimpan dalam bentuk node, sedangkan hubungan antar
entitasnya disebut sebagai edge. Tipe NoSQL database ini digunakan untuk mengetahui
pola yang saling berhubungan dalam data. Penggunaan database jenis graph-based
biasanya dipakai untuk media sosial, mendeteksi penipuan, dan data spasial. Contoh
beberapa database graph-based yang terkenal adalah Neo4J, JanusGraph, dan
InfiniteGraph.
2. Jelaskan cara kerja masing- masing jenis database NoSQL! Berikan contoh juga pada
masing-masing jenis databasenya!
a. Key-value
Ilustrasi model kerja dari key-value adalah sebagai berikut.
Pada key-value, setiap key-nya unik, sedangkan value-nya bisa berupa JSON, BLOB
(Binary Large Objects), string, dan lain sebagainya. Contoh sebagai berikut.
Key Value
Nama Mohammad Durisa Enama Aprilian
NIM 2241727022
Prodi Teknik Informatika
Tingkat 4
Kelas J
b. Column-based
Ilustrasi model kerja dari column-based adalah sebagai berikut.
Kelebihan utama NoSQL column-based adalah fleksibilitas kolomnya. Setiap kolom

tak terikat dengan kolom lainnya. Bebas mengubah kolom apapun tanpa mempengaruhi
yang lain. Contoh sebagai berikut.
Mahasiswa
Teknik Informatika TI 4J-23
Nama NIM Presensi
Mohammad Durisa Enama Aprilian 2241727022 23
TI 4J-24
Nama NIM Presensi
Muhammad Abdul Aziz 2241727023 24
c. Document-oriented
Ilustrasi model kerja dari document-oriented adalah sebagai berikut.
Strukturnya berbeda dengan tabel relasional ala SQL yang mempunyai baris dan kolom.
Dengan pendekatan ini, tak perlu tahu kolom-kolomnya terlebih dahulu seperti di SQL.
Jenis database document-oriented ini kebanyakan digunakan untuk CMS, platform
blogging, analisis real-time, dan aplikasi e-commerce. Contoh sebagai berikut.
Document 1 Document 2 Document 3
{ { {
“prop1”:data, “prop1”:data, “prop1”:data,
} } }
d. Graph-based
Ilustrasi model kerja dari graph-based adalah sebagai berikut.
Graph-based ini sangat cocok dipakai jika Anda ingin menemukan pola yang saling
berhubungan dalam data. Maka dari itu, jenis database ini umumnya digunakan untuk
media sosial, mendeteksi penipuan, dan data spasial. Contoh sebagai berikut.
3. Jelaskan keterkaitan antara database NoSQL dengan big data berdasarkan analisis anda!
Database NoSQL memungkinkan eksekusi kueri dan penyimpanan data dengan berbagai
cara lain, tergantung pada perangkat lunak tertentu. Model data NoSQL memungkinkan
data terkait untuk disarangkan dalam satu struktur data. Dimana menangani volume data
yang sangat besar. Waktu respon sistem akan menjadi lambat jika Anda menggunakan
RDBMS untuk volume data yang sangat besar. Beberapa kemudahan juga mendukung
keterkaitan antara database NoSQL dengan big data yakni kemampuan menyimpan big data;
dapat menangani data terstruktur, semi-terstruktur, dan tidak terstruktur dengan efek yang
sama; menangani data besar yang memerlukan kecepatan, variasi, volume, dan
kompleksitas data.
4. Jelaskan mekanisme komputasi terdistribusi dan kaitannya dengan big data!
Komputasi terdistribusi adalah metode yang membuat beberapa komputer bekerja sama
untuk memecahkan masalah umum. Komputasi terdistribusi membuat jaringan komputer
muncul sebagai sebuah komputer tunggal yang tangguh dan menyediakan sumber daya
berskala besar untuk menghadapi tantangan yang kompleks. Misalnya, komputasi
terdistribusi dapat mengenkripsi volume data yang besar; memecahkan persamaan fisika
dan kimia dengan banyak variabel; serta membuat animasi video tiga dimensi berkualitas
tinggi. Sistem terdistribusi, pemrograman terdistribusi, dan algoritme terdistribusi adalah
beberapa istilah lain yang semuanya mengacu pada komputasi terdistribusi. Kaitannya
dengan big data adalah proses penyusunan dan pengelolaan big data dari beberapa
komputer yang bekerja sama.
5. Jelaskan tentang hadoop, HDFS, dan MapReduce!
a. Hadoop
Hadoop merupakan framework open source untuk big data yang memungkinkan untuk
melakukan komputasi terdistribusi. Saat ini Hadoop telah dikembangkan ke dalam 3
versi yaitu versi 1.x, 2.x dan 3.x. Perubahan Hadoop versi 1 ke versi 2 ada penambahan
untuk cluster resource management yang sangat membantu dan membuat Hadoop
menjadi ekosistem yang lebih besar. Ada 2 komponen utama dalam Hadoop yaitu
HDFS sebagai data storage dan MapReduce sebagai engine data processing.
b. Hadoop Distributed File System (HDFS)
HDFS adalah file sistem yang menyimpan data secara terdistribusi di Hadoop. HDFS
mempunyai 2 komponen utama yaitu Namenode dan Datanode. Konsep Namenode dan
Datanode adalah seperti Master dan Slave. Namenode sebagai master dan datanode
sebagai slave. Namenode bertanggung jawab untuk menyimpan semua metadata
sedangkan Datanode bertugas untuk menyimpan blok data.
c. Mapreduce
MapReduce adalah framework untuk melakukan pemrosesan data secara terdistribusi.
Terdiri dari fungsi Map dan Reduce. Map bertugas untuk mendistribusikan tugas
pemrosesan data antara komputer yang berbeda lalu mengurangi hasilnya dalam satu
ringkasan yang disebut dengan Reduce. Ada beberapa tahapan dalam MapReduce yaitu
splitting, mapping, shuffling dan reducing.

Big Data 7 Mohammad Durisa

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Big Data 7 Mohammad Durisa

Diunggah oleh

Hak Cipta:

Format Tersedia

Nama : Mohammad Durisa Enama Aprilian

1. Terdapat 4 macam jenis database NoSQL (non relasional). Sebutkan masing-masing!

Kelebihan utama NoSQL column-based adalah fleksibilitas kolomnya. Setiap kolom

Anda mungkin juga menyukai