NIM : 2241727022
Kelas : TI 4J
Pada key-value, setiap key-nya unik, sedangkan value-nya bisa berupa JSON, BLOB
(Binary Large Objects), string, dan lain sebagainya. Contoh sebagai berikut.
Key Value
Nama Mohammad Durisa Enama Aprilian
NIM 2241727022
Prodi Teknik Informatika
Tingkat 4
Kelas J
b. Column-based
Ilustrasi model kerja dari column-based adalah sebagai berikut.
Strukturnya berbeda dengan tabel relasional ala SQL yang mempunyai baris dan kolom.
Dengan pendekatan ini, tak perlu tahu kolom-kolomnya terlebih dahulu seperti di SQL.
Jenis database document-oriented ini kebanyakan digunakan untuk CMS, platform
blogging, analisis real-time, dan aplikasi e-commerce. Contoh sebagai berikut.
Document 1 Document 2 Document 3
{ { {
“prop1”:data, “prop1”:data, “prop1”:data,
“prop2”:data, “prop2”:data, “prop2”:data,
“prop3”:data, “prop3”:data, “prop3”:data,
“prop4”:data, “prop4”:data, “prop4”:data,
} } }
d. Graph-based
Ilustrasi model kerja dari graph-based adalah sebagai berikut.
Graph-based ini sangat cocok dipakai jika Anda ingin menemukan pola yang saling
berhubungan dalam data. Maka dari itu, jenis database ini umumnya digunakan untuk
media sosial, mendeteksi penipuan, dan data spasial. Contoh sebagai berikut.
3. Jelaskan keterkaitan antara database NoSQL dengan big data berdasarkan analisis anda!
Database NoSQL memungkinkan eksekusi kueri dan penyimpanan data dengan berbagai
cara lain, tergantung pada perangkat lunak tertentu. Model data NoSQL memungkinkan
data terkait untuk disarangkan dalam satu struktur data. Dimana menangani volume data
yang sangat besar. Waktu respon sistem akan menjadi lambat jika Anda menggunakan
RDBMS untuk volume data yang sangat besar. Beberapa kemudahan juga mendukung
keterkaitan antara database NoSQL dengan big data yakni kemampuan menyimpan big data;
dapat menangani data terstruktur, semi-terstruktur, dan tidak terstruktur dengan efek yang
sama; menangani data besar yang memerlukan kecepatan, variasi, volume, dan
kompleksitas data.
4. Jelaskan mekanisme komputasi terdistribusi dan kaitannya dengan big data!
Komputasi terdistribusi adalah metode yang membuat beberapa komputer bekerja sama
untuk memecahkan masalah umum. Komputasi terdistribusi membuat jaringan komputer
muncul sebagai sebuah komputer tunggal yang tangguh dan menyediakan sumber daya
berskala besar untuk menghadapi tantangan yang kompleks. Misalnya, komputasi
terdistribusi dapat mengenkripsi volume data yang besar; memecahkan persamaan fisika
dan kimia dengan banyak variabel; serta membuat animasi video tiga dimensi berkualitas
tinggi. Sistem terdistribusi, pemrograman terdistribusi, dan algoritme terdistribusi adalah
beberapa istilah lain yang semuanya mengacu pada komputasi terdistribusi. Kaitannya
dengan big data adalah proses penyusunan dan pengelolaan big data dari beberapa
komputer yang bekerja sama.
5. Jelaskan tentang hadoop, HDFS, dan MapReduce!
a. Hadoop
Hadoop merupakan framework open source untuk big data yang memungkinkan untuk
melakukan komputasi terdistribusi. Saat ini Hadoop telah dikembangkan ke dalam 3
versi yaitu versi 1.x, 2.x dan 3.x. Perubahan Hadoop versi 1 ke versi 2 ada penambahan
untuk cluster resource management yang sangat membantu dan membuat Hadoop
menjadi ekosistem yang lebih besar. Ada 2 komponen utama dalam Hadoop yaitu
HDFS sebagai data storage dan MapReduce sebagai engine data processing.
b. Hadoop Distributed File System (HDFS)
HDFS adalah file sistem yang menyimpan data secara terdistribusi di Hadoop. HDFS
mempunyai 2 komponen utama yaitu Namenode dan Datanode. Konsep Namenode dan
Datanode adalah seperti Master dan Slave. Namenode sebagai master dan datanode
sebagai slave. Namenode bertanggung jawab untuk menyimpan semua metadata
sedangkan Datanode bertugas untuk menyimpan blok data.
c. Mapreduce
MapReduce adalah framework untuk melakukan pemrosesan data secara terdistribusi.
Terdiri dari fungsi Map dan Reduce. Map bertugas untuk mendistribusikan tugas
pemrosesan data antara komputer yang berbeda lalu mengurangi hasilnya dalam satu
ringkasan yang disebut dengan Reduce. Ada beberapa tahapan dalam MapReduce yaitu
splitting, mapping, shuffling dan reducing.