OLEH:
Tak lupa, kami juga mengucapkan terima kasih yang sebesar-besarnya kepada dosen
mata kuliah Teknologi Big Data.
Penulis
DAFTAR ISI
KATA PENGANTAR...............................................................................................................2
DAFTAR ISI.............................................................................................................................3
1. Apache HBase....................................................................................................................4
2. Perbedaan antara Apache HBase dan DBMS.....................................................................5
3. Struktur Data Pada HBase..................................................................................................6
4. Arsitektur HBase................................................................................................................7
5. Kompabilitas HBase dan MapReduce................................................................................8
DAFTAR PUSTAKA..............................................................................................................10
1. Apache HBase
Apache HBase adalah sistem basis data terdistribusi dan sumber terbuka yang dirancang
untuk menyediakan akses acak waktu nyata terhadap jumlah data yang besar. HBase
dibangun di atas ekosistem Apache Hadoop dan berfungsi sebagai penyimpanan data
terdistribusi yang terhubung dengan Hadoop Distributed File System (HDFS).
HBase didasarkan pada desain Google Bigtable, yang merupakan sistem penyimpanan
terdistribusi. Ini menawarkan skalabilitas, toleransi kesalahan, dan kinerja tinggi. Berikut
adalah penjelasan tentang beberapa fitur kunci Apache HBase:
HBase sering digunakan dalam aplikasi yang membutuhkan akses baca/tulis berlatensi rendah
terhadap kumpulan data besar, seperti analitik waktu nyata, data seri waktu, aplikasi media
sosial, dan penyimpanan serta pemrosesan data Internet of Things (IoT).
2. Perbedaan antara Apache HBase dan DBMS
Berikut adalah beberapa perbedaan antara Apache HBase dan sistem manajemen basis data
(DBMS) tradisional:
a. Skema Basis Data: Pada DBMS tradisional, data disimpan dalam format tabular
dengan skema yang telah ditentukan sebelumnya. Setiap kolom dalam tabel memiliki
tipe data yang ditentukan dan jumlah kolom harus konsisten untuk setiap baris. Di sisi
lain, HBase adalah basis data berbasis kolom di mana skema kolom dapat berbeda
untuk setiap baris. Hal ini memungkinkan fleksibilitas dalam menambahkan kolom
baru tanpa mempengaruhi baris yang ada.
b. Model Data: DBMS tradisional mengadopsi model relasional dan menggunakan SQL
(Structured Query Language) untuk mengelola dan mengakses data. HBase
menggunakan model data yang berbeda, yang dikenal sebagai model data "wide-
column" atau "column-family". Data disimpan dalam keluarga kolom dan akses ke
data dilakukan melalui kunci baris.
c. Skalabilitas: DBMS tradisional cenderung memiliki batasan pada skala horizontal, di
mana ukuran data dan beban kerja yang tinggi dapat menghadirkan tantangan. HBase,
di sisi lain, dirancang untuk skala horizontal secara efisien. Ini dapat beroperasi pada
klaster mesin yang besar dan dapat mengelola jumlah data yang sangat besar.
d. Kecepatan Akses: HBase menyediakan akses acak waktu nyata dengan latensi rendah.
Ini cocok untuk aplikasi yang membutuhkan pembacaan dan penulisan data secara
cepat, seperti analitik waktu nyata atau aplikasi yang membutuhkan kueri acak pada
subset data tertentu. DBMS tradisional mungkin memiliki performa yang lebih baik
untuk operasi yang melibatkan kueri kompleks atau analisis yang melibatkan banyak
tabel dan relasi antar data.
e. Fitur Durabilitas: DBMS tradisional biasanya menjamin kekonsistenan data dengan
menggunakan transaksi ACID (Atomicity, Consistency, Isolation, Durability). HBase
lebih fokus pada skalabilitas dan performa dengan menyediakan garansi konsistensi
yang kuat dalam satu baris, tetapi tidak mendukung transaksi ACID yang melibatkan
beberapa baris.
f. Penggunaan: DBMS tradisional sering digunakan untuk aplikasi bisnis yang
memerlukan konsistensi tinggi dan pemodelan data yang terstruktur dengan baik.
HBase umumnya digunakan dalam kasus penggunaan di mana skala data yang besar,
akses acak yang cepat, dan fleksibilitas skema diperlukan, seperti analitik waktu
nyata, pengolahan log, atau penyimpanan data IoT.
a. Tabel (Table): Tabel dalam HBase berfungsi sebagai wadah untuk menyimpan data.
Tabel ini dikelompokkan ke dalam namespace yang unik. Setiap tabel terdiri dari satu
atau beberapa keluarga kolom.
b. Baris (Row): Baris dalam HBase adalah unit terkecil data yang dapat diakses. Setiap
baris diidentifikasi secara unik oleh kunci baris (row key). Kunci baris ini digunakan
untuk mengakses dan memanipulasi data dalam tabel. Baris dalam HBase tidak
memiliki batasan pada jumlah kolom atau tipe data.
c. Keluarga Kolom (Column Family): Keluarga kolom dalam HBase adalah grup kolom
yang berkaitan erat satu sama lain. Setiap keluarga kolom memiliki nama yang unik
dan dapat mengandung banyak kolom. Semua kolom dalam keluarga kolom
menggunakan prefiks nama keluarga kolom dan diberi label dengan qualifier kolom
yang berbeda. Keluarga kolom dapat didefinisikan saat pembuatan tabel dan
skemanya tetap tidak berubah sepanjang waktu.
d. Kolom (Column): Kolom dalam HBase terdiri dari nama keluarga kolom dan qualifier
kolom. Nama keluarga kolom digunakan untuk mengelompokkan kolom yang serupa,
sementara qualifier kolom memberikan identitas unik pada kolom tersebut di dalam
keluarga kolom. HBase menyimpan data dalam bentuk pasangan (column, value), di
mana "value" adalah data aktual yang disimpan dalam kolom.
e. Sel (Cell): Sel dalam HBase adalah unit terkecil penyimpanan data di dalam tabel.
Setiap sel mencakup kombinasi kunci baris, nama keluarga kolom, qualifier kolom,
dan timestamp. Timestamp digunakan untuk melacak waktu terjadinya operasi
tertentu pada data dalam sel.
f. Versi (Versioning): HBase mendukung versiing data, yang berarti setiap sel dapat
menyimpan beberapa versi data berdasarkan timestamp. Dengan ini, HBase
memungkinkan akses ke versi sebelumnya dari data yang telah diperbarui atau
dihapus.
Struktur data yang fleksibel dan skemanya yang dinamis dalam HBase memungkinkan
pengguna untuk menambahkan kolom baru ke dalam keluarga kolom tanpa mempengaruhi
baris yang ada. Hal ini memberikan fleksibilitas dalam mengelola dan mengakses data yang
berubah seiring waktu.
Perlu dicatat bahwa struktur data dalam HBase dapat bervariasi tergantung pada desain tabel
dan kebutuhan aplikasi yang digunakan.
4. Arsitektur HBase
Arsitektur Apache HBase melibatkan beberapa komponen yang bekerja bersama-sama untuk
menyediakan penyimpanan dan akses data terdistribusi. Berikut adalah komponen utama
dalam arsitektur HBase:
Dengan demikian, HBase dan MapReduce adalah dua komponen yang dapat bekerja bersama
untuk memproses data dalam skala besar. HBase menyediakan penyimpanan data
terdistribusi dengan akses acak yang cepat, sementara MapReduce memberikan kerangka
kerja pemrosesan dan analisis data yang dapat diskalakan secara horizontal.
DAFTAR PUSTAKA
https://learn.microsoft.com/id-id/azure/hdinsight/hbase/apache-hbase-
overview#:~:text=Apache%20HBase%20adalah%20database%20NoSQL,data%20dalam
%20database%20tanpa%20skema.
https://askanydifference.com/id/difference-between-rdbms-and-hbase/
https://www.teknologi-bigdata.com/2013/03/hbase-hyper-nosql-database.html
https://translate.google.com/translate?u=https://www.projectpro.io/article/overview-of-hbase-
architecture-and-its-components/295&hl=id&sl=en&tl=id&client=srp&prev=search
https://translate.google.com/translate?u=https://stackoverflow.com/questions/27798014/
latest-compatible-version-of-hadoop-and-
hbase&hl=id&sl=en&tl=id&client=srp&prev=search