Anda di halaman 1dari 10

TEKNOLOGI BIG DATA

OLEH:

202040 DIAR FITRIANI


6TTBT-D

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS DIPA MAKASSAR TAHUN AJARAN
2022/2023
KATA PENGANTAR
Segala puji dan syukur kami panjatkan kepada Tuhan yang Maha Esa karena rahmat
dan hidayah-Nya sehingga kami mampu menyelesaikan tugas makalah ini dengan tepat
waktu.

Tak lupa, kami juga mengucapkan terima kasih yang sebesar-besarnya kepada dosen
mata kuliah Teknologi Big Data.

Penyusunan makalah dengan judul ‘Layanan Web Service’. Bertujuan untuk


mengajak pembaca mempelajari lebih lanjut tentang web service. Dengan memahami
teknologi ini, pembaca akan dapat memanfaatkannya untuk memperbaiki kinerja bisnis dan
meningkatkan pengalaman pengguna. Saya juga ingin mengingatkan pembaca bahwa seperti
halnya teknologi lainnya, web service memiliki kelemahan dan risiko tertentu yang perlu
dipertimbangkan sebelum mengimplementasikannya. Oleh karena itu, penting bagi kita untuk
belajar dan memahami lebih lanjut tentang web service dan bagaimana menggunakannya
dengan bijak.

Makassar, 11 April 2023

Penulis
DAFTAR ISI

KATA PENGANTAR...............................................................................................................2
DAFTAR ISI.............................................................................................................................3
1. Apache HBase....................................................................................................................4
2. Perbedaan antara Apache HBase dan DBMS.....................................................................5
3. Struktur Data Pada HBase..................................................................................................6
4. Arsitektur HBase................................................................................................................7
5. Kompabilitas HBase dan MapReduce................................................................................8
DAFTAR PUSTAKA..............................................................................................................10
1. Apache HBase
Apache HBase adalah sistem basis data terdistribusi dan sumber terbuka yang dirancang
untuk menyediakan akses acak waktu nyata terhadap jumlah data yang besar. HBase
dibangun di atas ekosistem Apache Hadoop dan berfungsi sebagai penyimpanan data
terdistribusi yang terhubung dengan Hadoop Distributed File System (HDFS).

HBase didasarkan pada desain Google Bigtable, yang merupakan sistem penyimpanan
terdistribusi. Ini menawarkan skalabilitas, toleransi kesalahan, dan kinerja tinggi. Berikut
adalah penjelasan tentang beberapa fitur kunci Apache HBase:

a. Terdistribusi dan Skalabel: HBase dapat diimplementasikan pada klaster mesin,


sehingga dapat melebar secara horizontal seiring dengan pertambahan ukuran data
dan beban kerja. HBase dapat menangani miliaran baris dan jutaan kolom.
b. Berbasis Kolom: Berbeda dengan basis data relasional tradisional yang menyimpan
data dalam baris, HBase mengorganisir data dalam kolom, yang membuatnya lebih
efisien untuk jenis beban kerja tertentu, terutama yang melibatkan operasi baca/tulis
intensif pada subset kolom.
c. Tingkat Tulis yang Tinggi: HBase dioptimalkan untuk beban kerja tulis yang tinggi. Ia
menyediakan penulisan acak dengan laten waktu rendah, sehingga memungkinkan
proses pengisian data yang cepat.
d. Toleransi Kesalahan: HBase dirancang untuk toleransi kesalahan dengan cara
menduplikasi data di beberapa node. Jika satu node mengalami kegagalan, data masih
dapat diakses dari replika yang lain.
e. Konsistensi: HBase mendukung jaminan konsistensi kuat dalam satu baris data,
sehingga memastikan bahwa semua operasi baca dan tulis pada suatu baris bersifat
atomik.
f. Integrasi dengan Ekosistem Hadoop: HBase terintegrasi dengan komponen lain dalam
ekosistem Hadoop, seperti HDFS, Apache Hive, Apache Spark, dan Apache Pig,
sehingga memungkinkan analitik dan pemrosesan data yang kompleks.

HBase sering digunakan dalam aplikasi yang membutuhkan akses baca/tulis berlatensi rendah
terhadap kumpulan data besar, seperti analitik waktu nyata, data seri waktu, aplikasi media
sosial, dan penyimpanan serta pemrosesan data Internet of Things (IoT).
2. Perbedaan antara Apache HBase dan DBMS
Berikut adalah beberapa perbedaan antara Apache HBase dan sistem manajemen basis data
(DBMS) tradisional:

a. Skema Basis Data: Pada DBMS tradisional, data disimpan dalam format tabular
dengan skema yang telah ditentukan sebelumnya. Setiap kolom dalam tabel memiliki
tipe data yang ditentukan dan jumlah kolom harus konsisten untuk setiap baris. Di sisi
lain, HBase adalah basis data berbasis kolom di mana skema kolom dapat berbeda
untuk setiap baris. Hal ini memungkinkan fleksibilitas dalam menambahkan kolom
baru tanpa mempengaruhi baris yang ada.
b. Model Data: DBMS tradisional mengadopsi model relasional dan menggunakan SQL
(Structured Query Language) untuk mengelola dan mengakses data. HBase
menggunakan model data yang berbeda, yang dikenal sebagai model data "wide-
column" atau "column-family". Data disimpan dalam keluarga kolom dan akses ke
data dilakukan melalui kunci baris.
c. Skalabilitas: DBMS tradisional cenderung memiliki batasan pada skala horizontal, di
mana ukuran data dan beban kerja yang tinggi dapat menghadirkan tantangan. HBase,
di sisi lain, dirancang untuk skala horizontal secara efisien. Ini dapat beroperasi pada
klaster mesin yang besar dan dapat mengelola jumlah data yang sangat besar.
d. Kecepatan Akses: HBase menyediakan akses acak waktu nyata dengan latensi rendah.
Ini cocok untuk aplikasi yang membutuhkan pembacaan dan penulisan data secara
cepat, seperti analitik waktu nyata atau aplikasi yang membutuhkan kueri acak pada
subset data tertentu. DBMS tradisional mungkin memiliki performa yang lebih baik
untuk operasi yang melibatkan kueri kompleks atau analisis yang melibatkan banyak
tabel dan relasi antar data.
e. Fitur Durabilitas: DBMS tradisional biasanya menjamin kekonsistenan data dengan
menggunakan transaksi ACID (Atomicity, Consistency, Isolation, Durability). HBase
lebih fokus pada skalabilitas dan performa dengan menyediakan garansi konsistensi
yang kuat dalam satu baris, tetapi tidak mendukung transaksi ACID yang melibatkan
beberapa baris.
f. Penggunaan: DBMS tradisional sering digunakan untuk aplikasi bisnis yang
memerlukan konsistensi tinggi dan pemodelan data yang terstruktur dengan baik.
HBase umumnya digunakan dalam kasus penggunaan di mana skala data yang besar,
akses acak yang cepat, dan fleksibilitas skema diperlukan, seperti analitik waktu
nyata, pengolahan log, atau penyimpanan data IoT.

Perbedaan-perbedaan ini menjelaskan mengapa HBase dan DBMS tradisional memiliki


keunggulan dan kelemahan masing-masing, dan pemilihan antara keduanya tergantung pada
kebutuhan dan karakteristik aplikasi yang akan digunakan.

3. Struktur Data Pada HBase


Struktur data dalam Apache HBase didasarkan pada model data "wide-column" atau
"column-family". Dalam HBase, data disimpan dalam tabel yang terdiri dari baris dan
keluarga kolom. Berikut adalah komponen utama dari struktur data HBase:

a. Tabel (Table): Tabel dalam HBase berfungsi sebagai wadah untuk menyimpan data.
Tabel ini dikelompokkan ke dalam namespace yang unik. Setiap tabel terdiri dari satu
atau beberapa keluarga kolom.
b. Baris (Row): Baris dalam HBase adalah unit terkecil data yang dapat diakses. Setiap
baris diidentifikasi secara unik oleh kunci baris (row key). Kunci baris ini digunakan
untuk mengakses dan memanipulasi data dalam tabel. Baris dalam HBase tidak
memiliki batasan pada jumlah kolom atau tipe data.
c. Keluarga Kolom (Column Family): Keluarga kolom dalam HBase adalah grup kolom
yang berkaitan erat satu sama lain. Setiap keluarga kolom memiliki nama yang unik
dan dapat mengandung banyak kolom. Semua kolom dalam keluarga kolom
menggunakan prefiks nama keluarga kolom dan diberi label dengan qualifier kolom
yang berbeda. Keluarga kolom dapat didefinisikan saat pembuatan tabel dan
skemanya tetap tidak berubah sepanjang waktu.
d. Kolom (Column): Kolom dalam HBase terdiri dari nama keluarga kolom dan qualifier
kolom. Nama keluarga kolom digunakan untuk mengelompokkan kolom yang serupa,
sementara qualifier kolom memberikan identitas unik pada kolom tersebut di dalam
keluarga kolom. HBase menyimpan data dalam bentuk pasangan (column, value), di
mana "value" adalah data aktual yang disimpan dalam kolom.
e. Sel (Cell): Sel dalam HBase adalah unit terkecil penyimpanan data di dalam tabel.
Setiap sel mencakup kombinasi kunci baris, nama keluarga kolom, qualifier kolom,
dan timestamp. Timestamp digunakan untuk melacak waktu terjadinya operasi
tertentu pada data dalam sel.
f. Versi (Versioning): HBase mendukung versiing data, yang berarti setiap sel dapat
menyimpan beberapa versi data berdasarkan timestamp. Dengan ini, HBase
memungkinkan akses ke versi sebelumnya dari data yang telah diperbarui atau
dihapus.

Struktur data yang fleksibel dan skemanya yang dinamis dalam HBase memungkinkan
pengguna untuk menambahkan kolom baru ke dalam keluarga kolom tanpa mempengaruhi
baris yang ada. Hal ini memberikan fleksibilitas dalam mengelola dan mengakses data yang
berubah seiring waktu.

Perlu dicatat bahwa struktur data dalam HBase dapat bervariasi tergantung pada desain tabel
dan kebutuhan aplikasi yang digunakan.

4. Arsitektur HBase
Arsitektur Apache HBase melibatkan beberapa komponen yang bekerja bersama-sama untuk
menyediakan penyimpanan dan akses data terdistribusi. Berikut adalah komponen utama
dalam arsitektur HBase:

a. RegionServer: RegionServer adalah komponen utama dalam arsitektur HBase. Setiap


RegionServer bertanggung jawab untuk mengelola satu atau beberapa region. Region
adalah rentang data yang terdiri dari sejumlah baris yang diberikan. RegionServer
bertanggung jawab atas operasi baca/tulis pada region yang dikonfigurasi. Ia
menerima permintaan dari pengguna, memproses operasi tersebut, dan berkomunikasi
dengan HDFS untuk menyimpan dan mengambil data.
b. HMaster: HMaster adalah node pusat dalam arsitektur HBase. Ia bertanggung jawab
untuk mengelola metadata tabel, mengkoordinasi pembuatan, pemindahan, dan
perpecahan region, serta mengontrol pembagian beban antara RegionServer. HMaster
juga menangani tugas seperti inisialisasi, pengaturan, pemantauan, dan pemulihan
kesalahan.
c. ZooKeeper: ZooKeeper adalah sistem koordinasi yang digunakan oleh HBase untuk
menjaga konsistensi dan koordinasi antara node dalam klaster HBase. ZooKeeper
menyimpan metadata konfigurasi dan keadaan klaster HBase, serta memberikan
layanan pemilihan pemimpin (leader election) untuk HMaster. ZooKeeper juga
berfungsi sebagai pusat koordinasi untuk pemindahan region saat terjadi perubahan
topologi klaster.
d. HDFS (Hadoop Distributed File System): HBase menggunakan HDFS sebagai sistem
penyimpanan fisik untuk data. Data dalam HBase disimpan dalam blok-blok yang
didistribusikan di seluruh node dalam klaster Hadoop. HDFS menyediakan
kehandalan dan replikasi data yang diperlukan oleh HBase untuk toleransi kesalahan
dan skalabilitas.
e. Client: Client adalah komponen yang berinteraksi dengan HBase untuk melakukan
operasi baca/tulis data. Aplikasi pengguna dapat menggunakan antarmuka HBase API,
seperti Java API atau REST API, untuk mengirimkan permintaan ke klaster HBase.
Client juga dapat menggunakan antarmuka pengguna berbasis shell untuk berinteraksi
dengan HBase melalui baris perintah.
f. Replication: HBase menyediakan fitur replikasi yang memungkinkan replikasi data
antara dua atau lebih klaster HBase. Replication digunakan untuk tujuan seperti
pemulihan bencana, replikasi data ke lingkungan pengujian/pengembangan, atau
pengiriman data ke pusat data lain untuk analisis.

Komponen-komponen ini bekerja sama untuk menyediakan penyebaran dan penyimpanan


data terdistribusi yang dapat diakses dengan cepat dan skalabilitas tinggi dalam Apache
HBase.

5. Kompabilitas HBase dan MapReduce


Apache HBase dan Apache MapReduce adalah dua komponen utama dalam ekosistem
Apache Hadoop. Mereka secara umum kompatibel dan dapat digunakan bersama-sama untuk
memproses dan menganalisis data dalam skala besar. Berikut adalah penjelasan tentang
kompatibilitas antara HBase dan MapReduce:

a. Integrasi: HBase dapat diintegrasikan dengan MapReduce melalui penggunaan


InputFormat dan OutputFormat yang sesuai. HBase menyediakan HTableInputFormat
dan HTableOutputFormat yang memungkinkan MapReduce untuk membaca data dari
tabel HBase dan menulis hasilnya kembali ke tabel HBase.
b. Pembacaan Data: Dalam MapReduce, Anda dapat menggunakan HTableInputFormat
untuk membaca data dari tabel HBase sebagai input. Dengan ini, setiap baris dalam
tabel HBase akan menjadi record input untuk tugas MapReduce. Anda dapat
mengakses data baris per baris dan memprosesnya sesuai dengan logika yang
ditentukan dalam tugas MapReduce.
c. Penulisan Hasil: Setelah pemrosesan dalam tugas MapReduce, Anda dapat
menggunakan HTableOutputFormat untuk menulis hasilnya kembali ke tabel HBase.
Anda dapat menentukan data mana yang akan ditulis ke tabel HBase dan bagaimana
pemetaan hasil dari tugas MapReduce ke tabel HBase harus dilakukan.
d. Performa: Integrasi antara HBase dan MapReduce dapat memberikan performa yang
baik dalam pengolahan dan analisis data. HBase menyediakan akses acak waktu nyata
dengan latensi rendah, yang berguna untuk tugas MapReduce yang membutuhkan
akses cepat ke data. Selain itu, dengan mengintegrasikan HBase dengan MapReduce,
Anda dapat memanfaatkan kemampuan pemrosesan dan distribusi paralel dari
MapReduce untuk memproses data dalam skala besar dengan efisiensi tinggi.
e. Fungsi Agregasi: Meskipun HBase memiliki fitur pengindeksan dan pengaksesan data
yang cepat, namun beberapa fungsi agregasi yang umum dalam MapReduce, seperti
penghitungan, pengelompokan, dan penyederhanaan data, mungkin lebih efisien
diimplementasikan menggunakan MapReduce daripada melalui operasi baris per baris
di HBase.

Dengan demikian, HBase dan MapReduce adalah dua komponen yang dapat bekerja bersama
untuk memproses data dalam skala besar. HBase menyediakan penyimpanan data
terdistribusi dengan akses acak yang cepat, sementara MapReduce memberikan kerangka
kerja pemrosesan dan analisis data yang dapat diskalakan secara horizontal.
DAFTAR PUSTAKA

https://learn.microsoft.com/id-id/azure/hdinsight/hbase/apache-hbase-
overview#:~:text=Apache%20HBase%20adalah%20database%20NoSQL,data%20dalam
%20database%20tanpa%20skema.

https://askanydifference.com/id/difference-between-rdbms-and-hbase/

https://www.teknologi-bigdata.com/2013/03/hbase-hyper-nosql-database.html

https://translate.google.com/translate?u=https://www.projectpro.io/article/overview-of-hbase-
architecture-and-its-components/295&hl=id&sl=en&tl=id&client=srp&prev=search

https://translate.google.com/translate?u=https://stackoverflow.com/questions/27798014/
latest-compatible-version-of-hadoop-and-
hbase&hl=id&sl=en&tl=id&client=srp&prev=search

Anda mungkin juga menyukai