Anda di halaman 1dari 3

BAB III DASAR TEORI

3.1. Big Data


Big Data adalah sebuah teknologi baru di dunia teknologi informasi dimana
memungkinan proses pengolahan, penyimpanan dan analisis data dalam beragam
bentuk/format, berjumlah besar dan pertambahan data yang sangat cepat. Pengolahan dan
analisis data dalam jumlah sangat besar ini memerlukan waktu yang relatif jauh lebih singkat
dengan menggunakan Big Data dibanding teknologi data sebelumnya,

3.2. Apache Ambari


Apache Ambari merupakan sebuah aplikasi untuk memudahkan provosioning,
managemen dan monitoring terhadap Apache Hadop Cluster. Pada awalnya Ambari di
kembangkan oleh Hortonworks, dan sekarang menjadi salah satu project dari Apache.
Dengan ambari, system admin dapat melakukan hal-hal berikut ini.

Provisioning sebuah Hadoop cluster

Ambari menyediakan tampilan langkah demi langkah dalam instalasi Hadoop service.
Ambari juga menangani konfigurasi hadoop service untuk cluster tersebut.

Manajemen Hadoop Cluster

Ambari menyediakan tools untuk melakukan start, stop, dan rekonfigurasi hadoop
service di seluruh cluster.

Monitoring Hadoop Cluster

Ambari menyediakan sebuah dashboard untuk memonitor 'kesehatan' dan status


sebuah cluster Hadoop. Ambari memanfaatkan Ambari metric system untuk melakukan
metrics collection (pengumpulan data status cluster). Ambari juga memanfaatkan Ambari
alert framework untuk sistem peringatan, dan akan mengirimkan alert jika terjadi hal-hal
yang perlu diperhatikan oleh sysadmin (misalnya sebuah node mati, disk space hampir penuh,
dll).

3.3. Apache Hadoop

Hadoop adalah kerangka kerja open source, yang mendukung pengolahan data set
besar dalam lingkungan komputasi terdistribusi. Hadoop terdiri dari MapReduce, Hadoop
didistribusikan sistem file ( HDFS ) dan sejumlah proyek terkait seperti Apache Hive, HBase
dan Zookeeper. MapReduce dan Hadoop sistem file terdistribusi ( HDFS ) merupakan
komponen utama dari Hadoop.

3.4. RPM
RedHat Package Manager (RPM) adalah sebuah cara mudah untuk melakukan instalasi,
uninstalasi, ugrade, query, verify dan mem-build paket software.
Paket software RPM adalah sebuah arsip dari file-file dengan beberapa informasi yang
berhubungan dengan file-file tersebut, seperti nama, versi dan deskripsinya.
Service yang akan digunakan di-build dengan rpm adalah sebagai berikut.
Hadoop
Hive
HBase
Zookeeper
Oozie
Spark
Tez
Sqoop
Storm
Phoenix
Amabri
Ada stack2nya

Yava

BAB V PENUTUP

1.1. Kesimpulan
Kesimpulan dari pelaksanaan Kerja Praktik ini adalah sebagai berikut.

1.2. Saran
Saran-saran untuk pengembangan lebih lanjut website ini adalah sebagai berikut.

http://saphanatutorial.com/hadoop-cluster-architecture-and-core-components/

Anda mungkin juga menyukai