NPM : 1206224975
T.Elektro Paralel
Big Data
suatu software menjadi solusi dari permasalah ini. Hadoop merupakan software yang open
source. Program ini memungkinkan memproses data yang begitu besar secara paralel.
Menggunakan Hadoop, tidak ada data yang terlalu besar. Dan koneksi di dunia saat ini di mana
semakin banyak data yang sedang dibuat setiap hari, Hadoop merupakan suatu terobosan
keuntungan yang berarti bahwa bisnis dan organisasi sekarang dapat menemukan nilai dalam
data yang baru-baru ini dianggap tidak berguna.
Hadoop dapat menangani semua jenis data dari sistem yang berbeda: terstruktur, tidak
terstruktur, file, gambar, file audio, catatan komunikasi, email log atau apa saja yang dapat Anda
pikirkan, terlepas dari format aslinya. Bahkan ketika berbagai jenis data telah tersimpan dalam
sistem yang tidak berhubungan, Anda bisa membuang semuanya ke dalam cluster Hadoop Anda
dengan tidak perlu skema sebelumnya. Dengan kata lain, Anda tidak perlu tahu bagaimana Anda
berniat untuk query data Anda sebelum Anda menyimpannya. Hadoop memungkinkan Anda
memutuskan kemudian dan dari waktu ke waktu dapat mengungkapkan pertanyaan Anda bahkan
tidak pernah berpikir untuk bertanya.
Dengan membuat semua data Anda bisa digunakan, bukan hanya apa yang ada di
database Anda, Hadoop memungkinkan Anda melihat hubungan yang tersembunyi sebelum dan
mengungkapkan jawaban yang selalu di luar jangkauan. Anda dapat mulai membuat keputusan
yang lebih berdasarkan data bukan firasat dan melihat data yang lengkap, bukan hanya sampel.