Hadoop Distributed File System (HDFS) adalah distributed file system yang berfungsi menyimpan
dan mengolah data besar yang dibagikan dalam kluster Hadoop file system.
Write
01
Cara mengakses HDFS
1. Membuat command line interface
2. Menggunakan Ambari UI yang user-friendly
3. Memakai HTTP atau HDFS proxy
4. Menggunakan Java interface, karena Hadoop memang dibentuk menggunakan Java sehingga
pemrogramannya paling baik menggunakan Java atau Scala.
Map Reduce
Map reduce adalah inti dari Hadoop dan dibentuk supaya Hadoop dapat mendistribusikan proses
data dalam cluster. Tujuannya agar cluster dapat memproses data dalam jumlah besar secara
paralel.
02
10. Zeppelin, adalah platform berbentuk notebook UI yang memudahkan pengguna berinteraksi
secara cepat dengan data
11. Apache Storm, untuk memproses data secara streaming
12. Oozie, untuk mengatur scheduling job pada cluster Hadoop
13. Sqoop, untuk menjembatani relational database dengan Hadoop cluster
14. Apache Kafka, untuk mengatur streaming pipeline secara scale
Cloud Computing
Cloud computing adalah model komputasi yang memberikan on demand akses network dan
sharing komputasi online. Cloud computing digunakan untuk mengatur, menyimpan, dan
memproses data secara online melalui internet.
03
Perbedaan Cloud Storage AWS dengan Google Cloud
04