Selamat datang di Scribd!

Lewati carousel

Hadoop

Diunggah oleh

Chaturvedi Tanya

0% menganggap dokumen ini bermanfaat (0 suara)

53 tayangan14 halaman

presentation on hadoop..

Hak Cipta

Format Tersedia

PPTX, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

presentation on hadoop..

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

53 tayangan14 halaman

Hadoop

Diunggah oleh

Chaturvedi Tanya

presentation on hadoop..

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 14

Cari di dalam dokumen

{

Tanya Chaturvedi MBA(ISM) 500026401

What is Hadoop???
Hadoop is a software framework for distributed processing of large datasets across large clusters of computers Large datasets Terabytes or petabytes of data

Large clusters hundreds or thousands of nodes

Hadoop is written in the java programming language and requires Java Runtime Environment (JRE) 1.6 or higher.

Innovation

This technology was invented by Google back in their early days so they could usefully index all the textual and structural information they were collecting and then present meaningful results to the users. Hadoop is based on a simple data model, any data will fit.

Hadoop Master/Slave Architecture

Hadoop is designed as a master slave architecture.

Master node

Many slave nodes

Design Principles of Hadoop

Need to process big data. Need to parallelize computation across thousands of nodes. Commodity hardware Large number of low-end cheap machines working in parallel to solve a computing problem. Small number of high-end expensive machines. Fault tolerance and automatic recovery Nodes/tasks will fail and will recover automatically.

Users of Hadoop

Google: Inventors of MapReduce computing paradigm. Yahoo: index calculation for yahoo search engine. IBM, Microsoft, Oracle, Apple, HP, Twitter Facebook, Amazon, AOL, NetFlex Many others universities and research labs

Main Reasons for Using Hadoop

Hadoop Architecture
Hadoop framework consists of two main layers

Distributed file system (HDFS) Execution engine (MapReduce)

A small Hadoop cluster will include a single master and multiple slave nodes. The master node consists of a JobTracker, TaskTracker, NameNode and DataNode. A slave or worker node acts as both a DataNode and TaskTracker, though it is possible to have data-only worker nodes and compute-only worker nodes. Job tracker is the master node. it receives the users job Hadoop requires Java Runtime Environment (JRE) 1.6 or higher.

Hadoop Distributed File System

HDFS is a distributed, scalable, and portable file system written in Java for the Hadoop framework. HDFS keeps different copies of data in different locations. The goal of HDFS is to reduce the impact of power failure or switch failure, so that even if these occur, the data can be available.

Properties of HDFS

Large: A HDFS instance may consist of thousands of server machines, each storing part of the file systems data Replication: Each data block is replicated many times (default is 3). Fault Tolerance: Detection of faults and quick, automatic recovery from them is a core architectural goal of HDFS.

Advantages of Using Hadoop

Hadoop is a framework which provides distributed storage and computational capabilities both. It is extremely scalable. HDFS uses large block size which eventually works best when manipulating large data sets. HDFS maintains different replicas of files ; fault tolerant. Hadoop uses Mapreduce framework which is batch-based, distributed computing framework.

Limitations of Hadoop

Security Inefficient for handling small files. Does not offer storage or network level encryption. Single master model-can result in single point of failure.

Hadoop Vs. Other Systems

Anda mungkin juga menyukai

Guided By:-Prof. K. Kakwani: Payal M. Wadhwani
Dokumen24 halaman
Guided By:-Prof. K. Kakwani: Payal M. Wadhwani
Ravi Joshi
Belum ada peringkat
Cloud Computing
Dokumen19 halaman
Cloud Computing
Afia Faryad
Belum ada peringkat
Unit 3
Dokumen15 halaman
Unit 3
xcgfxgvx
Belum ada peringkat
Introduction To Hadoop
Dokumen5 halaman
Introduction To Hadoop
Hanumanthu Gouthami
Belum ada peringkat
Bda Lab Manual
Dokumen40 halaman
Bda Lab Manual
vishalatdwork573
0% (1)
2 Hadoop
Dokumen20 halaman
2 Hadoop
YASH PRAJAPATI
Belum ada peringkat
Hadoop Interview1
Dokumen27 halaman
Hadoop Interview1
paramreddy2000
Belum ada peringkat
Bda Unit 2
Dokumen21 halaman
Bda Unit 2
245120737162
Belum ada peringkat
Hadoop Ecosystem PDF
Dokumen6 halaman
Hadoop Ecosystem PDF
Kittu
Belum ada peringkat
02 Unit-II Hadoop Architecture and HDFS
Dokumen18 halaman
02 Unit-II Hadoop Architecture and HDFS
KumarAdabala
Belum ada peringkat
BDA Presentations Unit-4 - Hadoop, Ecosystem
Dokumen25 halaman
BDA Presentations Unit-4 - Hadoop, Ecosystem
Ashish Chauhan
Belum ada peringkat
Haddob Lab Report
Dokumen12 halaman
Haddob Lab Report
Magneto Eric Apollyon Thorn
Belum ada peringkat
Big Data Module 2
Dokumen23 halaman
Big Data Module 2
Srikanth M
Belum ada peringkat
Hadoop Ecosystem
Dokumen56 halaman
Hadoop Ecosystem
RUGAL NEEMA MBA 2021-23 (Delhi)
Belum ada peringkat
Technical Seminar
Dokumen32 halaman
Technical Seminar
Sda Sdasd
Belum ada peringkat
CC-KML051-Unit V
Dokumen17 halaman
CC-KML051-Unit V
Fdjs
Belum ada peringkat
Hadoop Introduction PDF
Dokumen3 halaman
Hadoop Introduction PDF
Tahseef Reza
Belum ada peringkat
Big Data - Unit 2 Hadoop Framework
Dokumen19 halaman
Big Data - Unit 2 Hadoop Framework
Aditya Deshpande
Belum ada peringkat
BDA Notes
Dokumen25 halaman
BDA Notes
mrudula.sb
Belum ada peringkat
Hadoop Overview
Dokumen16 halaman
Hadoop Overview
Sunil D Patil
100% (1)
Hadoop Big Data: Follow This Link To Know About Features of Hadoop
Dokumen85 halaman
Hadoop Big Data: Follow This Link To Know About Features of Hadoop
mvdurgadevi
Belum ada peringkat
BDA Lab Assignment 3 PDF
Dokumen17 halaman
BDA Lab Assignment 3 PDF
parth shah
Belum ada peringkat
Big Data Hadoop Stack
Dokumen52 halaman
Big Data Hadoop Stack
Yaser Ali Tariq
Belum ada peringkat
Hadoop
Dokumen7 halaman
Hadoop
Mayank Rai
Belum ada peringkat
To Hadoop: A Dell Technical White Paper
Dokumen9 halaman
To Hadoop: A Dell Technical White Paper
webregistros
Belum ada peringkat
1) Hadoop Basics
Dokumen86 halaman
1) Hadoop Basics
angeline
Belum ada peringkat
h13999 Hadoop Ecs Data Services WP
Dokumen9 halaman
h13999 Hadoop Ecs Data Services WP
Vijay Reddy
Belum ada peringkat
Hadoop Architecture: Er. Gursewak Singh Dcse
Dokumen12 halaman
Hadoop Architecture: Er. Gursewak Singh Dcse
Daisy Kawatra
Belum ada peringkat
Hadoop Overview: Open Source Framework Processing Large Amounts of Heterogeneous Data Sets Distributed Fashion
Dokumen62 halaman
Hadoop Overview: Open Source Framework Processing Large Amounts of Heterogeneous Data Sets Distributed Fashion
Mousoomi Baruah
Belum ada peringkat
Bda 18CS72 Mod-2
Dokumen152 halaman
Bda 18CS72 Mod-2
Dhathri Reddy
Belum ada peringkat
Hadoop Interview Questions New
Dokumen9 halaman
Hadoop Interview Questions New
Rupali Shetty
Belum ada peringkat
Experiment No.1: AIM: Study of Hadoop
Dokumen6 halaman
Experiment No.1: AIM: Study of Hadoop
Harshita Mandloi
Belum ada peringkat
Unit 2
Dokumen10 halaman
Unit 2
tripathineeharika
Belum ada peringkat
Efficient Ways To Improve The Performance of HDFS For Small Files
Dokumen5 halaman
Efficient Ways To Improve The Performance of HDFS For Small Files
Yassine Zrigui
Belum ada peringkat
Hadoop
Dokumen6 halaman
Hadoop
Vikas Sinha
Belum ada peringkat
Apache Hadoop
Dokumen11 halaman
Apache Hadoop
Imaad Ukaye
Belum ada peringkat
HADOOP
Dokumen40 halaman
HADOOP
saadiaiftikhar123
Belum ada peringkat
Chapter 2 Hadoop Eco System
Dokumen34 halaman
Chapter 2 Hadoop Eco System
lamisaldhamri237
Belum ada peringkat
Intro Hadoop Ecosystem Components, Hadoop Ecosystem Tools
Dokumen15 halaman
Intro Hadoop Ecosystem Components, Hadoop Ecosystem Tools
Rebecca tho
Belum ada peringkat
Basic Hadoop Interview Questionsxyzz
Dokumen18 halaman
Basic Hadoop Interview Questionsxyzz
shubham rathod
Belum ada peringkat
Big Data Analytics Assignment
Dokumen7 halaman
Big Data Analytics Assignment
Devananth A B
Belum ada peringkat
Apache Hadoop: Developer(s) Stable Release Preview Release
Dokumen5 halaman
Apache Hadoop: Developer(s) Stable Release Preview Release
nitesh_mps
Belum ada peringkat
CC Unit 5
Dokumen43 halaman
CC Unit 5
prassadyashwin
Belum ada peringkat
Hadoop Ecosystem
Dokumen4 halaman
Hadoop Ecosystem
shweta shedshale
Belum ada peringkat
Hadoop Ecosystem
Dokumen55 halaman
Hadoop Ecosystem
nehal
Belum ada peringkat
Hadoop Unit-4
Dokumen44 halaman
Hadoop Unit-4
Kishore Parimi
Belum ada peringkat
Chapter-2-Hadoop Eco System
Dokumen34 halaman
Chapter-2-Hadoop Eco System
noor222.202
Belum ada peringkat
HADOOP and PYTHON For BEGINNERS - 2 BOOKS in 1 - Learn Coding Fast! HADOOP and PYTHON Crash Course, A QuickStart Guide, Tutorial Book by Program Examples, in Easy Steps!
Dokumen89 halaman
HADOOP and PYTHON For BEGINNERS - 2 BOOKS in 1 - Learn Coding Fast! HADOOP and PYTHON Crash Course, A QuickStart Guide, Tutorial Book by Program Examples, in Easy Steps!
Antony George Sahayaraj
Belum ada peringkat
777 1651400645 BD Module 3
Dokumen62 halaman
777 1651400645 BD Module 3
nimmy
Belum ada peringkat
By Pallavi Mandal Class: CS-B Roll No.: 2014BCS1150
Dokumen17 halaman
By Pallavi Mandal Class: CS-B Roll No.: 2014BCS1150
neerendra pratap singh
Belum ada peringkat
By - Shubham Parmar
Dokumen14 halaman
By - Shubham Parmar
Gagan Deep
Belum ada peringkat
Hadoop
Dokumen11 halaman
Hadoop
Inu Kag
Belum ada peringkat
Hadoop Ecosystem: Hdfs Mapreduce Yarn Hadoop Common
Dokumen5 halaman
Hadoop Ecosystem: Hdfs Mapreduce Yarn Hadoop Common
Harshdeep850
Belum ada peringkat
Getting Started With Hadoop
Dokumen47 halaman
Getting Started With Hadoop
TeeMan27
Belum ada peringkat
Big Data
Dokumen16 halaman
Big Data
roushan singh
Belum ada peringkat
Notes Hadoop
Dokumen19 halaman
Notes Hadoop
Oyimang Tatin
Belum ada peringkat
Hadoop Ecosystem PDF
Dokumen55 halaman
Hadoop Ecosystem PDF
Rishabh Gupta
Belum ada peringkat
Hadoop Ecosystem PDF
Dokumen55 halaman
Hadoop Ecosystem PDF
Rishabh Gupta
Belum ada peringkat
Chapter 2 - 大数据生态系统
Dokumen31 halaman
Chapter 2 - 大数据生态系统
gs68295
Belum ada peringkat
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
Dari Everand
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
Wei Liu
Belum ada peringkat
Dave PDF
Dokumen8 halaman
Dave PDF
Chaturvedi Tanya
Belum ada peringkat
Analytics For Business Decisions
Dokumen3 halaman
Analytics For Business Decisions
Chaturvedi Tanya
Belum ada peringkat
Whitepaper
Dokumen8 halaman
Whitepaper
Chaturvedi Tanya
Belum ada peringkat
Public Private Partnership
Dokumen11 halaman
Public Private Partnership
Chaturvedi Tanya
Belum ada peringkat
1 Managing Infrastructure Microsoft Azure Getting Started m1 Slides
Dokumen22 halaman
1 Managing Infrastructure Microsoft Azure Getting Started m1 Slides
Cadouri Super
Belum ada peringkat
Module 004 Cloud Computing - Everything Is A Service
Dokumen10 halaman
Module 004 Cloud Computing - Everything Is A Service
Noe Agubang
Belum ada peringkat
AZ-900 Prepaway Premium Exam 222q
Dokumen183 halaman
AZ-900 Prepaway Premium Exam 222q
Victor GS
Belum ada peringkat
Battle Card For Solution VALUE Jan 2019 Update v3
Dokumen2 halaman
Battle Card For Solution VALUE Jan 2019 Update v3
Hans Schauer
Belum ada peringkat
SpringBoot7AM 03022021
Dokumen4 halaman
SpringBoot7AM 03022021
Sambit baral
Belum ada peringkat
CC W3 AWS Basic Infra
Dokumen57 halaman
CC W3 AWS Basic Infra
Muhammad Tehseen Khan
Belum ada peringkat
Unit V Case Studies
Dokumen37 halaman
Unit V Case Studies
SHAROS INTERNATIONAL
Belum ada peringkat
AY1718s1 ST0324 IoT Practical 11 - v016 (Add Boto With S3 and Rekognition) PDF
Dokumen46 halaman
AY1718s1 ST0324 IoT Practical 11 - v016 (Add Boto With S3 and Rekognition) PDF
Anonymous mQGrLb1MzF
Belum ada peringkat
Unit 16.assignment 1 Frontsheet
Dokumen30 halaman
Unit 16.assignment 1 Frontsheet
Trần Hoàng
Belum ada peringkat
Exam Prep For AWS Certified Solutions Architect - Associate: Domain 1 - Organizational Complexity
Dokumen3 halaman
Exam Prep For AWS Certified Solutions Architect - Associate: Domain 1 - Organizational Complexity
Johann Lee
Belum ada peringkat
Oracle Cloud Slides v3
Dokumen119 halaman
Oracle Cloud Slides v3
ganesh rajan
Belum ada peringkat
Middleware Technology
Dokumen16 halaman
Middleware Technology
api-26830587
Belum ada peringkat
S501 Get Power From DataPower - Practical Approach
Dokumen43 halaman
S501 Get Power From DataPower - Practical Approach
Jagadeeh Valasapalli
Belum ada peringkat
AWS DevOps Course Syllabus
Dokumen8 halaman
AWS DevOps Course Syllabus
cristian080989
Belum ada peringkat
Data Analytics Assessment Questions
Dokumen11 halaman
Data Analytics Assessment Questions
Tushar Mani Agarwal
Belum ada peringkat
IBM Aspera Drive: Secure, High-Speed File Sharing and Sync From The Desktop
Dokumen3 halaman
IBM Aspera Drive: Secure, High-Speed File Sharing and Sync From The Desktop
rberrospi
Belum ada peringkat
How To Make Apache Run ASP
Dokumen2 halaman
How To Make Apache Run ASP
Richard Rivas
Belum ada peringkat
1.4.7 Packet Tracer - Configure Router Interfaces
Dokumen3 halaman
1.4.7 Packet Tracer - Configure Router Interfaces
Hạnh
Belum ada peringkat
BitTorrent Protocol
Dokumen93 halaman
BitTorrent Protocol
Chandan Singh Kushwaha
Belum ada peringkat
Prayitno Honggo Wijoyo: Education
Dokumen1 halaman
Prayitno Honggo Wijoyo: Education
gilis
Belum ada peringkat
Cloud Computing
Dokumen16 halaman
Cloud Computing
Kranthi kumar
Belum ada peringkat
01 A Brief Introduction To Cloud Computing
Dokumen25 halaman
01 A Brief Introduction To Cloud Computing
Elias Knebel
Belum ada peringkat
MSFT Cloud Architecture Hybrid
Dokumen7 halaman
MSFT Cloud Architecture Hybrid
Muhammad Farooq
Belum ada peringkat
Microsoft Official Courseware Title Plan Updated 23 April 2020
Dokumen66 halaman
Microsoft Official Courseware Title Plan Updated 23 April 2020
Andrei Boboc
Belum ada peringkat
Openshift: Openshift Is A Family of Containerization Software Developed by Red Hat. Its
Dokumen4 halaman
Openshift: Openshift Is A Family of Containerization Software Developed by Red Hat. Its
Night Owl
Belum ada peringkat
Ubuntu OpenStack Fundamentals Training
Dokumen6 halaman
Ubuntu OpenStack Fundamentals Training
Anupriya Dayaratne
Belum ada peringkat
AZ-900 PW Premium Exam 223q
Dokumen184 halaman
AZ-900 PW Premium Exam 223q
PrithviRaj Gadgi
Belum ada peringkat
QUIZZ Cloud Foundry
Dokumen63 halaman
QUIZZ Cloud Foundry
Zenaida Martinez
Belum ada peringkat
VMware Vsphere
Dokumen4 halaman
VMware Vsphere
Sarah Ali
Belum ada peringkat
Transcript: Kouame Romeo Kouadio 1. Vmware Learning Zone Basic Subscription
Dokumen13 halaman
Transcript: Kouame Romeo Kouadio 1. Vmware Learning Zone Basic Subscription
Romeo
0% (1)