DISUSUN OLEH :
ADRIAN MAULANA RIZQY (10121069)
IF-2
c. Mengekstrak file yang tadi Hadoop yang tadi di download di Local Disk C:\
d. Membuat folder namenode dan datanode
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
Hdfs-site.xml (Konfigurasi ini mengatur beberapa aspek penting dari
lingkungan Hadoop, termasuk faktor replikasi untuk keandalan data di HDFS
dan direktori tempat menyimpan metadata dan data pada NameNode dan
DataNode)
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dirc</name>
<value>C:\hadoop\data\namenode</value>
</property>
<property>
<name>dfs.datanode.name.dirc</name>
<value>C:\hadoop\data\datanode</value>
</property>
</configuration>
Yarn-site.xml (konfigurasi YARN (Yet Another Resource Negotiator) pada
lingkungan Hadoop)
<configuration>
<property>
<name>yarn.nodemanager.aux-
servicess.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
Hadoop-env.cmd (mengatur variabel lingkungan JAVA_HOME ke direktori
instalasi Java Development Kit (JDK) versi 1.8 di sistem Windows)
Pemecahan (Map): Pada tahap ini, teks diperoleh dari input dan dibagi menjadi potongan-
potongan yang lebih kecil yang disebut "split". Setiap split kemudian diolah oleh fungsi
map yang memetakan kata-kata ke dalam pasangan kunci-nilai. Kunci adalah kata itu
sendiri, dan nilai umumnya diatur sebagai 1.
Pengurutan dan Pengelompokan (Shuffle & Sort): Hasil dari fungsi map dikelompokkan
berdasarkan kunci (kata) mereka, dan hasilnya diurutkan.