Selamat datang di Scribd!

Lewati carousel

Modul 15 - Implementasi Data Input Menggunakan Hadoop

Diunggah oleh

mhanafi520

0% menganggap dokumen ini bermanfaat (0 suara)

14 tayangan6 halaman

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

14 tayangan6 halaman

Modul 15 - Implementasi Data Input Menggunakan Hadoop

Diunggah oleh

mhanafi520

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 6

Cari di dalam dokumen

2022

BIG DATA
INFORMATIKA

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA
PERTEMUAN 15
Implementasi Data Input menggunakan Hadoop

A. Tujuan
Mahasiswa mampu memahami Implementasi data dasar dengan ETL menggunakan
Hadoop

B. Dasar Teori
Setelah mempelajari penggunaan file pada tahap MapReduce Hadoop, sekarang mari coba
untuk menggunakan data besar untuk analitik data. Pada pertemuan ini penggunaan data
menggunakan data .csv sebagai berikut:

Dataset yang digunakan berisi tweet random yang bertujuan untuk Klasifikasi Gender, tetapi
untuk mencoba implementasi penggunaan MapReduce dengan file python kita akan mencoba
mencari tahu username mana yang sering muncul/retweet. Dengan langkah sebagai berikut:

- Taruh dataset .csv pada folder materials yang telah di buat pada pertemuan
sebelumnya.
- Buat file Mapper dan Reducer untuk memproses data. File yang digunakan
menggunakan bahasa python.

Mapper2.py:

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA
Reducer2.py:

- Dan simpan kedua file python tersebut pada folder materials.

- Setelah itu buat lah hdfs baru yang bernama twitter, dengan sintaks sebagai berikut:

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA
- Setelah itu masukkan data yang telah disimpan pada hdfs yang telah dibuat, dengan
sintaks atau command sebagai berikut:

- Setelah itu silahkan MapReduce data tersebut dengan sintaks sebagai berikut:

hadoop jar C:/hadoop-2.9.2/share/hadoop/tools/lib/hadoop-streaming-2.9.2.jar -files

file:///C:/hadoop-2.9.2/materials/mapper2.py,file:///C:/hadoop-
2.9.2/materials/reducer2.py -mapper "python C:/hadoop-2.9.2/materials/mapper2.py"
-reducer “python C:/Hadoop-2.9.2/materials/reducer2.py” -input /pertemuan11_2/* -
output /result/hasil16

- Apabila MapReduce telah berhasil akan tampil sebagai berikut:

- Hasil Mapper dan Reducer menggunakan 2 file berikut dapat dilihat di GUI atau
browser http://localhost:9870, pada menu browser ultility dengan directory
/result/hasil16 sebagai berikut:

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA
- Atau bisa juga untuk ditampilkan data hasil proses Mapper dan Reducer dengan
sintaks berikut:

Hasil tersebut bisa dipilah menggunakan data excel lalu filter dari data terbesar seperti
berikut:

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA
Didapati username Pacific Time dengan paling banyak RT pada tiap akun yang data
yang di crawling, data diatas terdapat akun yes, no, dan 0 juga tinggi dikarenakan data
belum bersih/ preprocessing yang menyebabkan data bukan akun pun terhitung. Itulah
secara sederhana penggunaan dataset besar dan implementasi file python dengan
MapReduce pada Hadoop.

C. Tugas

Buatlah dataset crawling twitter yang baru lalu coba implementasi langkah MapRedice
diatas agar mengetahui fitur dan fungsi yang ada.

FAKULTAS ILMU KOMPUTER

UNIVERSITAS PEMBANGUNAN NASIONAL VETERAN JAKARTA

Anda mungkin juga menyukai

Latihan Membuat WebGIS
Dokumen15 halaman
Latihan Membuat WebGIS
Hendra Thohir
Belum ada peringkat
Mari Belajar Pemrograman Berorientasi Objek menggunakan Visual C# 6.0
Dari Everand
Mari Belajar Pemrograman Berorientasi Objek menggunakan Visual C# 6.0
Risal
Penilaian: 4 dari 5 bintang
4/5 (16)
Ringkasan
Dokumen4 halaman
Ringkasan
Egina Charista
Belum ada peringkat
AinunJariyah JurnalBigData 3SIB
Dokumen11 halaman
AinunJariyah JurnalBigData 3SIB
Ruth Martiyanti Sitorus
Belum ada peringkat
Bab 2 Data Analityc
Dokumen12 halaman
Bab 2 Data Analityc
rahmat gunawan
Belum ada peringkat
1 - Realita Inayah - 046 - Akhir1
Dokumen24 halaman
1 - Realita Inayah - 046 - Akhir1
SAP 119 046 Realita Inayah
Belum ada peringkat
Modul 1 Implementasi MapReduce Terminal Streaming - Muhamad Aldo Fernanda - 064002000037
Dokumen26 halaman
Modul 1 Implementasi MapReduce Terminal Streaming - Muhamad Aldo Fernanda - 064002000037
Nanami Karenina
Belum ada peringkat
4 Filelee
Dokumen9 halaman
4 Filelee
Arnita Fentrin
Belum ada peringkat
TP3 - Dian Rahmad Dermawan
Dokumen6 halaman
TP3 - Dian Rahmad Dermawan
Dian Rahmad
Belum ada peringkat
Referensi Fix
Dokumen8 halaman
Referensi Fix
irdanaiyra
Belum ada peringkat
TugasKelompok HDFS MapReduce Satria&Habibie
Dokumen9 halaman
TugasKelompok HDFS MapReduce Satria&Habibie
Arnita Fentrin
Belum ada peringkat
Modul 2 Cloudera HadoopMR Edit - Kelompok
Dokumen15 halaman
Modul 2 Cloudera HadoopMR Edit - Kelompok
Syahrul Ramadhan
Belum ada peringkat
18.04.212 Jurnal Eproc
Dokumen8 halaman
18.04.212 Jurnal Eproc
Yulianti Repati
Belum ada peringkat
Laporan Praktikum 02 Data Mining
Dokumen7 halaman
Laporan Praktikum 02 Data Mining
Dila
Belum ada peringkat
Implementasi Apache Spark Pada BG Data Berbasis Hadoop
Dokumen4 halaman
Implementasi Apache Spark Pada BG Data Berbasis Hadoop
zuper_kamikaze
Belum ada peringkat
Laporan UTS Pemrograman Basis Data
Dokumen39 halaman
Laporan UTS Pemrograman Basis Data
maya norriastini
Belum ada peringkat
Basis Data Dan Xampp
Dokumen21 halaman
Basis Data Dan Xampp
Asep Gunawan
Belum ada peringkat
Tutorial WebGIS
Dokumen34 halaman
Tutorial WebGIS
07Ghost
100% (1)
Basis Data Acara 2
Dokumen11 halaman
Basis Data Acara 2
Davin tong
Belum ada peringkat
Data Spot
Dokumen13 halaman
Data Spot
Haris Vebrian Matsuyama
Belum ada peringkat
Tugas Makalah Big Data-1
Dokumen6 halaman
Tugas Makalah Big Data-1
Den Otomotiv
Belum ada peringkat
Map Reduce
Dokumen7 halaman
Map Reduce
budideath
Belum ada peringkat
Tugas 2
Dokumen4 halaman
Tugas 2
Rakha F. Shieta
Belum ada peringkat
17.11.1607 BDL Uts
Dokumen6 halaman
17.11.1607 BDL Uts
cendy oktari
Belum ada peringkat
Tugas Rangkuman - Ivan Sutedjo - 825180032
Dokumen4 halaman
Tugas Rangkuman - Ivan Sutedjo - 825180032
yifan
Belum ada peringkat
Analisis Performa Kecepatan MapReduce Pa
Dokumen72 halaman
Analisis Performa Kecepatan MapReduce Pa
arief hidayat
Belum ada peringkat
Pertemuan 3 - Lingkungan Pengembangan (Minified)
Dokumen36 halaman
Pertemuan 3 - Lingkungan Pengembangan (Minified)
Rakhmad Kafyandi
Belum ada peringkat
Haikalpdf
Dokumen26 halaman
Haikalpdf
BanyuGroup Cybernet
Belum ada peringkat
Translated Copy of Ilovepdf - Merged
Dokumen4 halaman
Translated Copy of Ilovepdf - Merged
Gilang Antono
Belum ada peringkat
Rizky Abdullah - P17410203140 - 1C - TM 13 - Laprak Algo
Dokumen14 halaman
Rizky Abdullah - P17410203140 - 1C - TM 13 - Laprak Algo
HardLine GAMING
Belum ada peringkat
Modul 2 Cloudera HadoopMR Edit - Muhamad Aldo Fernanda - 064002000037
Dokumen17 halaman
Modul 2 Cloudera HadoopMR Edit - Muhamad Aldo Fernanda - 064002000037
Nanami Karenina
Belum ada peringkat
Tugas PTIK Pertemuan 4
Dokumen31 halaman
Tugas PTIK Pertemuan 4
raihana
Belum ada peringkat
Install Hadoop - Kelompok 3
Dokumen9 halaman
Install Hadoop - Kelompok 3
Rahma Ataya T
Belum ada peringkat
1C - 76 - Dian Islamiyati Yusniawan - Laporan Basis Data Dan Rekam Medis
Dokumen12 halaman
1C - 76 - Dian Islamiyati Yusniawan - Laporan Basis Data Dan Rekam Medis
Dian Yusniawan
Belum ada peringkat
Tugas 3 Mengkoneksikan Aplikasi Dengan Database
Dokumen10 halaman
Tugas 3 Mengkoneksikan Aplikasi Dengan Database
Muh Faisal
100% (1)
Pratikum Aplikasi SPP
Dokumen12 halaman
Pratikum Aplikasi SPP
Nano Supriatna
Belum ada peringkat
Modul 2 Cloudera HadoopMR Edit
Dokumen15 halaman
Modul 2 Cloudera HadoopMR Edit
Syahrul Ramadhan
Belum ada peringkat
Modul1 207006070 DilaTriyanaTrisandani
Dokumen9 halaman
Modul1 207006070 DilaTriyanaTrisandani
053Nandhitta Aemy
Belum ada peringkat
Hadoop For Big Data
Dokumen10 halaman
Hadoop For Big Data
Dot Exe
Belum ada peringkat
Framework Big Data
Dokumen113 halaman
Framework Big Data
wika safitri
Belum ada peringkat
Worksheets 3 - Big Data Analytics and Technologies
Dokumen3 halaman
Worksheets 3 - Big Data Analytics and Technologies
Putri Nur aini
Belum ada peringkat
Sig 1
Dokumen104 halaman
Sig 1
Ayip Nur
Belum ada peringkat
Xii RPL2 Laporan
Dokumen28 halaman
Xii RPL2 Laporan
BanyuGroup Cybernet
Belum ada peringkat
Aldri Setyo Pemrograman Spasial Exercise 1
Dokumen9 halaman
Aldri Setyo Pemrograman Spasial Exercise 1
Aldri S
Belum ada peringkat
Hadoop Cluster Mohamad Dani-Libre
Dokumen9 halaman
Hadoop Cluster Mohamad Dani-Libre
Aditya Wijayanto
Belum ada peringkat
Fikri - Library Pandas Python
Dokumen12 halaman
Fikri - Library Pandas Python
manja siregar
Belum ada peringkat
Project Prokom Kelompok2 NomorKasus2 DRM2 2022
Dokumen9 halaman
Project Prokom Kelompok2 NomorKasus2 DRM2 2022
loaf
Belum ada peringkat
Jobsheet Praktek
Dokumen9 halaman
Jobsheet Praktek
Rahmad Hidayat Al Fahrizzi
Belum ada peringkat
LN08-Big Data Analytics (Apache Spark & SparkML)
Dokumen26 halaman
LN08-Big Data Analytics (Apache Spark & SparkML)
TsabitAlaykRidhollah
Belum ada peringkat
Jurnal Bigdata & IoT
Dokumen3 halaman
Jurnal Bigdata & IoT
Rizky Ferdiansyah
100% (1)
Data Sebagai Pengambilan Keputusan
Dokumen6 halaman
Data Sebagai Pengambilan Keputusan
Audrey Christian
Belum ada peringkat
PRAKTIKUM
Dokumen42 halaman
PRAKTIKUM
Yasiree Zereff
Belum ada peringkat
Big Data Iinii PDF
Dokumen5 halaman
Big Data Iinii PDF
ajie
Belum ada peringkat
Pemrograman Python untuk Pemula: Pemrograman
Dari Everand
Pemrograman Python untuk Pemula: Pemrograman
JUD
Penilaian: 5 dari 5 bintang
5/5 (9)
Machine Learning
Dari Everand
Machine Learning
Ibnu Daqiqil Id
Penilaian: 2.5 dari 5 bintang
2.5/5 (7)
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Dari Everand
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Risal
Penilaian: 3.5 dari 5 bintang
3.5/5 (7)
Studi Kasus - Muhammad Hanafi
Dokumen2 halaman
Studi Kasus - Muhammad Hanafi
mhanafi520
Belum ada peringkat
TTS Kebhinekaan - Crossword Labs
Dokumen1 halaman
TTS Kebhinekaan - Crossword Labs
mhanafi520
Belum ada peringkat
Soal Kuis Jarkom
Dokumen1 halaman
Soal Kuis Jarkom
mhanafi520
Belum ada peringkat
Kebhinekaan
Dokumen5 halaman
Kebhinekaan
mhanafi520
Belum ada peringkat