Anda di halaman 1dari 15

LAPORAN PRAKTIKUM

“KONFIGURASI WORDCOUNT PADA UBUNTU HADOOP”

Disusun dalam rangka memenuhi salah satu tugas mata kuliah


“Big Data”

Dosen Pengampu: MUNAWIR, S.ST, M.T.

Di Susun Oleh:

AULIA ZAHRA 200504074


DWI SABTI NINGSIH 200504048
WINDA HALIZA 200504054

FAKULTAS TEKNIK
PROGRAM STUDI INFORMATIKA
UNIVERSITAS SAMUDRA LANGSA
2022
KATA PENGANTAR

Puji syukur kehadirat Tuhan Yang Maha Esa atas segala rahmatNYA
sehingga kami dapat menyusun makalah ini tepat pada waktunya. Tidak lupa
kami juga mengucapkan banyak terimakasih atas bantuan dari seluruh komponen
yang telah membantu dalam penyelesaian laporan yang berjudul “Konfigurasi
Wordcount pada Ubuntu Hadoop”

Dan harapan kami semoga laporan ini dapat menambah pengetahuan dan
pengalaman bagi para pembaca, serta seluruh Masyarakat Indonesia khususnya
para mahasiswa untuk ke depannya dapat memperbaiki bentuk maupun
menambah isi laporan ini agar menjadi lebih baik lagi.

Karena keterbatasan pengetahuan maupun pengalaman kami, kami yakin


dalam pembuatan laporan kali ini masih banyak ditemukan kekurangan, oleh
karena itu kami sangat mengharapkan saran dan kritik yang membangun dari
pembaca demi kesempurnaan laporan ini.

Rabu, 28 Desember 2022

Penulis
DAFTAR ISI

KATA PENGANTAR ............................................................................................ i


DAFTAR ISI .......................................................................................................... ii
DAFTAR GAMBAR ............................................................................................ iii
BAB I PENDAHULUAN ...................................................................................... 4
1.1 Latar Belakang ......................................................................................... 4
1.2 Tujuan ....................................................................................................... 4
BAB II LANDASAN TEORI ............................................................................... 5
2.1 Pengertian Big Data .................................................................................. 5
2.2 Wordcount Pada Hadoop .......................................................................... 5
BAB III METODOLOGI ..................................................................................... 7
3.1 Alat dan Bahan ......................................................................................... 7
3.2 Langkah-Langkah Konfigurasi Wordcount Pada Ubuntu........................ 7
BAB IV PEMBAHASAN...................................................................................... 5
4.1 Hasil ......................................................................................................... 5
BAB V PENUTUP ................................................................................................. 6
5.1 Kesimpulan .............................................................................................. 6
5.2 Saran ......................................................................................................... 6
DAFTAR PUSTAKA ............................................................................................ 1
DAFTAR GAMBAR

Gambar 3. 1 Membuat Direktori winda_workspace ............................................... 7


Gambar 3. 2 Membuat Direktori winda_word_count ............................................. 7
Gambar 3. 3 Membuat File Inputan Bernama words.txt ......................................... 8
Gambar 3. 4 Isi File ................................................................................................. 8
Gambar 3. 5 Input Perintah ..................................................................................... 2
Gambar 3. 6 Membuat File WordCount.java .......................................................... 2
Gambar 3. 7 Compile File WordCountJava ............................................................ 3
Gambar 3. 8 Membuat File WC.jar......................................................................... 3
Gambar 3. 9 Menjalankan Fungsi File WordCount.jar ........................................... 4
Gambar 3. 10 Hasil Pemrosesan WordCount ......................................................... 5
BAB I
PENDAHULUAN

1.1 Latar Belakang


Secara umum big data dapat diartikan sebagai sebuah kumpulan data
yang berukuran sangat besar (volume), sangat cepat berubah/bertumbuh
(velocity), hadir dalam beragam bentuk/format (variety), serta memiliki nilai
tertentu (value),dengan catatan jika berasal dari sumber yang akurat (veracity)
[1, 3]. Hal utama yang membedakan big data dengan kumpulan data
konvensional terletak pada mekanisme pengelolaannya. Sistem basis data
relasional yang saat ini umum digunakan, sudah dirasakan tidak mampu
menangani kompleksitas big data secaraoptimal [4]. Mengacu pada definisi
big data, diperlukan suatu penanganan khusus terhadap konten big data,
ditinjau secara ukuran dan bentuknya. Konsep pengelolaan data secara
relasional yang berbasis pada data-data terstruktur, dirasakan tidak mumpuni
sebagai media penyimpanan big data, yang pada umumnya sangat tidak
terstruktur dan terdistribusi.

1.2 Tujuan
1. Mahasiswa mampu mengkonfigurasikan Wordcount pada Hadoop
2. Mahasiswa memahami konfigurasi Wordcount pada Hadoop
3. Mahasiswa dapat menjalankan Wordcount
BAB II
LANDASAN TEORI

2.1 Pengertian Big Data


Kajian tentang Big Data telah banyak dilakukan oleh banyak sarjana
dalam konteks ontologi, epistimologi, dan aksiologi Big Data. Big Data dapat
didefinisikan sebagai sebuah sistem yang mengintegrasikan dunia nyata,
manusia, dan dunia maya. Dunia nyata berkaitan dengan realitas sosial yang
terrefleksikan kedalam dunia maya melalui teknologi dan internet of thing.
Sementara manusia menghasilkan big data di mana big data diproduksi
kedalam dunia maya melalui mekanisme teknologi; komputer, kecerdasan
buatan, dan mobile internet. Mengacu pada penjelasan tersebut, big data
dapat diklasifikasikan ke dalam dua kategori, yaitu data berasal dari dunia
nyata di mana data ini didapatkan melalui teknologi yang mampu menangkap
semua jenis data yang beredar dalam dunia nyata seperti data alam, iklim, peta,
biologi dan lainnya.

2.2 Wordcount Pada Hadoop


Hadop merupakan suatu platform yang digunakan untuk mendukung
aplikasi yang memproses Big Data. Oleh karena itu, beberapa komputer dapat
saling terhubung, sinkron dan bekerja sama untuk memproses sejumlah data
sebagai sebuah kesatuan. Dengan menggunakan Hadoop, kita dapat
memproses Big Data melalui beberapa komputer sekaligus. Hadoop termasuk
salah satu platform sistem bersifat open-source yang berlisensi Apache.
Kelebihan Hadoop yang membuat platform ini digunakan oleh banyak
perusahaan-perusahaan besar karena Hadoop merupakan solusi yang dapat
menjawab tantangan Big Data. Terdapat 3 tantangan utama Big Data yang
dapat diatasi oleh keberadaan Hadoop. Pertama Volume, yaitu kebutuhan
untuk menyimpan dan mengelola data dalam jumlah yang sangat besar dan
terus bertambah dari waktu ke waktu. Selanjutnya Velocity, yaitu kebutuhan
untuk bisa mengakses data dalam jumlah besar dengan cepat.
WordCount merupakan program yang bertujuan untuk menghitung kata
pada file plaintext. Proses MapReduce pada WordCount ini dibagi menjadi 2
tahap yaitu proses mapping dan reducing. Tugas Map berurusan dengan
splitting dan mapping dari data sedangkan tugas Reduce melakukan shuffle
dan reduce terhadap data. Word count adalah sebuah fungsi atau perintah yang
digunakan untuk menghitung jumlah kata atau karakter dari sebuah dokumen.
Kegunaan dari word count adalah untuk membantu mengetahui seberapa
panjang dokumen atau konten yang telah di produksi.
BAB III
METODOLOGI

3.1 Alat dan Bahan


1. Virtual Box
2. Virtual OS ubuntu
3. PC/Laptop
4. Software Hadoop

3.2 Langkah-Langkah Konfigurasi Wordcount Pada Ubuntu


1. Langkah pertama yang harus dilakukan adalah memastikan bahwa hadoop
sudah terinstal dan dapat dijalankan. Setelah itu buka terminal lalu ketikkan
$hdfs dfs –mkdir –p /winda_word_count/input, $mkdir ~/winda
_workspace, $cd ~/rizky_workspace, perintah tersebut digunakan untuk
membuat dan masuk ke direktori yang telah dibuat.

Gambar 3. 1 Membuat Direktori winda_workspace

2. Didalam direktori ~/winda_workspace, ketikkan $mkdir ~/winda


_word_count untuk membuat direktori baru dan cd winda_word_count
untuk masuk kedalam direktori baru tersebut.

Gambar 3. 2 Membuat Direktori winda_word_count


3. Setelah memasuki direktori winda_word_count ketikkan perintah $nano
words.txt, perintah ini akan membuat file words dengan extensi txt yang
berisi kata-kata yang akan diproses oleh wordcount.

Gambar 3. 3 Membuat File Inputan Bernama words.txt

4. Pada tahap ini diisikan kata-kata yang akan diproses oleh wordcount, pada
contoh kali ini kami memasukkan nama-nama dari anggota kelompok yang
nantinya akan dihitung jumlah dari kata tersebut.

Gambar 3. 4 Isi File

5. Selanjutnya ketikkan perintah $hdfs dfs –put ~/winda-


workspace/winda_word_count/words.txt/winda_word_count/input erintah
ini berfungsi untuk membuat inputan pada file dapat dijalankan oleh
hadoop, Selanjutnya $nano~/winda_workspcae/asep_word_ count/Word
Count.java
Gambar 3. 5 Input Perintah

Gambar 3. 6 Membuat File WordCount.java

6. Setelah masuk kedalam file WordCount.java menggunakan perintah nano,


langkah selanjutnya isi file WordCount.java dengan file yang java yang bisa
didapatkan dengan mengcopy file yang ada pada dokumentasi hadoop
wordcount, selanjutnya save file dengan menekan tombol Ctrl + X lalu
tekan Y untuk menyimpan.

7. Selanjutnya ketikkan perintah $hadoop com.sun.tools.javac. Main


WordCount.java, perintah tersebut berfungsi untuk mengcompile dan
menjadikan file WordCount.java menjadi beberapa class yang nantinya
dapat diakses dan dijalankan sebagai program java.
Gambar 3. 7 Compile File WordCountJava

8. Ketikkan perintah $ls –al, perintah ini berfungsi untuk melihat seluruh
direktori yang ada didalam direktori tersebut, jika terdapat file
WordCountclass,WordCount$IntSumReducer.classdanWordCount$tokiniz
erMapper.class maka proses compile telah berhasil.

9. Ketikan perintah $ jar cf wc.jar WordCount*.class, perintah ini akan


berfungsi untuk menjalankan dan menggabungkan seluruh file dengan nama
WordCount dengan extensi sebagai class. Menjadi sebuah file. Jika proses
selesai dijalankan maka akan terlihat pada direktori file wc.jar.

Gambar 3. 8 Membuat File WC.jar


10. Selanjutnya ketikkan perintah $hadoop com.sun.tools.javac.Main
WordCount.java, perintah tersebut berfungsi untuk mengcompile dan
menjadikan file WordCount.java menjadi beberapa class yang nantinya
dapat diakses dan dijalankan sebagai program java.

Gambar 3. 9 Menjalankan Fungsi File WordCount.jar


BAB IV
PEMBAHASAN

4.1 Hasil
Praktikum konfigurasian WordCount pada hadoop single cluster yang
dinstal didalm system operasi Ubuntu versi 20.04 telah berhasil dan untuk
melihat hasilnya dapat diakses dengan mengunjungi localhost:9870 pada
browser kemudian klik menu “utilituies > browse > /rizky_word_count/output”
jika 2 file muncul maka konfigurasi berhasil.
Selanjutnya untuk melihat hasil pemrosesan wordcount pada file
words.txt dapat diakses didalam terminal dengan mengetikkan perintah $ hdfs
dfs .cat/nama_word_count/output/part-r-00000 lalu jalankan.

Gambar 3. 10 Hasil Pemrosesan WordCount


BAB V
PENUTUP

5.1 Kesimpulan
Dari hasil praktikum pengkonfigurasian file wordcount pada hadoop
didapatkan kesimpulan bahwa dalam penggunaannya wordcount dapat
menghitung beberapa jumblah kata yang sama dalam sebuah file, sehingga
dalam proses pengolahan data BigData fungsi wordcount ini sangat berguna.
Dalam praktiknya penginstalan wordcount pada hadoop sangat mudah, namun
perlu diperhatiakan bahwa hadoop dan konfigurasi java path pada ubntu
menentukan kelancaran praktikum pengkonfigurasian wordcount ini.

5.2 Saran
Dalam praktikum konfigurasi wordcount perlu dingat bahwa sebelum
memulai konfigurasi terlebih dahulu pastikan bahwa hadoop yang telah diinstal
telah berjalan dengan sempurna. Selain hadoop dalam keadaan aktif java jdk
pada Ubuntu juga harus dipastikan dapat digunakan beserta seluruh tools yang
ada didalm path java sehingga saat proses pengcompilean file java dapat
berjalan dengan baik.
DAFTAR PUSTAKA

Priharyani, K. D., Satrya, G. B., & Herutomo, A. (2015). Analisis Penggunaan


Algoritma Delay Scheduling terhadap Karakteristik Job Scheduling pada
Hadoop. eProceedings of Engineering, 2(1).

Wibawa, C., Wirawan, S., Mustikasari, M., & Anggraeni, D. T. (2022).


KOMPARASI KECEPATAN HADOOP MAPREDUCE DAN APACHE
SPARK DALAM MENGOLAH DATA TEKS. Jurnal Ilmiah
Matrik, 24(1), 10-20.

Ryanto, A. M., Ilham, A. A., & Niswar, M. (2017). Analisis kinerja framework
big data pada cluster tervirtualisasi: Hadoop mapreduce dan apache spark.

Anda mungkin juga menyukai