Selamat datang di Scribd!

Lewati carousel

SPARK

Diunggah oleh

Okghi 'Alimme

0% menganggap dokumen ini bermanfaat (0 suara)

144 tayangan11 halaman

Judul Asli

Presentasi Big Data - Apache Spark.pdf

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

144 tayangan11 halaman

SPARK

Diunggah oleh

Okghi 'Alimme

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 11

Cari di dalam dokumen

A PA C H E

S PA R K

Okghi Adam Qowiy, Teddy Anugrah Ramanel, Asep Haryono

PUSAT TEKNOLOGI SISTEM DAN PRASARANA TRANSPORTASI
17 Juli 2020
Outline

Pengenalan

Komponen

Library

Tool

Contoh
Implementasi

2
Pengenalan
Apache Spark dalam Arsitektur Big Data

• Apache Spark adalah mesin

analitik terpadu untuk
pemrosesan data skala besar.

• Spark dapat digunakan dalam

mode cluster mandiri, pada
EC2, Hadoop YARN, Mesos,
atau Kubernetes.

• Akses data dalam HDFS, Alluxio,

Apache Cassandra, Apache
HBase, Apache Hive, dan
ratusan sumber data lainnya.

3
Komponen
Elemen pembentuk Apache Spark
Cluster Management
Spark Core adalah mesin
digunakan untuk
utama untuk pemrosesan
memperoleh sumber daya
data paralel dan
cluster untuk
terdistribusi berskala
melaksanakan pekerjaan
besar.
dan menangani pembagian
Spark Core bertanggung sumber daya diantara
jawab untuk manajemen komponen Spark.
memori dan pemulihan
Spark core menjalankan
kesalahan, penjadwalan,
lebih dari beragam Cluster
distribusi dan pemantauan
Management termasuk
pekerjaan pada sebuah
Hadoop YARN, Apache
cluster & berinteraksi
Mesos, Amazon EC2, dan
dengan sistem
Cluster Management
penyimpanan.
bawaan Spark.

4
Library
Spark Streaming adalah library ke Spark Core API yang MLlib adalah library machine learning yang dapat diskalakan
memungkinkan pemrosesan aliran live data stream yang yang membahas algoritma berkualitas tinggi dan kecepatan
memiliki karakterstik dapat diskalakan, transfer data tinggi, tinggi. MLlib berisi library yang memiliki implementasi
dan toleransi kesalahan. Spark menggunakan teknik Micro- berbagai algoritma machine learning seperti, clustering,
batching untuk streaming real-time. regression, classification dan collaborative filtering.

Spark SQL adalah

GraphX adalah mesin
modul Spark untuk
komputasi grafik yang
pemrosesan data
dibangun di atas Spark
terstruktur.
yang memungkinkan
pengguna untuk
Spark SQL juga
membangun,
menyediakan abstraksi
mentransformasikan,
pemrograman yang
dan alasan secara
disebut DataFrames
interaktif tentang
dan dapat bertindak
skala grafik pada data
sebagai mesin query
terstruktur.
SQL terdistribusi.

5
Tool
Ø Apache Zeppelin
• Web-based notebook that enables data-driven,
interactive data analytics and collaborative
documents with SQL, Scala and more.

6
Tool
Ø IntelliJ IDEA

• IntelliJ IDEA is an
integrated development
environment (IDE) written
in Java for developing
computer software.

• IntelliJ IDEA can create

new or edit existing local
or remote Zeppelin
notebooks, execute code
paragraphs, preview the
resulting tables and
graphs, and export the
results to various formats.

7
Contoh Implementasi
• Penggunaan pada Bukalapak

8
Contoh Implementasi
• Penggunaan pada Bukalapak

9 9
Rencana ke depan
• Pengaplikasian Hadoop

10
THE END

Anda mungkin juga menyukai

Materi Alu
Dokumen6 halaman
Materi Alu
Novi ana
Belum ada peringkat
OPTIMIZED TITLE
Dokumen9 halaman
OPTIMIZED TITLE
Rizal Balio
100% (1)
SCADA Keamanan
Dokumen20 halaman
SCADA Keamanan
Daniel Pasaribu
Belum ada peringkat
Metode Jaringan Syaraf Tiruan Perceptron
Dokumen2 halaman
Metode Jaringan Syaraf Tiruan Perceptron
Saiia Yudha
Belum ada peringkat
Pemrograman Jaringan Kohenen Dengan Matlab
Dokumen33 halaman
Pemrograman Jaringan Kohenen Dengan Matlab
Mega Hijriani
Belum ada peringkat
Simulasi Jaringan 2 AP
Dokumen4 halaman
Simulasi Jaringan 2 AP
Jemmy
Belum ada peringkat
Bab V Pemampatan Citra
Dokumen6 halaman
Bab V Pemampatan Citra
koza
Belum ada peringkat
Materi Basis Data Lanjut
Dokumen55 halaman
Materi Basis Data Lanjut
Siska Irhamna
Belum ada peringkat
Koneksi Database Java
Dokumen9 halaman
Koneksi Database Java
Makhmmuda Nurul
Belum ada peringkat
Standar Ukur Peralatan Komputer
Dokumen8 halaman
Standar Ukur Peralatan Komputer
Jujuk Kurniawan
Belum ada peringkat
Proposal Tugas Akhir Analisis Dan Implementasi Cloud Computing Owncloud Dengan IAAS Pada Yayasan Pendidikan Islam Swasembada Taman Harapan
Dokumen11 halaman
Proposal Tugas Akhir Analisis Dan Implementasi Cloud Computing Owncloud Dengan IAAS Pada Yayasan Pendidikan Islam Swasembada Taman Harapan
Farras Fauzan
Belum ada peringkat
Superscalar dan Superpipelined
Dokumen21 halaman
Superscalar dan Superpipelined
Hafiz Ari Putra
Belum ada peringkat
Teletrafik
Dokumen1 halaman
Teletrafik
nur hajar
Belum ada peringkat
Kelompok 2-Pipelining
Dokumen13 halaman
Kelompok 2-Pipelining
Taufik DNA SuksesMulia
Belum ada peringkat
Analisis Bahasa Chomsky
Dokumen10 halaman
Analisis Bahasa Chomsky
Yadi Aryadi
Belum ada peringkat
Laporan
Dokumen48 halaman
Laporan
Haspiannor Rahmatillah
Belum ada peringkat
Pengertian Media Access Control
Dokumen2 halaman
Pengertian Media Access Control
Ini Rizal
Belum ada peringkat
Mencari Datasets Di UCI Learning
Dokumen3 halaman
Mencari Datasets Di UCI Learning
AdityoDwiRahmawan
Belum ada peringkat
Contoh Proposal Skripsi Teknik Informatika
Dokumen15 halaman
Contoh Proposal Skripsi Teknik Informatika
Kopi Kopi
Belum ada peringkat
Perbedaan Arsitektur RISC Dengan CISC
Dokumen18 halaman
Perbedaan Arsitektur RISC Dengan CISC
HERU RAHMAN GINTING
100% (1)
Data Terdistribusi Dan Data Terpusat
Dokumen2 halaman
Data Terdistribusi Dan Data Terpusat
Rahma Destira
Belum ada peringkat
Agen Cerdas dan Penerapannya
Dokumen5 halaman
Agen Cerdas dan Penerapannya
Fajar Abadi
Belum ada peringkat
SISTEM PENGAMANAN RUMAH BERBASIS PENGENALAN WAJAH
Dokumen13 halaman
SISTEM PENGAMANAN RUMAH BERBASIS PENGENALAN WAJAH
Hotland Sitorus
Belum ada peringkat
Definisi Soft Computing
Dokumen4 halaman
Definisi Soft Computing
totororo01
Belum ada peringkat
Laporan Praktikum Arsitektur Dan Organisasi Komputer 11S18066
Dokumen19 halaman
Laporan Praktikum Arsitektur Dan Organisasi Komputer 11S18066
Jumadi Damanik
Belum ada peringkat
Soal UTS Algoritma Dan Pemrograman Komputer
Dokumen1 halaman
Soal UTS Algoritma Dan Pemrograman Komputer
Ilham
Belum ada peringkat
Tugas DW BI Powermart Anjar 41155050150067
Dokumen2 halaman
Tugas DW BI Powermart Anjar 41155050150067
Irfan Sundapradja
Belum ada peringkat
Rack Space
Dokumen4 halaman
Rack Space
Eugene Raditya
Belum ada peringkat
Data Link Control
Dokumen42 halaman
Data Link Control
Izjag
Belum ada peringkat
Jenis Register
Dokumen3 halaman
Jenis Register
lufi
Belum ada peringkat
Analisis P.sistem Akademik Pengisian Krs Secara Online-Dikonversi
Dokumen8 halaman
Analisis P.sistem Akademik Pengisian Krs Secara Online-Dikonversi
Ayu Monika Surbakti
Belum ada peringkat
Perancangan FSM untuk Lampu LED
Dokumen35 halaman
Perancangan FSM untuk Lampu LED
wira narendra
Belum ada peringkat
Topologi Jaringan Telekomunikasi
Dokumen28 halaman
Topologi Jaringan Telekomunikasi
Katon Prasetio
Belum ada peringkat
Sesi 7 Rangkaian Sekuensial (Flip-Flop)
Dokumen35 halaman
Sesi 7 Rangkaian Sekuensial (Flip-Flop)
Rizkiirwanto
Belum ada peringkat
Makalah Fisika Listrik
Dokumen21 halaman
Makalah Fisika Listrik
Indriani Pratiwi
Belum ada peringkat
03 Transmisi Data Analog Digital
Dokumen44 halaman
03 Transmisi Data Analog Digital
Xera Gaming
Belum ada peringkat
Wearable Computing
Dokumen4 halaman
Wearable Computing
Suharson Son Son
Belum ada peringkat
Laporan Analisis Aplikasi Parkir
Dokumen9 halaman
Laporan Analisis Aplikasi Parkir
Christ
Belum ada peringkat
Latihan Kuis Dan Tugas RPL 2020-1
Dokumen8 halaman
Latihan Kuis Dan Tugas RPL 2020-1
boi siman
100% (1)
Pemograman Mikrokontroller Minggu 7
Dokumen36 halaman
Pemograman Mikrokontroller Minggu 7
affan
0% (1)
LAPORAN PRAKTIKUM JAVASCRIPT TINGKAT DASARtugas PDF
Dokumen8 halaman
LAPORAN PRAKTIKUM JAVASCRIPT TINGKAT DASARtugas PDF
annisa rizka auia
Belum ada peringkat
Makalah Interface Serial Rs-485 Revisi
Dokumen11 halaman
Makalah Interface Serial Rs-485 Revisi
Silver Guner
100% (1)
LED_KONTROL
Dokumen29 halaman
LED_KONTROL
sisilain profesor
Belum ada peringkat
Modul Hari Ke-4 SCADA
Dokumen19 halaman
Modul Hari Ke-4 SCADA
Mulya Azhari
Belum ada peringkat
Algoritma Dynamic Programming
Dokumen7 halaman
Algoritma Dynamic Programming
Fauzi
Belum ada peringkat
Interupsi Dan Instruksi Pada Mikrokontroller
Dokumen13 halaman
Interupsi Dan Instruksi Pada Mikrokontroller
Gistya Fakhrani
100% (1)
Menampilkan Image Menggunakan MATLAB
Dokumen12 halaman
Menampilkan Image Menggunakan MATLAB
Primaningrat Gita Puspita
100% (1)
Form Data Pelamar
Dokumen7 halaman
Form Data Pelamar
Mulia Siregar
Belum ada peringkat
BAB 9 Operasi File
Dokumen6 halaman
BAB 9 Operasi File
amelia q
Belum ada peringkat
Resume Komunikasi Data
Dokumen2 halaman
Resume Komunikasi Data
Surdita Dana
100% (1)
TEKNIK MODULASI PADA KOMODULASI DATA
Dokumen6 halaman
TEKNIK MODULASI PADA KOMODULASI DATA
Prayoga Wahyu S
Belum ada peringkat
Konsep DDBMS
Dokumen28 halaman
Konsep DDBMS
Rizal Ardiansyah
Belum ada peringkat
UAS 2019 + Jawaban
Dokumen4 halaman
UAS 2019 + Jawaban
Martinus Ferdiand Sahelatua
Belum ada peringkat
Mikrokontoler
Dokumen29 halaman
Mikrokontoler
Sundun Sada Maripi
Belum ada peringkat
Modul Algoritma & Struktur Data
Dokumen50 halaman
Modul Algoritma & Struktur Data
Toras Salom Lubis
Belum ada peringkat
Tugas Big Data Raffly
Dokumen5 halaman
Tugas Big Data Raffly
raffly
Belum ada peringkat
Apache Spark Untuk Pemrosesan Big Data
Dokumen3 halaman
Apache Spark Untuk Pemrosesan Big Data
Said achmad
Belum ada peringkat
Instalasi Scala, Apache Spark, Pyspark
Dokumen14 halaman
Instalasi Scala, Apache Spark, Pyspark
falahrohmawan
Belum ada peringkat
Tugas Kelompok 1 - Big Data - Apache Spark - Apriadi Noor - Akmal Marup - M. Nur Rahmi - Akmal Marup 2020
Dokumen5 halaman
Tugas Kelompok 1 - Big Data - Apache Spark - Apriadi Noor - Akmal Marup - M. Nur Rahmi - Akmal Marup 2020
elvin
Belum ada peringkat
TK 3 Big Data Sisa No 1
Dokumen14 halaman
TK 3 Big Data Sisa No 1
to
Belum ada peringkat
Presentasi Big Data - Web Crawler
Dokumen10 halaman
Presentasi Big Data - Web Crawler
Okghi 'Alimme
Belum ada peringkat
Presentasi Big Data - Operasi Hadoop
Dokumen11 halaman
Presentasi Big Data - Operasi Hadoop
Okghi 'Alimme
Belum ada peringkat
SPARK
Dokumen11 halaman
SPARK
Okghi 'Alimme
Belum ada peringkat
YARN-Hadoop
Dokumen10 halaman
YARN-Hadoop
Okghi 'Alimme
Belum ada peringkat
YARN-Hadoop
Dokumen10 halaman
YARN-Hadoop
Okghi 'Alimme
Belum ada peringkat
Presentasi Big Data - Web Crawler
Dokumen10 halaman
Presentasi Big Data - Web Crawler
Okghi 'Alimme
Belum ada peringkat
Presentasi Big Data - Web Crawler PDF
Dokumen9 halaman
Presentasi Big Data - Web Crawler PDF
Okghi 'Alimme
Belum ada peringkat
YARN dan Arsitektur Hadoop
Dokumen10 halaman
YARN dan Arsitektur Hadoop
Okghi 'Alimme
Belum ada peringkat
Abstraksi
Dokumen1 halaman
Abstraksi
Okghi 'Alimme
Belum ada peringkat
Jurnal Skripsi
Dokumen14 halaman
Jurnal Skripsi
Okghi 'Alimme
Belum ada peringkat