Anda di halaman 1dari 30

PENGENALAN BIG DATA

FENOMENA, FRAMEWORK, PELUANG, DAN TANTANGAN

UNIVERSITAS INDONESIA MAJU (UIMA)


BIG DATA
Secara umum, belum ada definisi Big Data
yang dapat dijadikan sebagai rujukan
akademik (Kitchin, 2014).

APA ITU Big Data dapat diasumsikan sebagai sebuah media


BIG penyimpanan data yang menawarkan ruang tak
terbatas, serta kemampuan untuk mengakomodasi
DATA? dan memproses berbagai jenis data dengan sangat
cepat.
Apa Itu Big Data
• Big Data : istilah untuk data sangat besar dan
kompleks yang tidak dapat dikelola (capture,
store, manage, analyze ) dengan software dan
tool pemrograman database biasa/ konvensional.
• Tidak Cukup dengan SQL biasa saja (Relational
Database Management System), Sehingga butuh
teknologi baru/ tambahan NoSQL (Not only
SQL).
• Tidak hanya berisi data berstruktur/ relational tapi
juga (mayoritas) tidak berstruktur (unstructured)
BIG DATA Menurut Para Ahli
• Menurut (Eaton, Dirk, Tom, George, & Paul), Big Data
merupakan istilah yang berlaku untuk informasi yang
tidak dapat diproses atau dianalisis menggunakan
alat tradisional.
• Menurut (Dumbill, 2012), Big Data adalah data yang
melebihi proses kapasitas dari kovensi sistem
database yang ada. Data terlalu besar dan terlalu
cepat atau tidak sesuai dengan struktur arsitektur
database yang ada. Untuk mendapatkan nilai dari
data, maka harus memilih jalan altenatif untuk
memprosesnya.
BIG DATA
• Setiap hari, kita menciptakan 2,5 triliun byte
data—begitu banyak bahwa 90% dari data di
dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana,
sensor digunakan untuk mengumpulkan
informasi iklim, posting ke situs media
sosial, gambar digital dan video, catatan
transaksi pembelian, dan sinyal ponsel GPS
untuk beberapa nama. Data ini adalah big
data.
BIG DATA
• Big Data Tidak hanya Data yang Besar,
Namun Tentang cara Pemrosesan yang
Berdeda yang Bertujuan untuk melakukan
pengambilan keputusan maupun untuk
mendapatkan suatu wawasan.
Pemicu Perkembangan Big Data
Kemampuan Ketersediaan
Kemampuan
mesin data yang
penyimpanan
pemrosesan berlimpah
data data

Social Internet of
Human things
Dunia nyata Semua yang
berkaitan dengan
internet dan objek
yang digunakan
Berapa Banyak Data
yang Tercipta Dalam 1
Detik ?
Digital
Fact
Sosia
l
Media
Aktivitas Pengguna Sosial Media
Sifat BIG DATA
VOLUME
Volume di sini berkaitan dengan
VERACITY
Data yang memiliki sifat tertentu
ukuran media penyimpanan
data yang sangat besar atau
mungkin tak terbatas.

VALUE
Data bernilai di masa depan,
data yang bertaut satu sama
lain

VARIETY
Merupakan pengelolaan data
yang terdiri dari berbagai jenis VELOCITY
dan format. Data real time atau kecepatan
proses
4 Dimensi Big Data
Menurut Gentsch (2019)

Volume (ukuran): Menjelaskan Jumlah Data yang Masuk yang


akan disimpan dan dianalisis, ukuran data sangat besar dari sisi
jumlah yang mencapai Milyaran Terra Byte = trilyunan GB.
Velocity (Kecepatan): Menjelaskan Kecepatan data dapat
dihasilkan, disimpan, diproses, dan dianalisis dengan cepat.
Variety (keberagaman): Tidak hanya memproses dengan data
terstruktur dari tabel tetapi juga dengan data semu dan tidak
terstruktur dari teks, gambar, atau video
Veracity (kebenaran & Ketepatan): Menjelaskan bahwa data
dapat dipercaya, kejujuran dan bermakna, kebenaran dan
keakuratan informasi yang tidak mudah dipastikan, missal salah
ketik di Twitter.
Kompleksitas BIG DATA

DATA TERSTRUKTUR (spreadsheet, excel, word)


KLASIFIKASI
dan DATA TIDAK TERSTRUKTUR (data dari URL,
DATA
medsos, email, blog dll
ACQUIRED (didapatkan), ACCESSED (diakses), TAHAPAN
ANALYTIC (dianalisis), APPLICATION PENGELOLAAN
(diaplikasikan)

Profil, kualitas data, analisis, input KUALITAS


(BIG DATA) DATA

Kemampuan, budaya, dan integrasi KETERBATASAN


INTERNAL
Tantangan BIG DATA
DATA KUALITAS DATA
SCIENTIST Berkaitan dengan integritas dan
ketidakteraturan data
INFRASTRUKTUR
FRAGMENTASI DATA
KUALITAS Setiap departemen menyimpan data
DATA PLATFORM
DAN APLIKASI sendiri, tidak ada departemen khusus

FRAGMENTASI INFRASTRUKTUR
DATA Big data terlampau kompleks untuk
dihimpun, disimpan, dan dipahami
PLATFORM DAN APLIKASI
Banyak muncul platform dan
aplikasi baru
DATA SCIENTIST
Membutuhkan orang yang mampu
dan memahami big data
Peluang di era BIG DATA
Peluang di era BD adalah manusia dapat
menggunakan data dan informasi dari banyak
sumber data. Hal ini mendorong akselerasi
perkembangan ilmu pengetahuan, membantu
S
T

W
R
manusia melahirkan karya yang bernilai, inovasi E
N
EAKNESS
bisnis, dan supporting pengambilan keputusan. G
T
Pada sisi lain, tantangan di era BD adalah H
tersediannya data dan infomasi yang kompleks, S

keterbatasan keahlian personal memicu


T
O
ketertinggalan, data tidak dapat dianalisis H
PPORTUNITIES
dengan cara konvensional (Sivarajah et al., R
E
2017). A
T
S
Framework BIG DATA
Secara ringkas Hadoop adalah software yang mampu
menghubungkan banyak komputer untuk dapat
HADOOP bekerja sama dan saling terhubung untuk menyimpan
dan mengelola data dalam satu kesatuan

HDRS (Hadoop Distributed File System)


Manajemen berkas terdistribusi

MAPREDUCE
Pemrosesan terdistribusi, memproses data yang tidak
terstruktur pada cluster komoditi besar, menangani kegagalan
hardware

YARN
Melakukan penjadwalan tugas dan manajemen sumber
daya
Kelebihan HADOOP
Volume, adanya keperluan untuk menyimpan dan
mengelola data dalam jumlah yang sangat besar dan
terus bertambah dari waktu ke waktu

Velocity, adanya keperluan untuk bisa mengakses


data dalam jumlah besar dengan cepat

Variety, semakin bervariasinya data saat ini,


sehingga teknologi Relational Database
Management System (RDBMS) sudah tidak
mungkin menanganinya lagi
SIKLUS MANAJEMEN DATA
Suatu bentuk tahapan dalam pengelolaan data yang dimulai dari
pengumpulan data, proses atau pengolahan data, pembuatan
informasi, serta penyajian data atau informasi

1. Data Applications = tujuan untuk pengumpulan


2. Data Collection = proses saat data dikumpulkan
3. Data warehousing = proses dan sistem saat data telah
didapatkan atau disimpan untuk digunakan mendatang
4. Data analysis = proses saat data telah diubah menjadi
infomasi dan dapat digunakan untuk kegiatan rutin
Model Manajemen Data

ACCURACY ACCESSIBILITY COMPREHENSIVENESS CURRENCY CONSISTENCY


Kebenaran data, Kemudahan Fakta dari semua Update atau Reabilitas
data harus data didap- elemen data yang data terbaru data
mewakili apa yang atkan dibutuhkan, atau
dimaksudkan dan
kelengkapan data
didefinisikan oleh
sumber aslinya
Model Manajemen Data

DEFINITION PRECISION RELEVANCY GRANULARITY

Penyajian dan Menggambarkan Manfaat dari data Karakteristik kuali-


bentuk data yang nilai data yang yang dikumpulkan tas data yang
disimpan diharapkan dikeluarkan
WAREHOUSE
DATA
Data warehouse adalah basis data yang menyimpan data sekarang dan
data masa lalu yang berasal dari berbagai sistem operasional dan
sumber yang lain (sumber eksternal) yang menjadi perhatian penting
bagi manajemen dalam organisasi dan ditujukan untuk keperluan
analisis dan pelaporan manajemen dalam rangka pengambilan
keputusan
Warehouse Data
Mengambil
keputusan bukan Text Here

mengolah data Get a modern PowerPoint


Presentation that is 04
beautifully designed.

Meliputi: extraction, transportation, transformation, loading


solution, dan aplikasi lain yang mengatur proses
pengumpulan data dan mengirimkan ke business user 02

01
Karakteristik Data warehouse

01 02 03 04

SUBJEK ORIENTED DATA INTEGRATED TIMELINE NON-VOLATILE


dirancang untuk Data Warehouse dapat Semua data dalam data artinya data dalam gudang
menganalisis data menyimpan data dari warehouse dikatakan valid data tidak diperbarui
berdasarkan subjek-subjek sumber yang terpisah ke dan akurat dalam rentang secara real time tetapi
tertentu dalam organisasi, dalam format yang waktu tertentu dalam refresh sistem
bukan pada proses atau konsisten dan terintegrasi operasi secara teratur
fungsi aplikasi tertentu satu sama lain
THANK YOU
Insert the Subtitle of Your Presentation

Anda mungkin juga menyukai