Anda di halaman 1dari 12

16/10/2018

Big Data
and Data
Analytic

1
16/10/2018

Pengantar
 Bagaimana regulator
menjalankan fungsi control
terhadap kegiatan yang terjadi
di digital market?
 Bagaimana cara melakukan
monitoring terhadap transaksi
yang ada?
 Bagaimana mendapatkan
data dan informasi dari public
area sehingga kita bisa
mengambil langkah yang lebih
kongkrit dan data-driven?

Pengantar

 Data adalah fakta mentah atau rincian peristiwa yang belum diolah, yang terkadang
tidak dapat diterima oleh akal pikiran dari penerima data tersebut, maka dari itu data
harus diolah terlebih dahulu menjadi informasi untuk dapat di terima oleh
penerima. Data dapat berupa angka, karakter, simbol, gambar, suara, atau tanda-
tanda yang dapat digunakan untuk dijadikan informasi. Suatu informasi bisa saja
menjadi data apabila informasi tersebut digunakan kembali untuk pengolahan sistem
informasi selanjutnya. Dalam dunia komputer data adalah segala sesuatu yang
disimpan di dalam memori menurut format tertentu.
 Informasi adalah hasil pengolahan data yang sudah dapat diterima oleh akal pikiran
penerima informasi yang nantinya dapat digunakan untuk pengambilan
keputusan. Informasi dapat berupa hasil gabungan, hasil analisa, hasil penyimpulan,
dan juga hasil pengolahan sistem informasi komputerisasi.

2
16/10/2018

Mengenal
Big Data

 Big Data adalah istilah yang menggambarkan volume data yang


besar, baik data yang terstruktur maupun data yang tidak
terstruktur. Big Data telah digunakan dalam banyak bisnis. Tidak
hanya besar data yang menjadi poin utama tetapi terkait juga
dengan apa yang harus dilakukan organisasi dengan
data tersebut.

Apa itu Big


Data?

3
16/10/2018

 Lalu, sebesar apakah volume data agar bisa disebut big


data? Apakah jumlah datanya harus milyaran record
per hari?
Karakteristik  Data, bisa disebut sebagai Big Data ketika memenuhi
salah satu dari tiga karakteristik berikut:
Big Data  Too much Volume (data yang saya miliki terlalu banyak)
 Too much Velocity (saya menerima data terlalu cepat)
 Too much Variety (data yang datang berasal dari
banyak tempat dengan banyak format)

Volume

 Salah satu permasalahan yang big data coba pecahkan adalah meledaknya
volume data yang suatu organisasi ingin simpan atau proses. Seberapa besar data
yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda miliki anda
sudah lebih baik dibanding kompetitor? Data yang ada saat ini berukuran sangat
besar. Di tahun 2000 saja tercatat 800,000 petabyte data tersimpan di seluruh
dunia dan angka ini diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau
bahkan lebih. Teknologi harus menemukan cara untuk mengolah data tersebut.

4
16/10/2018

Velocity

 Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang
pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya
velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan
hasil analisis terhadap aliran data yang terus mengalir di saat yang hampir
bersamaan dengan datangnya data tersebut.
 Bisa dibilang, permasalahan ini berkaitan erat dengan permasalahan volume data,
karena kecepatan data dibuat umumnya berbanding lurus dengan volume data.
Data tidak hanya datang dalam jumlah besar, tetapi juga dalam tempo yang lebih
singkat dan bahkan ada yang real-time.

Variety

 Permasalahan utama yang coba diselesaikan oleh Big Data dikarenakan


permasalahan ini akan sangat sulit dipecahkan oleh data platform tradisional, baik
itu database atau data warehouse.
 Variety adalah permasalahan yang terjadi karena keberagaman data, baik itu dari
format file data yang masuk, maupun format / struktur dari isi data tersebut.
 Big Data tidak hanya terdiri dari data berstruktur seperti halnya data angka-angka
maupun deretan huruf-huruf yang berasal dari sistem database mendasar seperti
halnya sistem database keuangan, tetapi juga terdiri atas data multimedia seperti
data teks, data suara dan video yang dikenal dengan istilah data tak berstruktur.

5
16/10/2018

Big Data tidak hanya berputar pada jumlah data yang


organisasi miliki, tetapi hal yang penting adalah
bagaimana mengolah data internal dan eksternal.

Kenapa Harus
Big Data? Kita dapat mengambil data dari sumber manapun
dan menganalisanya untuk menemukan jawaban
yang diinginkan dalam bisnis seperti: pengurangan
biaya, pengurangan waktu, pengembangan produk
baru dan optimalisasi penawaran produk dan
pengambilan keputusan yang cerdas.

Big Data Architecture

6
16/10/2018

Architecture

Teknologi
penunjang
Big Data

7
16/10/2018

Tantangan menggunakan Big Data

 Capturing the Data,


 Curation,
 Storage,
 Searching,
 Sharing,
 Transfer,
 Analysis, and
 Visualization / Presentation

Big Data Analytics

8
16/10/2018

 Big data analytics mengacu pada proses


mengumpulkan, mengorganisasikan dan menganalisa
sekumpulan besar data (big data) untuk mendapatkan
pola-pola dan informasi yang berguna.
 Big data analytics tidak hanya membantu untuk
memahami informasi yang terkandung di dalam data
tapi juga membantu untuk mengidentifikasi data yang
paling penting untuk keputusan bisnis saat ini dan
masa datang Apa itu Big
Data
Analytics

 Descriptive Analytics adalah proses data analytics untuk


mendapatkan gambaran umum dari data yang sudah
dikumpulkan.
 Predictive Analytics adalah data analytics yang memberikan hasil
Data Analytics prediksi tentang sesuatu yang akan dating.
 Prescriptive Analytics adalah proses analytics yang menghasilkan
jawaban atas pertanyaan kenapa sesuatu akan terjadi serta
memberikan saran terhadap kondisi yang kemungkinan akan
terjadi dimasa yang akan dating.

9
16/10/2018

10
16/10/2018

 Discovery
 Identifikasi masalah yang akan diselesaikan dan menganalisa sumber data mana
saja yang dibutuhkan.

 Data Preparation
 ETL (Extract, Transform, Load), proses pengambilan data dari sumber ke satu
tempat terpusat.

 Model Planning
 di mana tim menentukan metode, teknik, dan alur kerja. Tim mengeksplorasi data
Tahapan Data untuk belajar tentang hubungan antara data dan kemudian memilih variabel kunci
dan model yang paling cocok untuk digunakan.

Analytics  Model Building


 Tim mengembangkan dataset untuk pengujian (testing), pelatihan (training), dan
tujuan produksi (menghasilkan data baru dari data yang ada).

 Communicate Results
 Tim harus mengidentifikasi temuan kunci, mengukur nilai bisnis, dan
mengembangkan narasi untuk meringkas dan menyampaikan temuan kepada
para pemangku kepentingan.

 Operationalize
 Menjalankan atas hasil analisis.

Data
Scientist

11
16/10/2018

Sample
Case:
Sentiment
Analysist

12

Anda mungkin juga menyukai