Anda di halaman 1dari 5

Ringkasan Big Data

Summarized By : Bima Damar Jati / I0717013

Introduction

Istilah Big Data mengacu pada volume data yang sangat besar yang tidak dapat disimpan diproses oleh
unit penyimpanan atau pemrosesan data tradisional apa pun. Big Data dihasilkan pada skala yang
sangat besar dan sedang digunakan oleh banyak perusahaan multinasional untuk memproses dan
menganalisis untuk mengungkap wawasan dan meningkatkan bisnis banyak organisasi [1].

Seringkali, banyak analis data profesional akan menyiratkan proses extraction, transformation, dan
load (ETL) untuk dataset besar sebagai konotasi Big Data. Biasanya deskripsi populer tentang Big Data
didasarkan pada tiga atribut utama data: volume, kecepatan, dan variasi (atau 3V) [10].

Selain itu Big Data sering didefinisikan sebagai sebuah teknik untuk “menyimpan, memroses,
mengatur, menganalisis dan menampilkan” sejumlah beesar dari jenis jenis data, pada kecepatan yang
dibutuhkan, dan dalam waktu yang dibutuhkan untuk dapat menganalisa secara Real Time [2].

Tipe Big Data

Big Data umumnya dikategorikan ke dalam tiga jebis data. Seperti yang ditunjukkan di bawah ini:

1. Structured Data
Structured Data memiliki model data khusus, Ia juga memiliki struktur yang terdefinisi dengan
baik, mengikuti urutan yang konsisten dan dirancang sedemikian rupa sehingga dapat dengan
mudah diakses dan digunakan oleh orang atau komputer. Structured Data biasanya disimpan
dalam kolom yang didefinisikan dengan baik dan juga Database.
Example: Database Management Systems (DBMS)
2. Semi Structured Data
Semi-Structured Data dapat dianggap sebagai bentuk lain dari Structured Data. Ini mewarisi
beberapa properti Structured Data, tetapi bagian utama dari jenis data ini gagal memiliki
struktur yang pasti dan juga, itu tidak mematuhi struktur formal model data seperti RDBMS.
Example: Comma Separated Values (CSV) File, Log File etc.
3. Unstructured Data
Unstructured Data sepenuhnya merupakan jenis yang berbeda yang tidak memiliki struktur
atau mengikuti aturan struktural model data. Bahkan tidak memiliki format yang konsisten
dan biasanya bervariasi terus. Tetapi, jarang ada informasi terkait data dan waktu.
Example: Audio Files, Images etc.

Ilustrasi Jenis Data (Structured, Semi-Structured, Unstructured)


Karakteristik Big Data

1. Volume (Jumlah)
Volume mengacu pada jumlah informasi yang sangat banyak yang dihasilkan setiap detik dari
media sosial, ponsel, mobil, kartu kredit, sensor M2M, gambar, video, dan yang lainnya. Saat
ini, yang sering digunakan yaitu system yang secara terdistribusi, untuk menyimpan data di
beberapa lokasi dan disatukan oleh Kerangka kerja perangkat lunak seperti Hadoop.

Misal, Facebook sendiri dapat menghasilkan sekitar 300 juta foto yang diunggah per hari, dan
Setiap menit ada 510.000 komentar yang diposting dan 293.000 status diperbarui [3].
Sejumlah besar data hanya dapat ditangani oleh Big Data Technologies.

2. Variety (Jenis)
Seperti yang didiskusikan sebelumnya, Big Data dihasilkan dalam beberapa jenis.
Dibandingkan dengan data tradisional seperti nomor telepon dan alamat, tren data terbaru
dalam bentuk foto, video, dan audio dan banyak lagi, membuat sekitar 80% dari data menjadi
sepenuhnya tidak terstruktur.

Data terstruktur hanya bagaikan puncak dari gunung es.

Ilustrasi Perbandingan tiap Jenis Data saat ini

3. Veracity (Ketelitian)
Veracity pada dasarnya berarti tingkat keandalan yang ditawarkan data. Karena sebagian
besar data tidak terstruktur dan tidak relevan, Big Data perlu menemukan cara alternatif
untuk memfilternya atau menerjemahkannya karena data sangat penting dalam
pengembangan bisnis.

4. Value (Nilai)
Value adalah masalah utama yang perlu kita fokuskan. Bukan hanya jumlah data yang
disimpan atau proses. Ini sebenarnya adalah jumlah data yang berharga, andal dan dapat
dipercaya yang perlu disimpan, diproses, dianalisis untuk menemukan insight.

5. Velocity (Kecepatan)
Yang terakhir tetapi tidak kalah pentingnya, Velocity memainkan peran utama dibandingkan
dengan yang lain, tidak ada gunanya berinvestasi begitu banyak hingga akhirnya menunggu
data. Jadi, aspek utama dari Big Dat adalah untuk menyediakan data sesuai permintaan dan
dengan kecepatan yang lebih cepat.
Ilustrasi Karakteristik Big Data

Kelebihan Big Data

Jika kita menggunakan solusi BigData untuk menyimpan, mengelola, memproses, dan menampilkan
Data, kita akan mendapatkan kelebihan berikut:

 Simpan Data dari semua jenis dan ukuran dengan biaya rendah
 Menyimpan, Memproses, dan Mengelola Data dengan Efisien.
 Memberikan cara yang hemat biaya untuk mengatur Data.
 Memberikan Solusi Kinerja Yang Lebih Baik
 Memberikan Solusi Yang Dapat Dikukur
 Menghasilkan Nilai Bisnis yang Tepat
 Meningkatkan produktivitas
 Tingkatkan Keuntungan

Use Case Big Data

Sebagian besar organisasi menggunakan atau pindah ke BigData. Berikut beberapa Organisasi populer
yang menggunakan dan mendapat manfaat dari Solusi Big Data.

 Facebook
Facebook adalah salah satu WebSite Jejaring Sosial yang populer. Di seluruh dunia, Sekitar
1000 juta pengguna menggunakan Aplikasi Facebook. Ini mengumpulkan sekitar 500TB (Tera
Bytes) per Hari dari Langganan Pengguna, Suka Pengguna, Posting, Informasi Hubungan,
Audio, Video, Gambar dll.
 Google
Google juga menggunakan BigData Cloud Platform mereka untuk mengatur data aplikasi
mereka seperti Gmail, Google+, Google Search Engine, YouTube dll.
 eBay dan Amazon
Dua raksasa belanja online terkenal di dunia: eBay dan Amazon juga menggunakan solusi
BigData untuk mengatur Data Pelanggan mereka, informasi produk dll.
 Industri Penerbangan
Banyak Airlines (Misalnya: - British Airways, Singapore Airlines dll.) Hari ini menggunakan
solusi BigData untuk menyimpan dan mengatur informasi pesawat terbang dan pelanggan
mereka.
 Yahoo
Yahoo juga menggunakan solusi BigData Cloud Platform mereka untuk mengatur data aplikasi
mereka seperti Yahoo Mail, Yahoo Search Engine, Flickr dll.

Implementasi Big Data pada Kasus Pandemi COVID-19

Pada 2011, Jon Crowcroft dan Eiko Yoneki, ilmuwan di Universitas Cambridge, membuat aplikasi yang
melacak penyebaran influenza [5]. Alat ini, yang dikenal sebagai FluPhone, menetapkan prinsip-prinsip
desain yang kemudian digunakan dalam pengembangan aplikasi baru yang telah membantu Cina,
Singapura, dan Korea Selatan berhasil mengatasi pandemi COVID-19.

Salah satu cara untuk mencegah pandemi global adalah dugaan, yang membutuhkan isolasi kasus
awal. Aplikasi ini mencoba mengidentifikasi semua orang yang telah terinfeksi oleh orang yang
terinfeksi dan mengisolasi semua individu yang "diduga". Strategi ini membutuhkan alat pengujian
yang baik (yang harus dikembangkan untuk setiap virus dengan kecepatan penuh setelah
diidentifikasi) dan aplikasi seluler atau yang dapat dipakai yang melacak kontak secara otomatis
berdasarkan jarak perangkat. Dengan data besar semacam ini, semua individu yang diduga dapat
dilacak atau diisolasi [4].

Selain itu ada tiga bentuk penggunaan utama Big Data hingga saat ini: (1) perencanaan strategis; (2)
pelacakan individu (kemungkinan terinfeksi); dan (3) pemberian nasihat kepada orang-orang yang
peduli dan mungkin terinfeksi [6].

Perencanaan strategis

Salah satu penggunaan Big Data yang paling cepat dan paling menjanjikan dalam memerangi COVID-
19 adalah sebagai alat prediksi, analisis, dan perencanaan strategis untuk pemerintah nasional dan
otoritas kesehatan nasional.

Fitur umum dari semua penggunaan strategis Big Data ini adalah bahwa mereka umumnya tidak
bergantung pada data yang dapat diidentifikasi secara pribadi, atau menggunakan data anonim. Ini
menghindari sebagian masalah privasi.

Pelacakan individu

Taiwan pada umumnya dianggap telah menerapkan langkah-langkah efektif untuk mengandung
COVID-19, meskipun merupakan salah satu negara yang pada awalnya dianggap paling berisiko.
Mereka telah belajar pelajaran berharga dari epidemi sindrom pernapasan akut (SARS) pada tahun
2003, dan mendapat manfaat dari kesiapsiagaan tingkat tinggi.

Salah satu perangkat tindakan yang paling efektif adalah sistem untuk melacak individu yang diduga
terinfeksi. Pada awal 27 Januari, lembaga pemerintah yang bertanggung jawab mengintegrasikan data
tentang 14 hari perjalanan sejarah orang yang dianggap berisiko karena riwayat perjalanan mereka,
dengan informasi yang terkait dengan kartu identifikasi kesehatan mereka. Individu yang berisiko
tinggi karena perjalanan baru-baru ini ke daerah yang terkena dampak dipantau secara elektronik
melalui ponsel mereka. Semua rumah sakit, klinik, dan apotek di Taiwan diberi akses ke riwayat
perjalanan pasien potensial dan actual [8] [9].

Nasihat untuk orang yang mungkin terinfeksi

Berbeda dengan cerita-cerita yang relatif sukses ini, pengumuman situs web yang ceroboh untuk
"memperluas pengujian untuk virus" oleh Presiden Trump pada 13 Maret jelas menunjukkan perlunya
mengelola ekspektasi dengan baik dan untuk mengatasi kemungkinan masalah dalam persepsi. Dalam
konferensi pers, Trump salah mengatakan bahwa Google akan menyediakan situs web untuk
memungkinkan diagnosis COVID-19 pada skala. Trump tampaknya merujuk pada proyek percontohan
kecil untuk wilayah San Francisco yang sedang dikerjakan oleh Verily, anak perusahaan ilmu kehidupan
dari perusahaan induk Google, Alphabet. Pekerjaan ini pada tahap yang sangat awal. Pengumuman
Trump jauh dari sasaran sehingga Google merasa berkewajiban untuk mengeluarkan koreksi /
pencabutan segera [7].

Source :

[1] https://www.edureka.co/blog/big-data-characteristics/
[2] https://www.journaldev.com/8734/introduction-to-bigdata
[3] https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-
every-day-the-mind-blowing-stats-everyone-should-read/#88d49a460ba9
[4] https://www.ie.edu/business-school/news-and-events/whats-going-on/big-data-artificial-
intelligence-can-help-covid-19/
[5] https://www.cam.ac.uk/research/news/fluphone-disease-tracking-by-app
[6] https://www.bruegel.org/2020/03/big-data-versus-covid-19-opportunities-and-privacy-
challenges/
[7] https://www.nytimes.com/2020/03/14/us/politics/trump-google-
coronavirus.html?action=click&module=RelatedLinks&pgtype=Article.
[8] https://spectrum.ieee.org/the-human-os/biomedical/devices/big-data-helps-taiwan-fight-
coronavirus.
[9] https://jamanetwork.com/journals/jama/fullarticle/2762689.
[10] Buyya, R., Calheiros, Rodrigo N., 2016. Big Data Principles and Paradigms.

Anda mungkin juga menyukai