Anda di halaman 1dari 6

Comparative Critical Review on 5V’s of Big Data Infastructure

Alif Dewantoro1, Maulana Iman Pratama2, Gray Zein Syah Putra3


Magister Teknik Informatika, Fakultas Ilmu Komputer, Universitas Amikom Yogyakarta
Jl.Ringroad Utara, Condongcatur, Depok, Sleman, Yogyakarta
1
alif17dewantoro@gmail.com ,2 maulanaipratama98@gmail.com, 3 gryzein@gmail.com

Pendahuluan
Latar belakang dan Tujuan
Big data merupakan kumpulan data yang terstruktur maupun tidak terstruktur.
Untuk sebuah kumpulan data dapat disebut sebagai big data, kumpulan data tersebut
harus memiliki karakteristik yang dimiliki big data. Dalam perkembangannya,
karakteristik dari big data selalu berubah-ubah seiring berjalannya waktu.
Dalam artikel [4] di jelaskan bahwa karakteristik big data dapat berupa 3V hingga
10V. Diluar karakteristik tersebut, ada pun karakteristik lain yang dapat di
pertimbangkan untuk menjadi karakteristik dari sebuah big data. Di dalam artikel [2] juga
disebutkan kandidat karakteristik big data yang memungkinkan untuk dimasukan dalam
karakteristik dalam waktu dekat antara lain Vagueness, Valor, Vane, Vanila, dan
lain-lain.
Dalam penjelasan di artikel [6] yang berjudul “Understanding The Vs of Big Data”,
karakteristik big data yang digunakan dalam organisasi adalah 5V. Secara singkat
karakteristik yang disebut adalah:
● Volume: Menampung data yang dihasilkan dalam suatu sistem dalam jumlah
sangat banyak.
● Value: Data yang ditampung merupakan data penting yang dapat memiliki arti
tertentu.
● Veracity: Data yang ditampung merupakan data yang dapat dipercaya
kebenarannya.
● Variety: Data yang disimpan dalam struktur yang tidak tentu. Struktur data dapat
terstruktur, semi-terstruktur atau sama sekali tidak terstruktur.
● Velocity: Sebuah big data harus dapat mengumpulkan, menganalisa, dan
memproses data secara cepat untuk meningkatkan efisiensi.
Banyaknya perbedaan sudut pandang dalam karakteristik big data ini dapat
menyebabkan kebingungan dalam pembangunan sebuah big data infrastructure. Dalam
review ini akan membahas V lain yang memungkinkan dalam karakteristik big data dan
menentukan apakah karakteristik tersebut sangat diperlukan dalam menentukan big
data. Hasil dari review ini diharapkan dapat digunakan dalam mempercepat dan
meningkatkan pembangunan big data.

Pembahasan dan Hasil


Sejarah
Saat ini big data telah menjadi kata kunci dalam industri teknologi. Karena
banyak munculnya teknologi baru dan semua perangkat saat ini telah saling
terintegrasi, diperkirakan akan banyak data yang dihasilkan. Tantangan dalam
menangani (memproduksi, mengumpulkan dan menyimpan) jumlah data yang sangat
besar yang belum terjadi sebelumnya.

Big data dapat didefinisikan sebagai kumpulan data yang ukuran atau jenisnya di
luar kemampuan database relasional untuk menangkap, mengelola dan memproses
data dengan low latency [7]. Sumber data menjadi lebih kompleks dari pada sumber
data biasa karena adanya artificial intelligence (AI), smartphone, media sosial, dan IoT
yang dihasilkan secara real-time serta dalam skala yang sangat besar.

Pada tahun 2001, ada tiga dimensi (3V) utama yang dihadapi oleh sistem
manajemen data yaitu volume, velocity dan variety. IMB mendefinisikan karakteristik big
data 4V dengan menambahkan veracity. Pada tahun 2014 dimasukkan karakteristik
baru yaitu value untuk memperluas model menjadi 5V. Akan tetapi IBM menggunakan
3V (volume, velocity dan variety) pada tahun 2021. Karakteristik V dalam big data belum
final, bisa akan bertambah dan berkurang, misalnya 3V pada 2001, 4V pada 2012, 7V
pada 2013, 6V pada 2013, 5V pada 2013, 10V pada 2014, 8V pada 2014, 4V lagi pada
2015 dan 7V lagi pada 2018. [2]
Perbandingan
Dalam berbagai artikel yang dirujuk [1] [2] [3] [4] [5] [6] memiliki beberapa sudut
pandang yang berbeda dalam penggunaan karakteristik big data. Dalam bentuk tabel
dapat dijabarkan seperti berikut.

Referensi Penerapan V Penjelasan karakteristik big


data

[1] 5V (1) Volume, (2) Velocity, (3)


Variety, (4) Veracity, (5) Value

[2] 3V, 5V, 7V (1) Volume, (2) Velocity, (3)


Variety, (4) Veracity, (5) Value,
(6) Variability, (7) Visualization

[3] 3V (1) Volume, (2) Velocity, (3)


Variety

[4] 3V, 4V, 5V, 7V, 10V (1) Volume, (2) Velocity, (3)
Variety, (4) Veracity, (5) Value,
(6) Validity, (7) Volatility, (8)
Variability, (9) Visualization,
(10) Vulnerability.

[5] 5V (1) Volume, (2) Velocity, (3)


Variety, (4) Veracity, (5) Value

[6] 5V (1) Volume, (2) Velocity, (3)


Variety, (4) Veracity, (5) Value

Dalam artikel [1] karakteristik yang digunakan adalah 5V dikarenakan mengikuti


karakteristik atau komponen yang dijabarkan dalam framework Hadoop. Dalam artikel
tersebut juga dijelaskan teknik dan teknologi yang digunakan dalam framework Hadoop.

Dalam artikel [2] big data digunakan oleh machine learning. Dalam artikel
tersebut dijelaskan bahwa karakteristik utama dari sebuah big data adalah 3V (Volume,
Velocity, dan Variety) tetapi terkadang ditambah karakteristik keempat dan kelima yaitu
Veracity dan Valence. Seiring perubahan tahun, jumlah dan jenis dari karakteristik terus
berubah. Sehingga penulis artikel menggeneralisasikan karakteristik menjadi 7V
(Volume, Velocity, Variety, Veracity, Value, Variability, dan Visualization).

Pada artikel [3] membahas tentang perbandingan karakteristik umum 3V


(Volume, Velocity, dan Variety) dengan karakteristik yang disediakan Kitchin. Penelitian
menggunakan 26 dataset untuk melihat apakah keseluruhan karakteristik ada dalam
dataset yang ditentukan. Artikel tersebut menyimpulkan bahwa “velocity” dan
“exhaustivity” adalah karakteristik terpenting dalam big data.

Pada artikel [4] menjelaskan tentang karakteristik big data dari 3V-10V. Secara
garis besar karakteristik dibagi menjadi 3V, 4V, 5V, 7V, dan 10V. Karakteristik yang
dimasukkan adalah Volume, Velocity, Variety, Veracity, Value, Validity, Volatility,
Variability, Visualization, dan Vulnerability. Dari artikel ini dapat disimpulkan bahwa
karakteristik big data dari setiap sektor dapat berbeda-beda sesuai kebutuhan. Dalam
penggunaan karakteristik dapat bertambah sesuai dengan perlakuan dan kebutuhan
dari data itu sendiri.

Dalam artikel [5] menggunakan karakteristik 5V dalam big data untuk diterapkan
ke cloud computing. Kesimpulan dari artikel ini adalah setiap penerapan big data di
organisasi yang menerapkan IT memiliki karakteristik big data yang berbeda.

Dalam artikel [6] menjelaskan tentang karakteristik big data 5V secara singkat
dan padat. Penjelasan tentang implementasi dari karakteristik tidak dijabarkan dalam
artikel ini.
Hasil dan Kesimpulan
Hasil dan kesimpulan dari keenam artikel yang telah dibahas big data memiliki
data berukuran sangat besar, variatif, memiliki laju pertumbuhan yang cepat, variabel
sangat beragam yang sebagian besar tidak terstruktur dan kategori untuk
membedakannya adalah karakteristiknya. Dengan memanfaatkan karakteristik 3V’s
hingga 10V’s of big data infrastructure membuat proses menyimpan, mengolah dan
menganalisis data sehingga mempermudah dalam mengatasi ketidakakuratan data.
Penggunaan big data juga dapat diaplikasikan pada perusahaan infrastruktur maupun
industri primer. Pemanfaatan 3V’s hingga 10’Vs akan disesuaikan dengan kebutuhan
jenis sektor dalam mengelola data yang kompleks, adapun hanya menggunakan
sampai 5V’s untuk mengelola data yang sangat beragam dan laju pertumbuhan maupun
frekuensi perubahan sangat tinggi masih dapat teratasi dan mendukung, namun dalam
perkembangannya jika data dan teknologi semakin maju dan berkembang maka
karakteristik big data semakin diperlukan baik dari tiga, empat, lima hingga sepuluh V’s.
[4]
Daftar Pustaka
[1] Ishwarappa and J. Anuradha, “A brief introduction on big data 5Vs characteristics
and hadoop technology,” Procedia Comput. Sci., vol. 48, no. C, pp. 319–324, 2015.
[2] K. Tyagi and G. Rekha, “Machine Learning with Big Data” pp. 1011–1020, 2019.
[3] Kitchin and G. McArdle, “What makes Big Data, Big Data? Exploring the
ontological characteristics of 26 datasets,” Big Data Soc., vol. 3, no. 1, pp. 1–10,
2016.
[4] N. Saeed and L. Husamaldin, “Big Data Characteristics (V’s) in Industry,” Iraqi J.
Ind. Res., vol. 8, no. 1, pp. 1–9, 2021.
[5] M. T. Quasim, P. Johri, M. Meraj, And S. W. Haider, “5 V’s Of Big Data Via Cloud
Computing: Uses And Importance Big Data Security View Project 5 V’s Of Big Data
Via Cloud Computing: Uses And Importance,” Sci.Int.(Lahore), Vol. 31, No. 3, Pp.
367–371, 2019.
[6] S. Tip, “Understanding the V’s of Big Data,” Impact, 2016.
[7] “Big Data Analytics,” 2020. [Online]. Available:
https://www.ibm.com/analytics/hadoop/big-data-analytics. [Accessed: 16-Nov-2021].

Anda mungkin juga menyukai