Big Data merupakan merupakan istilah untuk menggambarkan
data set yang besar baik Structured, Semi-Structured maupun
Unstructured data . Sedangkan menurut Alamsyah (2016) Big Data merupakan kumpulan data yang sangat besar atau kompleks jika menggunakan pemrosesan data tradisional. Tantangan dalam Big Data ialah menganalisis data, meng-kurasi data, sharing, storage, transfer, dan visualization.
Oleh karena itu, Big Data adalah kemampuan untuk mengelola
data dengan volume besar yang berbeda dengan kecepatan yang tepat, dan dalam dalam kerangka waktu yang tepat memungkinkan analisis dan reaksi secara langsung. Big Data juga dapat didefinisikan dalam 4V yaitu (Alamsyah, 2016): • Volume, berarti data set yang disimpan dalam skala yang besar; • Velocity, berarti ada kebutuhan mengakses data set tersebut dengan cepat; • Variety, berarti format datanya yang bervariasi; • Veracity, berarti datanya yang sangat besar membuat ketidakpastian sehingga sulit membedakan mana data yang berbobot dan tidak. • Big Data awalnya hanya terkait dengan 3V, yakni Volume (ukuran data sangat besar), Velocity (kecepatan transfer/perubahan data sangat tinggi), dan Variety (variasi atau jenis data sangat banyak). Akan tetapi, mengalami perubahan yang menjadikan 4V, ditambah Value, karena sangat besarnya nilai bisnis yang dihasilkan, sehingga menjadi besar pula peluang kerja bagi profesional di bidang pemrograman komputer, pengolahan data statitisk, dan cloud computing.