Anda di halaman 1dari 19

Apa itu Big Data?

AGUSTUS 25, 2014TEKNOKERAS

Akhir-akhir ini istilah Big Data marak di gunakan sebagai teknologi yang akan
menjadi trend masa depan. Sebenarnya apa sih Big Data itu? Manfaat apa yang
diberikan oleh Big Data? Siapa saja yang sudah menggunakan dan mendapatkan
manfaat dari Big Data? Berikut sedikit ulasan tentang Big Data.

Big Data adalah sebuah teknologi baru di dunia teknologi informasi dimana
memungkinan proses pengolahan, penyimpanan dan analisis data dalam beragam
bentuk/format, berjumlah besar dan pertambahan data yang sangat cepat. Pengolahan
dan analisis data dalam jumlah sangat besar ini memerlukan waktu yang relatif jauh
lebih singkat dengan menggunakan Big Data dibanding teknologi data sebelumnya,
misalnya. database relational seperti MySQL.

Ciri-ciri data yang ditangani oleh Big Data:

1. Jumlah nya sangat besar (Volume). Biasanya ukuran total data dalam terabytes
keatas.
2. Pertumbuhan data sangat cepat (Velocity) sehingga data bertambah dalam jumlah
yang sangat banyak dalam kurun waktu relatif singkat.
3. Bentuk atau format datanya beraneka ragam (Variety). Format disini bisa berupa
data dalam tabel-tabel relasional database seperti MySQL, file text biasa, File
Excel atau bentuk apapun.
Manfaat yang bisa diberikan dari Big Data antara lain bisa memberikan gambaran
yang lebih lengkap dari sebelumnya karena biasanya data yang dianalisis adalah data
terstruktur misalnya data relasional database.

Contoh skenario dimana Big Data digunakan misalnya adalah pemanfaatan data dari
social media, twitter, facebook dsbnya dipadukan dengan data dari perusahaan sendiri
misalnya data dari penjualan atau data pelanggan yang sudah ada di relasional
database. Dengan demikian bisa didapatkan analisis untuk melakukan strategi
marketing yang jitu. Misalnya dengan menganalisis orang-orang di social media yang
berpengaruh untuk memasarkan produk.
Contoh real dimana Big Data benar-benar dinikmati manfaatnya adalah sebuah startup
bernama Klarna. Klarna adalah startup dari Swedia yang memberikan pelayanan
semacam micro financing untuk e-commerce. Yang ditawarkan Klarna adalah
pembeli online bisa langsung beli barang online tanpa membayar langsung. barang
akan dikirimkan ke alamat pembeli. Selanjutnya pembeli diberi waktu untuk
membayar barang jika dia sukai dengan barang yang dikirim atau mengembalikan
barang tersebut jika tidak disukai.

Nah bagaimana jika pembeli tersebut tidak bertanggung jawab dan tidak membayar
barang yang sudah dia terima? Disinilah Klarna memberikan solusi berbasis Big Data.
Klarna melakukan analisis terhadap data dari pembeli tersebut sehingga
meminimalkan resiko dimanan pembeli tidak membayar barang yang sudah dia
terima. Hasilnya Klarna tumbuh menjadi perusahaan micro financing besar untuk
pasar e-commerce di Eropa.

Sayangnya untuk Indonesia, berdasarkan survey beberapa perusaahn besar,


penggunaan Big Data masih belum optimal. Teknologi ini masih dianggap asing dan
belum dianggap akan memberikan hasil yang menguntungkan.
Apa Itu Big Data : Menyimak Kembali Definisi Big Data, Jenis Teknologi Big Data, dan Manfaat
Pemberdayaan Big Data

23 Januari 2016 21:02 Diperbarui: 23 Januari 2016 21:32 3005 1 1

Data adalah Emas

Pada pembukaan Press Conference on Open Data Strategy tahun 2011, Neelie Kroes, yang saat itu
menjabat sebagai Vice-Presicent of the European Commission responsible for the Digital Agenda,
menyampaikan pidatonya yang berjudul "Data is the New Gold". Pesannya adalah bahwa pada era
digital ini, data telah menjadi bagian yang sangat penting bagi peradaban manusia seperti halnya minyak
bumi, yang telah mendapat julukan black gold. Pernyataan tersebut disampaikan berdasar fakta bahwa
data telah menjadi sumber laba bagi para pelaku bisnis di dunia maya Internet. Mereka hidup dari data
yang mereka berdayakan.

Sejalan dengan pernyataan Neelie Kroes tersebut, kini, manajemen data bukan lagi hanya menjadi
kompetensi yang penting bagi suatu organisasi, melainkan telah menjadi bagian kritis yang berperan
sebagai penentu kemenangan dalam penguasaan pasar maupun dalam pencapaian misi. Saat ini,
perusahaan-perusahaan Fortune 1000 dan institusi-institusi pemerintah telah mulai memetik
keuntungan dari inovasi-inovasi yang telah dikembangkan oleh para pionir dalam bisnis web services.
Para decision maker pada organisasi-organisasi tersebut sedang berupaya untuk mengembangkan
inisiatif baru dan mengevaluasi strategi-strategi yang mereka miliki demi menemukan cara bagaimana
mereka dapat memanfaatkan Big Data untuk mengembangkan bisnisnya. Dalam proses tersebut,
mereka pun belajar untuk memahami apa itu Big Data; mulai dari definisi Big Data, jenis-jenis teknologi
Big Data, manfaat yang mungkin diperoleh dari implementasi teknologi Big Data, hingga bagaimana
memilih teknologi Big Data yang tepat bagi kebutuhan mereka.

Mengingat kembali Definisi Big Data

Untuk membahas apa itu Big Data, baiknya dimulai dari kesepakatan tentang definisi Big Data itu
sendiri. Big Data bukanlah sebuah teknologi, teknik, maupun inisiatif yang berdiri sendiri. Big Data
adalah suatu trend yang mencakup area yang luas dalam dunia bisnis dan teknologi. Big Data menunjuk
pada teknologi dan inisiatif yang melibatkan data yang begitu beragam, cepat berubah, atau berukuran
super besar sehingga terlalu sulit bagi teknologi, keahlian, maupun infrastruktur konvensional untuk
dapat menanganinya secara efektif. Dengan kata lain, Big Data memiliki ukuran (volume), kecepatan
(velocity), atau ragam (variety) yang terlalu ekstrim untuk dikelola dengan teknik konvensional.

Big Data melibatkan proses pembuatan data, penyimpanan, penggalian informasi, dan analisis yang
menonjol dalam hal volume, velocity, dan variety.
1. Volume (Ukuran). Pada tahun 2000 lalu, PC biasa pada umumnya memiliki kapasitas penyimpanan
sekitar 10 gigabytes. Saat ini, Facebook menyedot sekitar 500 terabytes data baru setiap harinya;
sebuah pesawat Boeing 737 menghasilkan sekitar 240 terabytes data penerbangan dalam satu
penerbangan melintasi Amerika; makin menjamurnya penggunaan ponsel pintar (smartphone),
bertambahnya sensor-sensor yang disertakan pada perangkat harian, akan terus mengalirkan jutaan
data-data baru, yang terus ter-update, yang mencakup data-data yang berhubungan dengan lingkungan,
lokasi, cuaca, video bahkan data tentang suasana hati si pengguna ponsel pintar.

2. Velocity (kecepatan). Clickstreams maupun ad impressions mencatat perilaku pengguna Internet


dalam jutaan event per detik; algoritma jual-beli saham dalam frekwensi tinggi dapat mencerminkan
perubahan pasar dalam hitungan microseconds; proses-proses yang melibatkan hubungan antara suatu
mesin dengan mesin lainnya telah melibatkan pertukaran data antar jutaan perangkat; peralatan sensor
dan perangkat-perangkat pada infrastruktur menghasilkan log data secara real time; sistem game online
dapat melayani jutaan pengguna secara bersamaan, yang masing-masing memberikan sejumlah input
per detiknya.

3. Variety (ragam). Big Data tidak hanya menyangkut data yang berupa angka-angka, data tanggal, dan
rangkaian teks. Big Data juga meliputi data-data ruang / geospatial, data 3D, audio dan video, dan data-
data teks tak berstruktur termasuk file-file log dan media sosial. Sistem database tradisional didesain
untuk menangani data-data berstruktur, yang tak terlalu sering mengalami update atau updatenya
dapat diprediksi, serta memiliki struktur data yang konsisten yang volumenya tak pernah sebesar Big
Data. Selain itu, sistem database tradisional juga didesain untuk digunakan dalam satu server yang
berdiri sendiri, yang berakibat pada keterbatasan dan mahalnya biaya untuk peningkatan kapasitas,
sedangkan aplikasi sudah dituntut untuk mampu melayani pengguna dalam jumlah yang jauh lebih
besar dari yang pernah ada sebelumnya. Dalam hal ini, database Big Data seperti halnya MongoDB
maupun HBase, dapat memberikan solusi yang feasible yang memungkinkan peningkatan profit
perusahaan secara signifikan.

Singkatnya, Big Data menggambarkan kumpulan data yang begitu besar dan kompleks yang tak
memungkinkan lagi untuk dikelola dengan tools software tradisional.

Jenis Teknologi Big Data : Big Data Operasional dan Big Data Analitis

Dalam hal Teknologi, bentangan Big Data didominasi oleh dua jenis teknologi Big Data yaitu: (1) Big Data
operasional: sistem yang memiliki kapabilitas operasional untuk pekerjaan-pekerjaan bersifat interaktif
dan real time dimana data pada umumnya diserap dan disimpan; (2) Big Data analitis: sistem yang
menyediakan kapabilitas analitis untuk mengerjakan analisis yang kompleks dan retrospektif yang dapat
melibatkan sebagian besar atau bahkan keseluruhan data. Dalam keberadaannya, kedua jenis teknologi
Big Data ini bersifat saling melengkapi dan sering digunakan secara bersamaan.

Beban kerja operasional dan analitis terhadap Big Data telah menyebabkan kebutuhan sistem yang
berlawanan satu sama lain, dan sistem Big Data saat ini telah berevolusi untuk menangani kedua jenis
kerja tersebut secara khusus, terpisah, dan dengan cara yang sangat berbeda. Baik kebutuhan kerja
operasional maupun analitis untuk Big Data, masing-masing telah mendorong penciptaan arsitektur-
arsitektur teknologi baru. Sistem operasional, seperti halnya NoSQL database, berfokus pada pelayanan
terhadap permintaan akses yang tinggi yang terjadi dalam waktu bersamaan, dengan tetap memberikan
respon yang seketika (low latency) terhadap permintaan akses tersebut. Akses data terhadap sistem
operasional ini dapat dilakukan dengan berbagai pilihan kriteria. Dilain pihak, sistem analitis cenderung
berfokus pada penanganan arus data yang lebih besar, query-query yang ditujukan pada data tersebut
bisa sangat kompleks, dan setiap kali dieksekusi dapat melibatkan sebagian besar atau keseluruhan data
yang ada dalam sistem. Baik sistem Big Data operasional maupun sistem Big Data analitis, kedua-duanya
dioperasikan dengan melibatkan sejumlah servers yang tergabung dalam suatu cluster komputer, dan
digunakan untuk mengelola puluhan atau ratusan terabytes data yang memuat miliaran record.

Teknologi Big Data Operasional

Untuk menangani pekerjaan-pekerjaan Big Data Operasional, telah dibangun sistem Big Data dengan
database NoSQL seperti halnya database berbasis dokumen (document based database) yang dapat
ditujukan untuk berbagai tipe aplikasi, database key-value stores, column family stores, dan database
graph yang dioptimalkan untuk aplikasi yang lebih spesifik. Teknologi NoSQL, yang telah dikembangkan
untuk mengatasi kekurangan dari database relasional (relational database) pada lingkungan komputasi
modern, dikenal lebih cepat serta lebih mudah dan murah dalam hal peningkatan skala (more scalable)
dibanding relational databases.

Terlebih lagi, sistem Big Data dengan database NoSQL telah didesain untuk memanfaatkan keunggulan
dari arsitektur cloud computing (komputasi awan) yang telah muncul dalam dekade terakhir ini. Hal ini
memungkinkan dijalankannya komputasi berskala besar secara efisien dan dengan biaya yang relatif
lebih murah. Sebagai hasilnya, sistem NoSQL dengan komputasi awan ini telah menjadikan perangkat
kerja Big Data operasional lebih mudah dikelola, serta dapat diimplementasikan dengan lebih murah dan
cepat.

Teknologi Big Data Analitis

Dilain pihak, pekerjaan-pekerjaan Big Data analitis cenderung diproses dengan mengimplementasikan
sistem database MPP dan MapReduce. Munculnya teknologi ini juga merupakan reaksi terhadap
keterbatasan dan kurangnya kemampuan relational database tradisional untuk mengelola database
dalam skala lebih dari satu server (terdistribusi). Disamping itu, MapReduce juga menawarkan metode
baru dalam menganalisa data yang dapat berfungsi sebagai pelengkap terhadap kapabilitas SQL.

Dengan semakin populernya penggunaan berbagai jenis aplikasi dan para penggunanya terus menerus
memproduksi data dari pemakaian aplikasi tersebut, terdapat sejumlah upaya analisa retrospektif yang
benar-benar dapat memberikan nilai berarti terhadap kemajuan bisnis. Ketika upaya-upaya tersebut
mesti melibatkan algoritma yang lebih rumit, MapReduce telah menjadi pilihan pertama untuk
melakukan analisa retrospektif tersebut. Beberapa sistem NoSQL juga menyediakan fungsi MapReduce
bawaan yang memungkinkan proses analisa diterapkan pada data operasional. Sebagai alternatif lain,
data juga dapat dikopi dari sistem NoSQL ke dalam sistem analitis seperti halnya Hadoop dengan
MapReduce-nya.

Manfaat Pemberdayaan Big Data

Serangkaian teknologi baru yang ditujukan untuk memberdayakan Big Data telah memungkinkan
direalisasikannya suatu nilai dari Big Data. Sebagai contoh, pebisnis retail online dapat mempelajari
perilaku para pengunjungnya berdasarkan data hasil web click tracking. Dengan mengetahui perilaku
konsumen maupun calon konsumennya, maka dimungkinkan untuk menerapkan strategi baru guna
meningkatkan penjualan, mengatur harga dan stok barang secara efisien. Institusi pemerintah maupun
Google dapat mendeteksi timbulnya suatu wabah penyakit dengan memanfaatkan informasi yang
mengalir di media sosial. Perusahaan minyak dan gas dapat menggunakan output dari sensor-sensor
pada peralatan pengeboran untuk menemukan teknik pengeboran yang lebih aman dan efisien.

Jadi, dengan mendayagunakan database Big Data, operasional perusahaan dapat melakukan
penghematan pengeluaran, meningkatkan keuntungan, dan mencapai sasaran-sasaran bisnis lainnya.
Dalam hal ini paling tidak, ada 3 hal yang dapat diraih oleh perusahaan yang menerapkan teknologi Big
Data, yakni:

1. Membuat aplikasi baru. Big Data memungkinkan suatu perusahaan untuk mengumpulkan data-data
real time dari produk-produk yang mereka pasarkan, dari sumber daya yang digunakan, dan data-data
yang berkaitan dengan pelanggannya. Data-data ini dapat dimanfaatkan untuk mengoptimalkan
kepuasan pelanggan ataupun untuk efisiensi penggunaan sumber daya. Sebagai contoh, sebuah kota
besar di Amerika Serikat telah menggunakan MongoDB, sebuah document based NoSQL database,
untuk menurunkan angka kejahatan dan meningkatkan pelayanan umum dengan mengumpulkan dan
menganalisa data geospatial secara real-time dari 30 departemen yang berbeda.

2. Meningkatkan efektifitas dan menurunkan biaya dari aplikasi yang telah ada. Teknologi Big Data dapat
menggantikan sistem berspesifikasi tinggi yang mahal dengan sistem yang dapat dijalankan dengan
spesifikasi standar. Disamping itu, karena banyak teknologi Big Data yang sifatnya open source, tentu
mereka dapat diimplementasikan dengan biaya yang lebih murah dibandingkan teknologi yang hanya
dimiliki dan dijual oleh suatu perusahaan.

3. Meningkatkan loyalitas pelanggan. Dengan semakin banyaknya data yang bisa diakses oleh berbagai
bagian dalam suatu organisasi, juga dengan semakin cepatnya update yang dilakukan pada data-data
tersebut, akan memungkinkan respon yang makin cepat dan akurat pula terhadap berbagai permintaan
pelanggan.

Kesimpulan
Data adalah emas. Organisasi manapun yang mengusai emas, dapat dipastikan kekayaan dan kekuasaan
ada ditangannya. Begitu juga halnya dengan data. Namun demikian, seperti halnya emas, data mesti
digali, diproses dan dianalisa dengan serentetan teknologi tertentu demi mendapatkan nilai yang
berharga dari lautan data pada era digital sekarang ini. Lautan data tersebut kemudian dikenal dengan
istilah Big Data, kumpulan data yang begitu besar dan kompleks yang tak memungkinkan lagi untuk
dikelola dengan tools software tradisional. Terdapat dua type teknologi untuk memberdayakan Big data,
yaitu: (1) teknologi untuk memproses Big Data demi kebutuhan operasional, yakni: database NoSQL
(MongoDB, HBase, ...), dan (2) teknologi untuk memproses Big Data guna kebutuhan analitis seperti
halnya Hadoop. Dengan mengimplementasikan kedua type teknologi Big Data ini, akan memungkinkan
didapatkannya nilai-nilai baru yang dapat memberikan manfaat pada operasional perusahaan berupa
penghematan pengeluaran, peningkatan keuntungan, dan pencapaian sasaran-sasaran bisnis lainnya.

Referensi: Tulisan asli saya di "Catatan Akhir Pekan Seputar Teknologi Big Data untuk Mendorong
Pemberdayaan Big Data di Indonesia"

Bagaimana Pengertian Big Data


0

1309

Share on Facebook

Tweet on Twitter
Pengertian Big Data adalah sebagai kumpulan data yang memiliki karakteristik volume,
velocity, variety yang kompleks, sehingga membutuhkan kemampuan untuk menangkap,
memproses, menyimpan, mengelola, dan menganalisis data tersebut. Ketiga karakteristik
tersebut biasa disebut dengan 3V:

 Volume: Big Data memiliki jumlah yang sangat besar. Ukuran Big Data dapat
mencapai milyaran baris dan jutaan kolom, bahkan lebih.
 Velocity: Big Data dihasilkan dan tumbuh dengan sangat cepat. Hal ini menyebabkan
pemrosesan dan analisis terhadap Big Data harus dilakukan secara real time.
 Variety: Big Data memiliki tipe dan struktur data yang kompleks. Big Data
dihasilkan dari berbagai sumber data dengan format dan struktur yang beraneka
ragam.

Ketika karakteristik di atas merupakan hal utama dalam menentukan pengertian Big Data.
Dalam perkembangannya para peneliti, akademisi, praktisi, dan konsultan menambahkan ‘V’
lainnya dalam menentukan ciri-ciri dari Big Data, diantaranya, Veracity, Variability,
Visualisasi, dan Value.

 Veracity merupakan ambiguitas data dimana data yang kita miliki masih penuh
ketidakpastian tentang validitasnya.
 Variability yaitu kontinuitas perubahan data yang terjadi secara terus menerus.
 Visualisasi sangat penting dalam menghadirkan data yang dapat dimengerti secara
lebih mudah.
 Value, dimana data pada akhirnya harus menciptakan suatu nilai bagi perusahaan
atau organisasi.

Pada tahun 2010, Eric Schmidt berbicara pada konferensi Techonomy di Lake Tahoe, California
dan dia menyatakan bahwa, “terdapat exabytes informasi yang dibuat oleh seluruh dunia di
antara awal peradaban dan tahun 2003. Sekarang jumlah yang sama tersebut dibuat setiap dua
hari.” Karakteristik serta pengertian Big Data tersebut mengisyaratkan bahwa suatu organisasi
akan membutuhkan arsitektur data, analytic sandboxes, tools, teknologi, dan metode analitik
yang baru. Cara-cara lama dalam mengolah data harus digantikan dengan cara-cara baru
mengingat adanya tujuh ‘V’ di atas. Selain itu, juga diperlukan integrasi dari berbagai keahlian
dalam suatu tim Data Science.

Saat ini, Big Data serta perlunya analisis lanjutan dalam dunia industri dan pemerintahan
menjadi topik yang sering diperbincangkan. Ketersediaan sumber data baru dan munculnya
algoritme analisis yang kompleks menjadikan kita perlu berpikir kembali mengenai arsitektur
data yang memungkinkan untuk melakukan analisis data.

Dari waktu ke waktu, jumlah data bertambah dengan laju yang terus meningkat pula. Hal -hal
yang mendorong pertambahan jumlah data ini diantaranya mobile sensors, social media, video
surveillance, video rendering, smart grids, geophysical exploration serta medical imaging.
Beberapa industri telah mengumpulkan dan memanfaatkan data yang dimiliki, misalnya
perusahaan kartu kredit selalu memonitor transaksi nasabahnya, kemudian menemukan rule
untuk mendeteksi adanya transaksi anomali yang mengindikasikan kecurangan atau penipuan.
Tahun 2011, McKinsey pada seminar Big Data: The Next Frontier For Innovation,
Competition, and Productivity, mengatakan bahwa pada tahun 2018 Amerika serikat sendiri
akan menghadapi kekurangan 140.000-190.000 Data Scientist dan juga 1,5 juta Data Managers.
Data Scientist seperti layaknya ilmuwan, melakukan eksperimen-eksperimen untuk menemukan
hal-hal baru yang nantinya bermanfaat untuk perusahaan. hal-hal baru ini bisa jadi merupakan
pola-pola yang tidak umum terjadi atau tidak umum diketahui oleh perusahaan sejenis. Dengan
menemukan pola-pola baru inilah, perusahaan bisa mendapatkan keuntungan dibanding
kompetitor mereka. Seringkali, kemenangan dalam persaingan bisnis ditentukan oleh
kemampuan Data Scientist yang menganalisa sebuah data. Contoh pola yang dicari Data
Scientist misalnya pola atau model rekomendasi item yang biasa digunakan di website e -
commerce seperti Amazon atau misalnya seperti Netflix. Pola atau model rekomendasi ini
meskipun namanya sama tentunya berbeda dari satu perusahaan ke perusahaan lainnya karena
karakteristik konsumennya, jenis barang yang ditawarkan. Data Scientist ini juga diharapkan
mampu menjembatani kesenjangan antara Teknologi Informasi (TI), data, dan bisnis.

Dalam beberapa tahun terkahir, jumlah Startups Big Data terus berkembang dalam jumlah
besar, semua mencoba untuk menghadapi Big Data dan membantu organisasi-organisasi untuk
memahami Big Data dan semakin banyak perusahaan yang secara perlahan mengadopsi dan
bergerak ke arah Big Data. Walaupun Big Data telah ada sejak lama, faktanya Big Data ada
ketika internet ada pada tahun 1993. Revolusi Big Data ada di hadapan kita dan masih banyak
perubahan yang akan terjadi pada tahun-tahun mendatang.

Berkenaan dengan struktur data dalam Big Data, secara umum, struktur data dapat d ibagi
menjadi empat tipe besar.

 Structured Data. Data terdiri dati tipe data, format, dan struktur yang telah terdefinisi.
Tipe data ini dapat berupa data transaksional, OLAP data cubes, tradisional RDBMS,
file CSV, dan simple spread-sheets.
 Semi-Structured. Merupakan file data tekstual yang masih terlihat polanya, sehingga
dapat di-parsing menjadi structured data, misalnyaa XML.
 “Quasi” Structured. Data tekstual dengan format yang tidak menentu, dimana untuk
menjadikan structured data membutuhkan usaha, tools, dan waktu yang lebih.
 Unstructured Data. Data yang tidak memiliki struktur yang melekat. Unstructured
data dapat berupa dokumen teks, images, dan video.

Semoga artikel pengertian Big Data ini bermanfaat.

Memahami Definisi Big Data


Beberapa tahun belakangan ini, jika ditanyakan tentang apa yang sedang menjadi trend dalam dunia
Teknologi Informasi (TI), mungkin banyak yang akan menjawab "Cloud Computing". Tetapi, sejak awal
tahun 2011 muncul istilah "Big Data" yang kemudian menarik perhatian banyak profesional maupun
pemerhati Teknologi Informasi. Sejauh ini, perusahaan-perusahaan terkemuka telah memberdayakan
infomasi dan data dengan beragam teknologi manajemen data guna menunjang kemajuan bisnisnya.
Sebagian besar telah menggunakan tools seperti Data Warehouse (DWH) maupun Business
Intelligence (BI) serta aplikasi manajemen harga dan penjualan lainnya sebagai alat pengolah data
yang mereka perlukan dalam aktifitas bisnis.

Definisi Big Data


Jika diterjemahkan secara mentah-mentah maka Big Data berarti suatu data dengan kapasitas yang
besar. Sebagai contoh, saat ini kapasitas DWH yang digunakan oleh perusahaan-perusahaan di
Jepang berkisar dalam skala terabyte. Namun, jika misalnya dalam suatu sistem terdapat 1000
terabyte (1 petabyte) data, apakah sistem tersebut bisa disebut Big Data?

Satu lagi, Big Data sering dikaitkan dengan SNS (Social Network Service), contohnya Facebook.
Memang benar Facebook memiliki lebih dari 800 juta orang anggota, dan dikatakan bahwa dalam
satu hari Facebook memproses sekitar 10 terabyte data. Pada umumnya, SNS
seperti Facebook tidak menggunakan RDBMS(Relational DataBase Management System) sebagai
software pengolah data, melainkan lebih banyak menggunakan NoSQL. Lalu, apa kita bisa menyebut
sistem NoSQL sebagai Big Data?

Dengan mengkombinasikan kedua uraian diatas, dapat ditarik sebuah definisi bahwa Big Data adalah
"suatu sistem yang menggunakan NoSQL dalam memproses atau mengolah data yang berukuran
sangat besar, misalnya dalam skala petabyte". Apakah definisi ini tepat? Boleh dikatakan masih
setengah benar. Definisi tersebut masih belum menggambarkan Big Data secara menyeluruh. Big
Data tidak sesederhana itu,
Big Data memuat arti yang lebih kompleks sehingga perlu definisi yang sedikit lebih kompleks pula demi
mendeskripsikannya secara keseluruhan.

Mengapa butuh definisi yang lebih kompleks? Fakta menunjukkan bahwa bukan hanya NoSQL saja
yang mampu mengolah data dalam skala raksasa (petabyte). Beberapa perusahaan telah
menggunakan RDBMS untuk memberdayakan data dalam kapasitas yang sangat besar. Sebagai
contoh, Bank of America memiliki DWH dengan kapasitas lebih dari 1,5 petabyte, Wallmart
Stores yang bergerak dalam bisnis retail (supermarket) berskala dunia telah mengelola data
berkapasitas lebih dari 2,5 petabyte, dan bahkan situs auction (lelang) eBay memiliki DWH yang
menyimpan lebih dari 6 petabyte data. Oleh karena itu, hanya karena telah berskala petabyte saja,
suatu data belum bisa disebut Big Data. Sekedar referensi, DWH dengan kapasitas sangat besar
seperti beberapa contoh diatas disebut EDW(Enterprise Data Warehouse) dan database yang
digunakannya disebut VLDB(Very Large Database).

Memang benar, NoSQL dikenal memiliki potensi dan kapabilitas Scale Up (peningkatan kemampuan
mengolah data dengan menambah jumlah server atau storage) yang lebih unggul daripada RDBMS.
Tetapi, bukan berarti RDBMS tak diperlukan. NoSQL memang lebih tepat untuk mengolah data yang
sifatnya tak berstruktur seperti data teks dan gambar, namun NoSQL kurang tepat bila digunakan
untuk mengolah data yang sifatnya berstruktur seperti data-data numerik, juga kurang sesuai untuk
memproses data secara lebih detail demi menghasilkan akurasi yang tinggi. Pada kenyataannya,
Facebook juga tak hanya menggunakan NoSQL untuk memproses data-datanya, Facebook juga tetap
menggunakan RDBMS. Lain kata, penggunaan RDBMS dan NoSQL mesti disesuaikan dengan jenis
data yang hendak diproses dan proses macam apa yang dibutuhkan guna mendapat hasil yang
optimal.

Karakteristik Big Data : Volume, Variety, Velocity (3V)


Kembali ke pertanyaan awal, apakah sebenarnya Big Data itu? Sayang sekali, hingga saat ini masih
belum ada definisi baku yang disepakati secara umum. Ada yang mendeskripsikan Big Data sebagai
fenomena yang lahir dari meluasnya penggunaan internet dan kemajuan teknologi informasi yang
diikuti dengan terjadinya pertumbuhan data yang luar biasa cepat, yang dikenal dengan istilah ledakan
informasi (Information Explosion) maupun banjir data (Data Deluge). Hal ini mengakibatkan
terbentuknya aliran data yang super besar dan terus-menerus sehingga sangat sulit untuk dikelola,
diproses, maupun dianalisa dengan menggunakan teknologi pengolahan data yang selama ini
digunakan (RDBMS). Definisi ini dipertegas lagi dengan menyebutkan bahwa Big Data memiliki tiga
karakteristik yang dikenal dengan istilah 3V: Volume, Variety, Velocity. Dalam hal
ini, Volume menggambarkan ukuran yang super besar, Variety menggambarkan jenis yang sangat
beragam, dan Velocity menggambarkan laju pertumbuhan maupun perubahannya. Namun demikian,
definisi ini tentu masih sulit untuk dipahami. Oleh karena itu, uraian berikut mencoba memberikan
gambaran yang lebih jelas dan nyata berkaitan dengan maksud definisi Big Data tersebut.
Gambar 1. Big Data 3V

Gambar 1 menggambarkan 3 karakteristik Big Data. Gabungan dari ketiga karakteristik ini
menghasilkan data yang terlalu kompleks untuk ditangani dengan sistem konvensional.

Bukan Hanya Masalah Ukuran, Tapi Lebih pada Ragam

Kini jelas bahwa Big Data bukan hanya masalah ukuran yang besar, terlebih yang menjadi ciri
khasnya adalah jenis datanya yang sangat beragam dan laju pertumbuhan maupun frekwensi
perubahannya yang tinggi. Dalam hal ragam data, Big Data tidak hanya terdiri dari data berstruktur
seperti halnya data angka-angka maupun deretan huruf-huruf yang berasal dari sistem database
mendasar seperti halnya sistem database keuangan, tetapi juga terdiri atas data multimedia seperti
data teks, data suara dan video yang dikenal dengan istilah data tak berstruktur. Terlebih lagi, Big
Data juga mencakup data setengah berstruktur seperti halnya data e-mail maupun XML. Dalam hal
kecepatan pertumbuhan maupun frekwensi perubahannya, Big Data mencakup data-data yang
berasal dari berbagai jenis sensor, mesin-mesin, maupun data log komunikasi yang terus menerus
mengalir. Bahkan, juga mencakup data-data yang tak hanya data yang berada di internal perusahaan,
tetapi juga data-data di luar perusahaan seperti data-data di Internet. Begitu beragamnya jenis data
yang dicakup dalam Big Data inilah yang kiranya dapat dijadikan patokan untuk membedakan Big
Data dengan sistem manajemen data pada umumnya.

Fokus pada Trend per-Individu, Kecepatan Lebih Utama daripada Ketepatan


Hingga saat ini, pendayagunaan Big Data didominasi oleh perusahaan-perusahaan jasa berbasis
Internet seperti halnya Google dan Facebook. Data yang mereka berdayakan pun bukanlah data-data
internal perusahaan seperti halnya data-data penjualan maupun data pelanggan, lebih menitik
beratkan pada pengolahan data-data teks dan gambar yang berada di Internet. Bila kita melihat gaya
pemberdayaan data yang dilakukan oleh perusahaan-perusahaan pada umumnya, yang dicari
adalah trend yang didapat dari pengolahan data secara keseluruhan. Misalnya, dari data konsumen
akan didapat informasi tentang trend konsumen dengan memproses data konsumen secara
keseluruhan, bukan memproses data per-konsumen untuk mendapatkan trend per-konsumen. Dilain
pihak, perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big Data justru
memfokuskan pemberdayaan data untuk mendapatkan informasi trend per-konsumen dengan
memanfaatkan atribut-atribut yang melekat pada pribadi tiap konsumen. Sebut saja toko online
Amazon yang memanfaatkan informasi maupun atribut yang melekat pada diri per-konsumen, untuk
memberikan rekomendasi yang sesuai kepada tiap konsumen. Satu lagi, pemberdayaan data ala Big
Data ini dapat dikatakan lebih berfokus pada kecepatan ketimbang ketepatan.

Kesimpulan

Berdasar uraian diatas, dapat ditarik kesimpulan bahwa Big Data itu adalah limpahan data dengan
volume dan ragam yang melampaui kapasitas sistem manajemen data konvensional, yang terbentuk
dari meluasnya penggunaan internet maupun pemanfaatan teknologi informasi yang semakin
canggih, dan memiliki tiga ciri khas : volume, variety, velocity.

Home » Analisis Big Data » Analisis Data » Big Data » Apa itu Analisis Big Data dan Manfaat Penting Bagi Kemajuan Bisnis

BY MASTER GAMES TUESDAY, APRIL 19, 2016 ANALISIS BIG DATA ANALISIS DATA BIG DATA

Apa itu Analisis Big Data dan Manfaat Penting Bagi Kemajuan Bisnis
Analisis Big Data

Pada kesempatan kali ini saya coba membahas apa itu Analisis Big Data (Big Data Analytics) dan informasi lainnya
yang terkait dengan big data dan analisis.

Mengapa analisis big data ini menjadi sesuatu yang perlu diketahui oleh rekans atau perusahaan rekans?

Hal ini mengingat begitu besarnya potensi manfaat yang didapatkan jika rekans atau perusahaan rekans dapat
menerapkan analisis terhadap big data. Bagi rekans yang ingin tahu manfaat penting dari penggunaan analisis big data
serta informasi berharga lainnya, dapat melanjutkan untuk membaca artikel ini sampai selesai, karena akan saya
tunjukkan pada sub bab di bawah.

Sebagai permulaan, untuk kemudahan pemahaman dasar tentang apa itu analisis big data, saya akan memulai dengan
membahas tentang definisi analisis big data.

Pengertian Analisis Big Data


Untuk mengerti definisi analisis big data, kita tidak bisa lepas dari memahami apa itu big data dan apa itu analisis
data. Istilah big data telah saya bahas khusus pada artikel berikut ini, namun saya akan coba berikan overview singkat
tentang big data disini.

Big Data merupakan istilah untuk menggambarkan data set yang besar baik Structured, Semi-
Structured maupun Unstructured data. Definisi big data bisa juga dijelaskan dalam 3V :

1. Volume berarti data set yang disimpan dalam jumlah yang besar
2. Velocity berarti ada kebutuhan mengakses data set besar tersebut dengan cepat
3. Variety berarti format data yang semakin bervariasi saat ini.
Definisi Big Data dalam 3v

Berikut ini tiga jenis format data :

1. Structured data seperti relational database (RDBMS)


2. Semi-Structured data seperti XML, JSON
3. Unstructured data seperti Dokumen, metadata, video, gambar, audio, file teks, ebooks, email
message, social media, jurnal dll.

Analisis data adalah proses meneliti data untuk mengetahui pola tersembunyi, korelasi yang belum diketahui, dan
informasai berguna lainnya.

Dengan demikian pengertian Analisis Big Data adalah proses meneliti, mengolah data set besar (Big Data) untuk
mengetahui pola tersembunyi, korelasi yang tidak diketahui, tren pasar, preferensi pelanggan dan informasi bisnis
berguna lainnya.

Jika ingin lebih legkap bisa membaca dari link Wiki berikut ini : Big Data dan Analisis, Perlu fokus lebih untuk dapat
memahaminya ;)

Sejarah dan Evolusi Analisis Big Data


Konsep big data telah ada selama bertahun-tahun kebelakang, sekarang sebagian besar organisasi mengerti bahwa jika
mereka mampu menampung semua data set besar yang mengalir ke dalam bisnis mereka, maka mereka dapat
menerapkan analisis dan mendapatkan manfaat/informasi yang sangat berharga dari proses analisis tersebut.
Jika kita lihat ke belakang sebelum istilah Big Data dikenal, di tahun 1950-an bisnis pada saat itu sudah menggunakan
analisis konvensional, yang didasarkan pada spreadsheet yang dikaji secara manual untuk mengungkap informasi
berharga dan tren.

Lalu apa yang ditawarkan oleh analisis big data?

Benefit analisis big data di bandingkan dengan analisis konvensional adalah kecepatan dan efisiensi.

Sebelum aplikasi analisis big data muncul, bisnis akan mengumpulkan data ke dalam data warehouse dari database
enterprise seperti Oracle, DB2, MS SQL Server, kemudian melakukan analisis untuk membantu pengambilan
keputusan yang bermanfaat untuk masa depan bisnis perusahaan.

Kendala yang dihadapi muncul dengan pertumbuhan data yang sangat pesat dari berbagai jenis tipe data, sehingga
dengan analisis konvensional ada limitasi untuk dapat menampung data set besar tersebut, waktu yang relatif lama
diperlukan untuk menghasilkan informasi berharga dari analisis.

Kemunculan teknologi analisis big data memberikan solusi bagi bisnis untuk mendapatkan hasil analisis segera bahkan
real-time sekalipun, sehingga memberikan bisnis keunggulan dalam berkompetisi.

Mengapa Analisis Big Data Penting?


Analisis Big Data membantu organisasi memanfaatkan data dan menggunakannya untuk mengidentifikasi peluang-
peluang baru. Yang pada gilirannya menyebabkan bisnis bergerak lebih cerdas dan cepat karena didukung oleh
operasional yang lebih efisien, yang pada akhirnya mendatangkan keuntungan yang lebih tinggi dan pelanggan lebih
senang tentunya.

Dalam laporan yang ditulis oleh Tom Davenport (Direktur Riset IIA) setelah ia mewawancarai lebih dari 50 usaha
untuk memahami bagaimana mereka menggunakan Big Data. Ia menemukan mereka mendapatkan manfaat penting
sebagai berikut :

1. Penghematan biaya, Teknologi analisis Big data seperti hadoop dan analisis berbasis cloud
membawa pengurangan biaya yang signifikan dalam hal untuk menyimpan data set dalam jumlah besar,
selain mereka dapat mengidentifikasi cara-cara yang lebih efisien dalam melakukan bisnis.
2. Lebih cepat dan baik dalam pengambilan keputusan, dengan kecepatan teknologi big data seperti
Hadoop dalam melakukan analisis dengan dikombinasikan dengan kemampuan untuk menganalisis berbagai
macam sumber data baru, membuat bisnis mampu menganalisis informasi dengan cepat dan membuat
keputusan berdasarkan hasil analisis tersebut.
3. Melahirkan produk dan pelayanan baru, dengan kemampuan mengukur kebutuhan dan kepuasan
pelanggan mendatangkan keunggulan dari bisnis untuk menciptakan produk dan layanan baru yang sesuai
dengan keinginan dan kebutuhan dari pelanggan.
Dengan 3 manfaat penting tersebut akan membantu bisnis mencapai tujuan/goal utama dalam meningkatkan
keuntungan demi kemajuan bisnisnya.

Contoh Aplikasi Analisis Big Data


Berikut ini beberapa contoh Aplikasi yang ditawarkan oleh perusahaan/vendor dalam hal analisis terhadap big data :

1. IBM Big data Analytics


2. HP Big Data
3. SAP Big Data Analytics
4. Microsoft Big Data Analytics
5. Oracle Big Data Analytics
6. Talend Open Studio
7. Teradata Big Data Analytics
8. SAS Big Data Analytics
9. Dell Big Data Analytics,
10. Pentaho Big Data Analytics
11. Amazon Web Service
12. Google Big Query
13. Pivotal Big Data
14. Cloudera Enterprise Big Data
15. Hortonworks Data Platform

Solusi big data yang ditawarkan pada umumnya menggunakan kerangka kerja (framework) Hadoop dan beberapa
tools pendukung lainnya seperti HBase, Pig, Hive, Mapreduce, Oozie, Zookeeper, HCatalog, Avro, Sqoop (untuk
ingin tahu istilah tersebut dapat dibaca di sini). Yang memungkinkan pengguna untuk menyimpan, mengelola dan
menganalisa data dari berbagai sumber, di mana data tersebut dapat diakses oleh para analis bisnis, data
scientist dan pengguna/praktisi TI.

Solusi big data tersebut adapula yang secara arsitektur dikombinasikan dengan teknologi yang sudah biasa untuk
keperluan analisis dan visualisasi data, seperti Data Warehouse dan Business Intellegent (BI). Dengan
menggunakan tools visualisasi tersebut akan lebih menarik dan mudah dalam penyediaan reporting dari hasil
analisis.

Sepertinya nanti akan saya tulis artikel khusus pembahasan detil tentang software tersebut di atas.

Contoh Studi Kasus Penggunaan Analisis Big Data


Dalam implementasinya, penerapan analisis big data cocok untuk berbagai bidang bisnis. Berikut ini saya coba listing-
kan beberapa contoh studi kasus penggunaannya :

1. Lembaga keuangan dapat menggunakan analisis big data agar cepat mengidentifikasi potensi
penipuan sebelum menjadi besar efeknya, sehingga meminimalkan resiko kerugian secara finansial.
2. Pemerintahan dapat manfaatkan analisis big data untuk meningkatkan keamanan negara dengan
mampu mendeteksi, mencegah dan melawan serangan cyber.
3. Industri kesehatan dapat menggunakan analisis terhadap big data untuk meningkatkan layanan
perawatan pasien dan menemukan cara yang lebih baik untuk mengelola sumber daya dan personil.
4. Perusahaan telekomunikasi dapat memanfaatkan analisis big data untuk
mencegah churn pelanggan, dan juga merencanakan cara terbaik untuk mengoptimalkan jaringan nirkabel
baik yang baru maupun yang sudah ada.
5. Marketing dapat menggunakan big data untuk melakukan analisis sentimen untuk mengetahui
tingkat kepuasan pelanggan terhadap produk dan layanan yang dipasarkan.
6. Perusahaan asuransi dapat menggunakan analisis big data untuk mengkategorikan pengajuan
asuransi yang dapat segera diproses, dan mana yang perlu divalidasi dengan dilakukan kunjungan oleh agen
asuransi.
7. Perusahaan ritel dapat menggunakan informasi dari social media seperti Facebook, Twitter,
Google+ yang disimpan dengan teknologi big data, yang selanjutnya digunakan untuk menganalisis
bagaimana perilaku, persepsi pelanggan terhadap suatu produk atau brand dari perusahan.

Di atas hanya beberapa contoh penggunaan big data dalam rangka keperluan analisis. Saya rasa masih banyak contoh
lainnya.

Sejalan dengan terus berkembangnya teknologi analisis big data, dan hampir semua bisnis sudah mulai berfikir bahwa
mendapatkan manfaat dari implementasi analisis big data adalah suatu keharusan untuk menghadapi perubahan dan
persaingan yang semakin pesat dan ketat saat ini.

Karena hal di atas, bisa kita prediksi kedepan penerapan big data menjadi sesuatu yang umum, sehingga akan semakin
banyak lagi contoh studi kasus pemanfaatan big data selain yang saya sebutkan.

Bagaimana Melakukan Analisis Big Data?


Berikut ini beberapa jenis metode atau teknik dalam melakukan analisis big data :

1. Analisis Teks, merupakan proses menganalisis data teks (unstructured-data) seperti blog, email,
forum, tweet, forum dan bentuk lainnya.
2. Data Mining, merupakan suatu proses menemukan hubungan yang berarti, pola, dan
kecenderungan dari sekumpulan besar data dengan menggunakan teknik pengenalan pola seperti statisik
dan matematika
3. Machine Learning
4. Analisis Prediksi (Predictive Analytics)
5. Analisis Statistik
6. NLP (Natural Language Processing)
Demikian pembahasan tentang analisis big data, semoga dapat bermanfaat.

Anda mungkin juga menyukai