0% menganggap dokumen ini bermanfaat (0 suara)
212 tayangan6 halaman

Big Data

Big data merupakan data elektronik yang sangat besar dan beragam jenisnya serta berubah dengan cepat. Big data saat ini banyak digunakan untuk membantu kebutuhan dengan menganalisis berbagai jenis data seperti teks, gambar, video, suara, dan lainnya. Untuk mengolah big data menjadi informasi yang berguna diperlukan program khusus yang mampu mengolah data terstruktur maupun tidak terstruktur.

Diunggah oleh

Rizqi Prima
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
212 tayangan6 halaman

Big Data

Big data merupakan data elektronik yang sangat besar dan beragam jenisnya serta berubah dengan cepat. Big data saat ini banyak digunakan untuk membantu kebutuhan dengan menganalisis berbagai jenis data seperti teks, gambar, video, suara, dan lainnya. Untuk mengolah big data menjadi informasi yang berguna diperlukan program khusus yang mampu mengolah data terstruktur maupun tidak terstruktur.

Diunggah oleh

Rizqi Prima
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

Big data adalah sebuah data elektronik yang sangat besar, yang mempunyai banyak macam jenis dan

data elektronik ini sangat cepat berubah. Big data saat ini banyak di gunakan orang-orang untuk
membantu kebutuhan. Banyak sekali data yang tersebar dan tersimpan di komputer-komputer di
internet misalnya seperti teks, gambar,video, suara, animasi, blog, buku, cuaca, GPS, temperatur, dan
masih banyak lagi jenis nya.

Banyak orang yang menggunakan big data ini untuk mencari informasi yang sedang populer saat ini,
misal nya berita terbaru. Misalnya facebook, di facebook kita bisa menemui banyak orang, bahkan
teman lama yang sama-sama menggunakan facebook.

Untuk mengolah Big Data menjadi informasi yang lebih berguna, perlu program “big” yang artinya bukan
program “biasa”. Jika data konvensional selama ini hanya berisi teks dan angka biasa seperti data
keuangan, maka cukup diolah dengan database biasa pula, misal MS Access, MS SQL Server, dan lain-lain
yang selama ini hanya untuk mengolah data terstruktur. Big Data tidak dapat diolah hanya dengan
program database konvensional yang disebut SQL (Structured Query Language) atau RDBMS (Relational
Database Management System). Big Data membutuhkan program database yang mendukung NoSQL
(Not only SQL), yang mampu mengolah data tidak terstruktur.

Dalam bahasa Inggris, Big Data terkait dengan 3V, yakni Volume (ukuran data sangat besar), Velocity
(kecepatan transfer/perubahan data sangat tinggi), dan Variety (variasi atau jenis data sangat banyak).
Ada juga yang menjadikan 4V, ditambah Value, karena sangat besarnya nilai bisnis yang dihasilkan,
sehingga menjadi besar pula peluang kerja bagi profesional di bidang pemrograman komputer,
pengolahan data statitisk, dan Cloud Computing. Kebutuhan SDM di bidang Big Data pada 2015 ini
diproyeksi sekitar 4,4 juta orang. Di Amerika saja butuh 190.000 orang pada 2011 dan akan tambah
butuh lagi 490.000 pada 2018 (Sumber: McKinsey Global Institute, 2011)

Dimensi -Dimensi Big Data

Ada 3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan Velocity

1. Volume
· Mengubah 12 terabyte Tweet dibuat setiap hari ke dalam peningkatan sentimen analisis produk.

· Mengkonvert 350 milliar pembacaan tahunan untuk lebih baik dalam memprediksi kemampuan
beli pasar.

Volume data juga terus meningkat sehingga tidak dapat diprediksi jumlah pasti dan juga ukuran dari
data sekitar lebih kecil dari petabyte sampai zetabyte. Dataset big data sekitar 1 terabyte sampai 1
petabyte perperusahaan jadi jika big data digabungkan dalam sebuah organisasi / group perusahaan
ukurannya mungkin bisa sampai zetabyte dan jika hari ini jumlah data sampai 1000 zetabyte, besok pasti
akan lebih tinggi dari 1000 zetabyte.

2. Variety

Volume data yang banyak tersebut bertambah dengan kecepatan yang begitu cepat sehingga sulit bagi
kita untuk mengelola hal tersebut. Kadang-kadang 2 menit sudah menjadi terlambat. Untuk proses
dalam waktu sensitif seperti penangkapan penipuan, data yang besar harus digunakan sebagai aliran ke
dalam perusahaan Anda untuk memaksimalkan nilainya.

· Meneliti 5 juta transaksi yang dibuat setiap hari untuk mengidentifikasi potensi penipuan

· Menganalisis 500 juta detail catatan panggilan setiap hari secara real-time untuk memprediksi
gejolak pelanggan lebih cepat.

Berbagai jenis data dan sumber data. Variasi adalah tentang mengelolah kompleksitas beberapa jenis
data, termasuk structured data, unstructured data dan semi-structured data. Organisasi perlu
mengintegrasikan dan menganalisis data dari array yang kompleks dari kedua sumber informasi
Traditional dan non traditional informasi, dari dalam dan luar perusahaan. Dengan begitu banyaknya
sensor, perangkat pintar (smart device) dan teknologi kolaborasi sosial, data yang dihasilkan dalam
bentuk yang tak terhitung jumlahnya, termasuk text, web data, tweet, sensor data, audio, video, click
stream, log file dan banyak lagi.
3. Velocity :

Big Data adalah setiap jenis data – data baik yang terstruktur maupun tidak terstruktur seperti teks, data
sensor, audio, video, klik stream, file log dan banyak lagi. Wawasan baru ditemukan ketika menganalisis
kedua jenis data ini bersama-sama.

· Memantau 100 video masukan langsung dari kamera pengintai untuk menargetkan tempat tujuan.

· Mengeksploitasi 80% perkembangan data dalam gambar, video, dan dokumen untuk
meningkatkan kepuasan pelanggan.

Data dalam gerak. Kecepatan di mana data dibuat, diolah dan dianalisis terus menerus. Berkontribusi
untuk kecepatan yang lebih tinggi adalah sifat penciptaan data secara real-time, serta kebutuhan untuk
memasukkan streaming data ke dalam proses bisnis dan dalam pengambilan keputusan. Dampak
Velocity latency, jeda waktu antara saat data dibuat atau data yang ditangkap, dan ketika itu juga dapat
diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan yang mustahil untuk sistem tradisional
untuk menangkap, menyimpan dan menganalisis. Jenis tertentu dari data harus dianalisis secara real
time untuk menjadi nilai bagi bisnis.

Untuk mendalami Big Data, program dan istilah berikut ini perlu dipelajari, meskipun tidak harus
semuanya, yakni sistem operasi Linux, Apache Hadoop, Apache HBase, MongoDB, MapReduce, HDFS
(Hadoop Distributed File System), bahasa pemrograman Java, Hive, Pig, Python, R, dan Cloud. Teknologi
Cloud dibutuhkan karena Big Data perlu didukung server yang kuat dengan tempat penyimpanan besar
dan mudah dikembangkan. Cloud telah lebih dahulu berkembang dan tersedia luas dengan biaya lebih
murah daripada tidak menggunakan Cloud.

Pengertian Analisis Big Data


Untuk mengerti definisi analisis big data, kita tidak bisa lepas dari memahami apa itu big data dan apa
itu analisis data. Istilah big data telah saya bahas khusus pada artikel berikut ini, namun saya akan coba
berikan overview singkat tentang big data disini.

Big Data merupakan istilah untuk menggambarkan data set yang besar baik Structured, Semi-
Structured maupun Unstructured data. Berikut ini tiga jenis format data :

1. Structured data seperti relational database (RDBMS)

2. Semi-Structured data seperti XML, JSON

3. Unstructured data seperti Dokumen, metadata, video, gambar, audio, file teks, ebooks, email
message, social media, jurnal dll.

Analisis data adalah proses meneliti data untuk mengetahui pola tersembunyi, korelasi yang belum
diketahui, dan informasai berguna lainnya.

Dengan demikian pengertian Analisis Big Data adalah proses meneliti, mengolah data set besar (Big Data)
untuk mengetahui pola tersembunyi, korelasi yang tidak diketahui, tren pasar, preferensi pelanggan dan
informasi bisnis berguna lainnya.

Jika ingin lebih legkap bisa membaca dari link Wiki berikut ini : Big Data dan Analisis, Perlu fokus lebih
untuk dapat memahaminya
PENGGUNAAN BIG DATA DALAM PERUSAHAAN

· IT logs Analytics

Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan
untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk
menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem, menyiapkan
langkah-langkah pasti yang dapat digunakan sebagai solusi masalah sistem.

· Fraud Detection Pattern

Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan
pengunaan data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika transaksi
sedang berlangsung

· The Social Media Pattern

Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan kemampuan bagi
perusahan untuk mengetahui keinginan customer secara luas, mendapatkan feedback secara langsung,
dan mengenali langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan
pelangan terhadap pemasaran yang dilakukan.

· The Call centere Mantra


Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang kemudian digunakan
sebagai data untuk analisa masalah yang dihadapai customer, memberikan kemampuan bagi
perusahaan untuk memberikan tanggapan yang cepat maupun secara langsung terhadap masalah yang
dihadapi customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan
masalah dan ketidakpuasaan.

· Risk: Patterns for Modeling and Management

Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan
menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya secara tepat
dan langsung

· Big data and The Energy Sector

Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.

Anda mungkin juga menyukai