MEMAHAMI KARAKTERISTIK BIGDATA • Big Data adalah istilah yang diberikan pada kumpulan data yang berukuran sangat besar dan kompleks, sehingga tidak memungkinkan untuk diproses menggunakan perangkat pengelola database konvensional ataupun aplikasi pemroses data lainnya. • Karakteristik utama Big Data meliputi tiga hal – biasa disingkat dengan 3V – yaitu volume, velocity, dan variety. • Volume terkait dengan besaran data yang harus dikelola berukuran super besar. • Velocity berkenaan dengan kecepatan pemrosesan data yang harus mengimbangi pesatnya pertumbuhan jumlah data. • Sedangkan variety merujuk pada karakteristik sumber data yang sangat beragam, baik itu yang berasal dari basis data yang terstruktur maupun juga dari data-data yang tidak terstruktur. PEMICU PERKEMBANGAN BIGDATA • Pesatnya pertambahan kemampuan penyimpanan data • Pesatnya pertambahan kemampuan mesin pemrosesan data. Seiring dengan pesatnya perkembangan teknologi hardware, maka kapasitas komputasi pada mesin/perangkat komputer juga telah meningkat sangat tajam. • Ketersediaan data yang melimpah. Perusahaan-perusahaan dari berbagai sektor di Amerika Serikat memiliki data setidaknya 100 terabytes. Bahkan banyak diantara perusahaan tersebut yang memiliki data lebih dari 1 petabyte. KLASIFIKASI BIGDATA 1. Data terstruktur. • Jenis data structured (data tradisional) dapat diproses, disimpan, dan diambil dalam format tetap. Jenis data ini disimpan dalam bentuk tabel, baris dan kolom yang normalnya disimpan dalam excel atau spreadsheet, dimana informasi pada data sangat terorganisir dan dapat dengan mudah diakses dari database dengan algoritma mesin pencari sederhana. • Contoh data terstruktur adalah, data sensor, data penjualan pada suatu perusahaan, data karyawan dalam database perusahaan dengan detail yang terstruktur seperti detail data diri karyawan, posisi pekejaan, gaji, dan lainnya ditampilkan secara terorganisir. KLASIFIKASI BIGDATA 2. Data Semi-Terstruktur • Jenis data semi-structured merupakan jenis data yang dimasukan ke dalam sebuah tabel, tetapi skemanya tidak sama dengan tabel biasa yang hanya terdiri dari baris dan kolom. • Data semi-terstruktur mengandung format data terstruktur dan tidak terstruktur. Walaupun belum diklasifikasi oleh repository tertentu (database), namun mengandung informasi yang penting. Contohnya adalah data dalam bentuk file csv, file xml, dan file json. KLASIFIKASI BIGDATA 3. Data tidak terstruktur • Jenis data unstructured adalah data dengan bentuk yang tidak dikenal, harus disimpan dengan format khusus karena tidak memiliki struktur yang spesifik seperti jenis data structured. Raw data dari jenis data ini hanya dapat menghasilkan nilai setelah diproses dan dianalisa. • Menyimpan data jenis ini pun memiliki kerumitan seperti memerlukan penggunaan sistem penyimpanan yang memadai, seperti database NoSQL (MongoDB dan CouchDB). • Contoh jenis data tidak terstruktur seperti data teks, berformat foto atau gambar, video, atau suara. Selain itu, bisa juga dalam bentuk keluhan pelanggan, kontrak, ataupun email internal. Contoh dari data jenis ini dapat ditemukan dalam social media, seperti komentar, likes, followers, dan data click pada setiap aktivitas di akun media sosialmu. TAHAPAN PENGELOLAAN BIGDATA 1. Acquired. Berhubungan dengan cara mendapatkan data 2. Accessed. Berhubungan dengan daya akses data; data yang sudah dikumpulkan memerlukan tata kelola, integrasi, storage dan computing agar dapat dikelola untuk tahap berikutnya. Perangkat untuk pemrosesan (processing tools) menggunakan Hadoop, Nvidia CUDA, Twitter Storm, dan GraphLab. Sedangkan untuk manajemen penyimpanan data (storage tools) menggunakan Neo4J, Titan, dan HDFS. 3. Analytic. Berhubungan dengan informasi yang akan didapatkan, hasil pengelolaan data yang telah diproses. Analitik yang dilakukan dapat berupa descriptive (penggambaran data), diagnostic (mencari sebab akibat berdasar data), predictive (memprediksi kejadian dimasa depan) maupun prescriptive analytics (merekomendasikan pilihan dan implikasi dari setiap opsi). Tools untuk tahap analitik menggunakan MLPACK dan Mahout. 4. Application. Terkait visualisasi dan reporting hasil dari analitik. Tools untuk tahap ini menggunakan RStudio. PEMANFAATAN BIGDATA DALAM BISNIS • Perusahaan-perusahaan yang bergerak dalam sektor bisnis memiliki orientasi utama pada pencapaian margin laba setinggi mungkin (profit oriented). Berbagai informasi penting dapat dihasilkan dari Big Data yang dapat mendukung proses pengambilan keputusan bagi pimpinan perusahaan sebagai berikut: 1. Mengetahui respons masyarakat terhadap produk-produk yang dikeluarkan melalui analisis sentimen di media sosial. 2. Membantu perusahaan mengambil keputusan secara lebih tepat dan akurat berdasarkan data. 3. Membantu meningkatkan citra perusahaan di mata pelanggan. 4. Perencanaan usaha, dengan mengetahui perilaku pelanggan seperti pada perusahaan telekomunikasi dan perbankan. 5. Mengetahui trend pasar dan keinginan konsumen. PEMANFAATAN BIGDATA DALAM PELAYANAN PUBLIK • Perusahaan atau institusi yang yang berada pada sektor layanan publik lazimnya memiliki orientasi utama pada pencapaian kepuasan klien/ pelanggan. Resource Big Data dapat memberikan andil dengan menyajikan berbagai informasi berharga sebagai berikut: 1. Mendapatkan feedback dan respon masyarakat sebagai dasar penyusunan kebijakan dan perbaikan pelayanan publik. Feedback tersebut dapat diperoleh dari sistem informasi layanan pemerintah maupun dari media sosial. 2. Membuat layanan terpadu dengan segmen khusus sehingga layanan bisa lebih efektif dan efisien. 3. Menemukan solusi atas permasalahan yang ada, berdasarkan data. Sebagai contoh : menganalisis informasi cuaca dan informasi pertanian terkait data tingkat kesuburan tanah, pemerintah dapat menetapkan atau menghimbau jenis varietas tanaman yang ditanam oleh petani pada daerah dan waktu tertentu. MARI KITA PERDALAM MATERI DENGAN BERDISKUSI/TANYA JAWAB
Pendekatan sederhana untuk SEO: Bagaimana memahami dasar-dasar optimasi mesin pencari dengan cara yang sederhana dan praktis melalui jalur penemuan non-spesialis untuk semua orang