Disusun Oleh :
Kelompok 4
PROGRAM STUDI
TEKNIK
INFORMATIKA
UNIVERSITAS PAMULANG
JL.SURYA KENCANA NO.1 PAMULANG telp (021)7412566,
fax(021)7412566
Tangerang selatan – Banten
KATA PENGANTAR
Puji syukur kehadirat Tuhan yang Maha Esa karena anugerah dari-Nya saya
dapat menyelesaikan makalah tentang “Big Data” yang merukan tugas kuliah Sistem
Informasi Manajemen. Berkat tugas kuliah menulis makalah ini maka saya dapat
menambah wawasan saya dan bertambah ilmu saya.
Dengan menulis makalah ini, semoga pembaca dapat
menambah ilmu dan bertambah pula wawasan teng big data. Sering kali,
istilah 'big data' menjadi topik hangat dan sering dibahas dalam industri IT
(Information Technology). Dan saat ini sudah banyak perusahaan yang
telah menerapkan cara untuk menangani fenomena big data ini, misalnya
dengan menambah kapasitas infrastruktur ataupun implementasi teknologi
seperti virtualisasi.
Demikian yang dapat kami sampaikan, semoga makalah ini bisa bermanfaat
dan jangan lupa ajukan kritik dan saran terhadap makalah ini agar kedepannya bisa
diperbaiki.
BAB I
PENDAHULUAN
Penting nya Big Data di era modern ini. Dengan mengikuti perkembangan Big
Data maka kita tidak ketinggalan informasi atau ketinggalan jaman. Dengan
menggunakan Big Data ini juga apat memudahkan kita mencari informasi misalnya
melalui google. Di google kita dapat mencari informasi dari yang terbaru hingga yang
sudah lampau.
Misalnya dari facebook, maka kita dapat chatingan, bahkan kita dapat melihat
aktivitas seseorang. Dengan menggunakan salah satu Banyak orang membutuhkan
pengolahan Big Data, antara lain untuk mengetahui topik yang sedang hangat saat
ini di Twitter, mencari teman lama secara cepat melalui Facebook, dan lain-
lain. Perusahaan perlu mengolah Big Data untuk pengambilan keputusan bisnis
yang harus cepat. Misal, untuk mengetahui kebiasaan dan kesukaan pelanggan
tanpa harus bertanya, mengetahui selera pembaca portal berita di web untuk
disesuaikan dengan iklan yang ditampilkan, mengatur perjalanan pesawat agar tidak
delay, mengendalikan wabah penyakit, dan sebagainya.
RUMUSAN MASALAH
1. Pengertian Big Data
2. Dimensi-dimensi Big Data
3. Analisis Big Data dan Sejarah dan Evolusi Analisis Big Data
4. Contoh dan kasus Big Data
5. Karakteristik Big Data
BAB II
PEMBAHASAN
Banyak orang yang menggunakan big data ini untuk mencari informasi yang sedang
populer saat ini, misal nya berita terbaru. Misalnya facebook, di facebook kita bisa
menemui banyak orang, bahkan teman lama yang sama-sama menggunakan
facebook.
Untuk mengolah Big Data menjadi informasi yang lebih berguna, perlu program “big”
yang artinya bukan program “biasa”. Jika data konvensional selama ini hanya berisi
teks dan angka biasa seperti data keuangan, maka cukup diolah dengan database
biasa pula, misal MS Access, MS SQL Server, dan lain-lain yang selama ini hanya
untuk mengolah data terstruktur. Big Data tidak dapat diolah hanya dengan program
database konvensional yang disebut SQL (Structured Query Language) atau
RDBMS (Relational Database Management System). Big Data membutuhkan
program database yang mendukung NoSQL (Not only SQL), yang mampu mengolah
data tidak terstruktur.
Dalam bahasa Inggris, Big Data terkait dengan 3V, yakni Volume (ukuran data
sangat besar), Velocity (kecepatan transfer/perubahan data sangat tinggi), dan
Variety (variasi atau jenis data sangat banyak). Ada juga yang menjadikan 4V,
ditambah Value, karena sangat besarnya nilai bisnis yang dihasilkan, sehingga
menjadi besar pula peluang kerja bagi profesional di bidang pemrograman
komputer, pengolahan data statitisk, dan Cloud Computing. Kebutuhan SDM di
bidang Big Data pada 2015 ini diproyeksi sekitar 4,4 juta orang. Di Amerika saja
butuh 190.000 orang pada 2011 dan akan tambah butuh lagi 490.000 pada 2018
(Sumber: McKinsey Global Institute, 2011)
1. Volume
· Mengubah 12 terabyte Tweet dibuat setiap hari ke dalam peningkatan sentimen
analisis produk.
· Mengkonvert 350 milliar pembacaan tahunan untuk lebih baik dalam memprediksi
kemampuan beli pasar.
Volume data juga terus meningkat sehingga tidak dapat diprediksi jumlah pasti dan
juga ukuran dari data sekitar lebih kecil dari petabyte sampai zetabyte. Dataset big
data sekitar 1 terabyte sampai 1 petabyte perperusahaan jadi jika big data
digabungkan dalam sebuah organisasi / group perusahaan ukurannya mungkin bisa
sampai zetabyte dan jika hari ini jumlah data sampai 1000 zetabyte, besok pasti
akan lebih tinggi dari 1000 zetabyte.
2. Variety
Volume data yang banyak tersebut bertambah dengan kecepatan yang begitu cepat
sehingga sulit bagi kita untuk mengelola hal tersebut. Kadang-kadang 2 menit sudah
menjadi terlambat. Untuk proses dalam waktu sensitif seperti penangkapan
penipuan, data yang besar harus digunakan sebagai aliran ke dalam perusahaan
Anda untuk memaksimalkan nilainya.
· Meneliti
5 juta transaksi yang dibuat setiap hari untuk mengidentifikasi potensi
penipuan
· Menganalisis 500 juta detail catatan panggilan setiap hari secara real-time untuk
memprediksi gejolak pelanggan lebih cepat.
Berbagai jenis data dan sumber data. Variasi adalah tentang mengelolah
kompleksitas beberapa jenis data, termasuk structured data, unstructured data dan
semi-structured data. Organisasi perlu mengintegrasikan dan menganalisis data dari
array yang kompleks dari kedua sumber informasi Traditional dan non traditional
informasi, dari dalam dan luar perusahaan. Dengan begitu banyaknya sensor,
perangkat pintar (smart device) dan teknologi kolaborasi sosial, data yang dihasilkan
dalam bentuk yang tak terhitung jumlahnya, termasuk text, web data, tweet, sensor
data, audio, video, click stream, log file dan banyak lagi.
3. Velocity :
Big Data adalah setiap jenis data – data baik yang terstruktur maupun tidak
terstruktur seperti teks, data sensor, audio, video, klik stream, file log dan banyak
lagi. Wawasan baru ditemukan ketika menganalisis kedua jenis data ini bersama-
sama.
· Memantau 100 video masukan langsung dari kamera pengintai untuk menargetkan
tempat tujuan.
· Mengeksploitasi 80% perkembangan data dalam gambar, video, dan dokumen
untuk meningkatkan kepuasan pelanggan.
Data dalam gerak. Kecepatan di mana data dibuat, diolah dan dianalisis terus
menerus. Berkontribusi untuk kecepatan yang lebih tinggi adalah sifat penciptaan
data secara real-time, serta kebutuhan untuk memasukkan streaming data ke dalam
proses bisnis dan dalam pengambilan keputusan. Dampak Velocity latency, jeda
waktu antara saat data dibuat atau data yang ditangkap, dan ketika itu juga dapat
diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan yang mustahil untuk
sistem tradisional untuk menangkap, menyimpan dan menganalisis. Jenis tertentu
dari data harus dianalisis secara real time untuk menjadi nilai bagi bisnis.
Untuk mendalami Big Data, program dan istilah berikut ini perlu dipelajari, meskipun
tidak harus semuanya, yakni sistem operasi Linux, Apache Hadoop, Apache HBase,
MongoDB, MapReduce, HDFS (Hadoop Distributed File System), bahasa
pemrograman Java, Hive, Pig, Python, R, dan Cloud. Teknologi Cloud dibutuhkan
karena Big Data perlu didukung server yang kuat dengan tempat penyimpanan
besar dan mudah dikembangkan. Cloud telah lebih dahulu berkembang dan tersedia
luas dengan biaya lebih murah daripada tidak menggunakan Cloud.
Pengertian Analisis Big Data
Untuk mengerti definisi analisis big data, kita tidak bisa lepas dari memahami apa itu
big data dan apa itu analisis data. Istilah big data telah saya bahas khusus
pada artikel berikut ini, namun saya akan coba berikan overview singkat tentang big
data disini.
Big Data merupakan istilah untuk menggambarkan data set yang besar
baik Structured, Semi-Structured maupun Unstructured data. Berikut ini tiga jenis
format data :
1. Structured data seperti relational database (RDBMS)
2. Semi-Structured data seperti XML, JSON
3. Unstructured data seperti Dokumen, metadata, video, gambar, audio, file teks,
ebooks, email message, social media, jurnal dll.
Analisis data adalah proses meneliti data untuk mengetahui pola tersembunyi,
korelasi yang belum diketahui, dan informasai berguna lainnya.
Dengan demikian pengertian Analisis Big Data adalah proses meneliti, mengolah
data set besar (Big Data) untuk mengetahui pola tersembunyi, korelasi yang tidak
diketahui, tren pasar, preferensi pelanggan dan informasi bisnis berguna lainnya.
Jika ingin lebih legkap bisa membaca dari link Wiki berikut ini : Big
Data dan Analisis, Perlu fokus lebih untuk dapat memahaminya ;)
Jika kita lihat ke belakang sebelum istilah Big Data dikenal, di tahun 1950-an bisnis
pada saat itu sudah menggunakan analisis konvensional, yang didasarkan pada
spreadsheet yang dikaji secara manual untuk mengungkap informasi berharga dan
tren.
Sebelum aplikasi analisis big data muncul, bisnis akan mengumpulkan data ke
dalam data warehouse dari database enterprise seperti Oracle, DB2, MS SQL
Server, kemudian melakukan analisis untuk membantu pengambilan keputusan
yang bermanfaat untuk masa depan bisnis perusahaan.
Kendala yang dihadapi muncul dengan pertumbuhan data yang sangat pesat dari
berbagai jenis tipe data, sehingga dengan analisis konvensional ada limitasi untuk
dapat menampung data set besar tersebut, waktu yang relatif lama diperlukan untuk
menghasilkan informasi berharga dari analisis.
Kemunculan teknologi analisis big data memberikan solusi bagi bisnis untuk
mendapatkan hasil analisis segera bahkan real-time sekalipun, sehingga
memberikan bisnis keunggulan dalam berkompetisi.
1. Penghematan biaya, Teknologi analisis Big data seperti hadoop dan analisis
berbasis cloud membawa pengurangan biaya yang signifikan dalam hal untuk
menyimpan data set dalam jumlah besar, selain mereka dapat mengidentifikasi cara-
cara yang lebih efisien dalam melakukan bisnis.
2. Lebih cepat dan baik dalam pengambilan keputusan, dengan kecepatan
teknologi big data seperti Hadoop dalam melakukan analisis dengan dikombinasikan
dengan kemampuan untuk menganalisis berbagai macam sumber data baru,
membuat bisnis mampu menganalisis informasi dengan cepat dan membuat
keputusan berdasarkan hasil analisis tersebut.
3. Melahirkan produk dan pelayanan baru, dengan kemampuan mengukur
kebutuhan dan kepuasan pelanggan mendatangkan keunggulan dari bisnis untuk
menciptakan produk dan layanan baru yang sesuai dengan keinginan dan
kebutuhan dari pelanggan.
Solusi big data yang ditawarkan pada umumnya menggunakan kerangka kerja
(framework)Hadoop dan beberapa tools pendukung lainnya seperti HBase, Pig,
Hive, Mapreduce, Oozie, Zookeeper, HCatalog, Avro, Sqoop (untuk ingin tahu istilah
tersebut dapat dibaca di sini). Yang memungkinkan pengguna untuk menyimpan,
mengelola dan menganalisa data dari berbagai sumber, di mana data tersebut dapat
diakses oleh para analis bisnis, data scientist dan pengguna/praktisi TI.
Solusi big data tersebut adapula yang secara arsitektur dikombinasikan dengan
teknologi yang sudah biasa untuk keperluan analisis dan visualisasi data, seperti
Data Warehouse dan Business Intellegent (BI). Dengan menggunakan tools
visualisasi tersebut akan lebih menarik dan mudah dalam penyediaan reporting dari
hasil analisis.
Sepertinya nanti akan saya tulis artikel khusus pembahasan detil tentang software
tersebut di atas.
Di atas hanya beberapa contoh penggunaan big data dalam rangka keperluan
analisis. Saya rasa masih banyak contoh lainnya.
Sejalan dengan terus berkembangnya teknologi analisis big data, dan hampir semua
bisnis sudah mulai berfikir bahwa mendapatkan manfaat dari implementasi analisis
big data adalah suatu keharusan untuk menghadapi perubahan dan persaingan
yang semakin pesat dan ketat saat ini.
Karena hal di atas, bisa kita prediksi kedepan penerapan big data menjadi sesuatu
yang umum, sehingga akan semakin banyak lagi contoh studi kasus pemanfaatan
big data selain yang saya sebutkan.
Big Data sebagai meruapakan keseluruhan informasi, namun ukurannya data sendiri
tidak melulu besar. Contahnya saat terngukapnya kecurangan pertandingan sumo di
Jepang. Data yang digunakan bukan sampel, tapi N=all. Setelah mengumpulkan
data 64.000 pertandingan selama 11 tahun terakhir, ternyata data tersebut hanya
berukura sama dengan file foto digital. Dengan prisip N=all diperoleh suatu pola
yang menunjukan baha pesumo yang lebih membutuhkan kemenangan memiliki
peluang 25% lebih besar untuk menang.
2. Berantakan (Messy)
Big data meciptakan dataset yang lebih berantakan, namun mampu memberikan
gamberab yang lebih menyeluruh, meskipun tidak terstruktur. Contohnya Google
Translate, perusahaan yang bermarkas di Mountain View, California, AS ini
mengumpulkan seluruh dokumen dengan terjemahan yang mereka bisa kumpulkan
dengan kualitas yang berbeda-beda. Data yang dikumpulkan memang berantakan
namun terjemahan yang dihasilkan lebih akurat daripada sistem yang lebih
berdasarkan alogaritma, dan jauh lebih kaya (meliputi 60 bahasa).
3. Korelasi
4. Datafikasi
5. Value
Mengumpulkan data adalah hal yang krusial namun tidak cukup karena kebanyakan
nilai dari data terletak pada penggunaan, bukan kepemilikan. Dalam era Big Data,
seluruh data akan dianggap berharga, bahkan data paling menda dan sepele. Tidak
seperti sumber daya lain, nilai data tidak berkurang setelah digunakan. Biaya
petimpanan digital telah berkurang setengahnya setiap dua tahun, sementara
storage density meningkat 50 juta kali dalam 50 tahun terakhir.
BAB III
KESIMPULAN DAN SARAN
Kesimpulan
Big Data merupakan data elektronik mempunyai banyak sekali macam nya.
Dengan menggukan Big Data ini maka kita tidak ketinggalan informasi, mulai dari
informasi yang terbaru maupun yang sudah lampau. Big Data ini juga sangat
bermanfaat bagi kehidupan sehari-hari.
SARAN
Semoga dengan adanya Big Data ini tidak di salah gunakan dengan
kejahatan. Sebaik nya juga saat menggunakan sosial media kita lebih berhati hati.
Untuk pemerintah sebaik nya membatasi situs situs yang memang perlu di beri
batasan umur. Sehingga anak dibawah umur tidak terbawa arus negatif.
DAFTAR PUSTAKA
https://ediwordpressblog.wordpress.com/2016/02/22/pengertian-big-data/
http://noviardisyamsuir.blogspot.co.id/2016/04/analisis-big-data.html
https://sharingvision.com/2013/09/karakteristik-big-data/