Anda di halaman 1dari 30

BIG DATA

Ivana Lucia Kharisma, M.Kom


Deskripsi

• Mata kuliah ini memberikan pemahaman tentang


konsep dasar dan teknologi terkait penerapan Big
Data. Mahasiswa akan mempelajari prinsip-prinsip
dasar analisis Big Data, infrastruktur dan alat yang
digunakan dalam pengelolaan, analisis prediktif serta
visualisasi big data
Silabus & Penilaian
Referensi :
• 1. Berman, J Jules (2013). Principles of Big Data: Preparing, Sharing, and Analyzing
• Complex Information 1st Edition . Morgan Kaufmann; 1st edition
• 2. Rajkumar Buyya, Rodrigo N. Calheiros, Amir Vahid Dastjerdi (2016). Big Data Principles
• and Paradigms . Elsevier
• 3. Zen Munawar, Agus Muliantara, Remuz MB Kmurawak, dkk (2023). Big Data Analytics,
• Konsep, Implementasi dan Aplikasi Terkini. Kaizen, Publishing
Manfaat Big Data
Pengambilan keputusan yang lebih cepat dan lebih baik - Analytics selalu melibatkan upaya untuk
meningkatkan pengambilan keputusan, dan big data tidak mengubahnya. Mengikuti analitik big data
benar-benar membuat manajer bisnis menjadi pembuat keputusan yang baik.

Produk dan layanan baru - Mungkin penggunaan analitik big data yang paling menarik adalah
menciptakan produk dan layanan baru bagi pelanggan.

Rekomendasi produk - Jelas sangat jelas bahwa adopsi big data dan analitik telah terbukti menjadi
strategi yang sangat ampuh untuk bisnis online.

Deteksi Penipuan - Analitik kinerja tinggi bukan sekadar tren teknologi. Ini mewakili perubahan
revolusioner dalam cara organisasi memanfaatkan data. Dengan opsi komputasi terdistribusi baru
seperti pemrosesan dalam memori pada perangkat keras komoditas, bisnis dapat memiliki akses ke
solusi analitik big data real time yang fleksibel dan dapat diskalakan dengan biaya yang masuk akal. Ini
pasti akan mengubah cara perusahaan asuransi mengelola big data di seluruh bisnis mereka terutama
dalam mendeteksi penipuan
Data Science: the professional field that deals
with turning data into value, such as new
insights or predictive models.

Business Intelligence (BI): a technology-driven


process for analyzing data and presenting
actionable information to help make informed
business decisions.
• Big Data vs Big Information vs Big Knowledge:
• Data (Facts, a description of the World)
• Information (Captured Data and Knowledge): Merekam
atau mengambil Data dan Knowledge pada satu waktu
tertentu (at a single point). Sedangkan Data dan
Knowledge dapat terus berubah dan bertambah dari
waktu ke waktu.
• Knowledge (Our personal map/model of the world): apa
yang kita ketahui (not the real world itself) Anda saat ini
tidak dapat menyimpan pengetahuan dalam diri anda
dalam apa pun selain otak, dan untuk membangun
pengetahuan perlu informasi dan data.
5 V Pada Big Data: Volume

Facebook menghasilkan 10TB data baru setiap hari, Twitter 7TB


• Sebuah Boeing 737 menghasilkan 240 terabyte data penerbangan
selama penerbangan dari satu wilayah bagian AS ke wilayah yang lain
• Microsoft kini memiliki satu juta server, kurang dari Google, tetapi lebih
dari Amazon, kata Ballmer (2013).
https://medium.com/
analytics-vidhya/big-
data-3-vs-and-5-v-s-
c1cae2a6d311
5 V Pada Big Data: Volume
5 V Pada Big Data: Velocity

Kecepatan data yang masuk (per jam, per detik, etc). Clickstreams (web
log) dan transfer data asynchronous yang dapat menangkap apa saja
yang dilakukan oleh jutaan atau lebih pengguna yang lakukan saat ini.
5 V Pada Big Data: Variety

• Kumpulan dari berbagai macam data, baik data yang terstruktur, semi
terstruktur maupun data tidak terstruktur (bisa dipastikan lebih mendominasi).
• Tampilan data semakin komprehensif (lengkap dan menyeluruh).
https://medium.com/analytics-
vidhya/big-data-3-vs-and-5-v-s-
Selanjutnya terdapat jenis semi-structured data, jenis ini berada
di antara data terstruktur dan tidak terstruktur. Contohnya
adalah data dalam format XML atau JSON.Keunggulan dari
data semi terstruktur adalah kemampuannya untuk
menggabungkan elemen data terstruktur dan tidak terstruktur.
Contoh dari semi-structured data termasuk data sensor dari
perangkat IoT yang dapat berisi informasi terstruktur tentang
suhu dan kelembaban bersama dengan teks bebas yang
menjelaskan situasi.
5 V Pada Big Data: Veracity

•Ketidakpastian akan data.


• Business process rawan akan kesalahan, tergantung datanya
• Bagaimana suatu data dapat dipercaya mengingat keandalan sumbernya
• Bagaimana mengelola, mengolah data mana yang benar dan mana yang salah.
Sumber Kebenaran Data
Ada beberapa sumber kebenaran data. Beberapa contoh kebenaran ini meliputi:

● Bias Statistik: Data menjadi tidak akurat karena bias statistik karena beberapa titik data diberi bobot lebih besar
dibandingkan titik data lainnya sehingga menyebabkan inkonsistensi data atau tidak menguntungkan. Bias atau
bias data adalah kesalahan di mana beberapa elemen data memiliki bobot lebih besar dibandingkan elemen
lainnya. Hal ini menghasilkan data yang tidak akurat ketika organisasi memutuskan nilai terhitung yang mengalami
Bias statistik.
● Bug dalam Aplikasi: Data dapat terdistorsi karena adanya bug dalam perangkat lunak atau aplikasi. Bug dapat
mengubah atau salah menghitung data.
● Kebisingan: Sumber kebenaran data lainnya adalah kebisingan dalam kumpulan data. Kebisingan adalah informasi
yang tidak bernilai, seperti data yang hilang atau tidak lengkap, sehingga menghasilkan data yang tidak relevan.
● Outlier atau Anomali: Kelainan seperti outlier atau anomali berarti titik data yang salah sehingga data menyimpang
dari keadaan normalnya. Misalnya, deteksi penipuan didasarkan pada transaksi abnormal yang dilakukan
menggunakan internet banking.
● Ketidakpastian: Bahkan setelah mengambil langkah-langkah untuk memastikan kualitas data, masih ada
kemungkinan bahwa perbedaan dalam data, seperti nilai yang salah, data basi atau usang, atau data duplikat,
dapat menimbulkan ketidakpastian.
● Kurangnya sumber data yang kredibel: Silsilah data merupakan salah satu faktor penting dalam menjaga
kebenaran data. Karena data dikumpulkan, ditangkap, diekstraksi, dan disimpan dari berbagai sumber, sangat
sulit untuk melacak sumber data tersebut.
5 V Pada Big Data: Value

•Data yang besar seharusnya berdampak (secara moneter) terhadap suatu


perusahaan yang menggunakan komputasi Big Data

• Akan sia-sia bila memiliki data yang sangat besar tapi tidak tahu bagaimana
cara mengolah dan menganalisisnya, hanya akan buang-buang resource
EKOSISTEM BIG DATA

1. Data Devices
2. Data Collectors
3. Data Aggregators: kompilasi informasi dari database dengan tujuan
untuk mempersiapkan dataset gabungan untuk pengolahan data.
4. Data Users/ Buyers
Apa yang dimasud dengan Analytics? Sebuah titik awal untuk memahami Analytics adalah
Cara untuk mengeksplorasi/menyelidiki/ memahami secara mendalam suatu objek sampai ke
akar-akarnya • Hasil analytics biasa tidak menyebabkan banyak kebingungan, karena
konteksnya biasanya membuat makna yang jelas Gambar: Dari DSS berkembang menjadi BI
kemudian menjadi Analytics
Big Data Analytic

BI dapat dilihat sebagai istilah umum untuk semua aplikasi yang mendukung
DSS, dan bagaimana hal itu ditafsirkan dalam industri dan semakin meluas
sampai di kalangan akademisi.
• BI berevolusi dari DSS, dan orang dapat berargumentasi bahwa Analytics
berevolusi dari BI (setidaknya dalam hal peristilahan). Dengan demikian,
Analytics merupakan istilah umum untuk aplikasi analisis data.
• Big Data Analytics: Alat dan teknik analisis yang akan sangat membantu dalam
memahami big data dengan syarat algoritma yang menjadi bagian dari alat-alat
ini harus mampu bekerja dengan jumlah besar pada kondisi real-time dan pada
data yang berbeda-beda.
Referensi :
• . Presentasi Pengantar Big Data, M Ali Fauzi Univ Brawijaya

2. Presentasi Big Data Overview, Umar Aditiawarman, P.hD, Universitas Nusa Putra

Anda mungkin juga menyukai