Anda di halaman 1dari 13

LECTURE NOTES

Big Data Technologies


Week ke - 1

Fundamentals of Big Data


LEARNING OUTCOMES

1. Peserta diharapkan mampu menjelaskan dasar-dasar big data

OUTLINE MATERI :

1. Pengenalan Big Data

2. Karakteristik Big Data

3. Keuntungan dan Kerugian Big Data

4. Dampak Big Data


Pengenalan Big Data
Big Data adalah bidang yang mencakup analisis, pemrosesan, dan penyimpanan kumpulan data
dalam jumlah besar yang sering kali berasal dari sumber berbeda. Big Data biasanya diperlukan
ketika teknologi dan teknik analisis, pemrosesan, dan penyimpanan data tradisional tidak
mencukupi.

Analisis Big Data adalah upaya interdisipliner yang memadukan matematika, statistik, ilmu
komputer, dan keahlian dibidang tertentu. Perpaduan keahlian dan perspektif ini telah
menimbulkan kebingungan mengenai apa yang dimaksud dengan bidang Big Data dan
analisisnya, karena respons yang diterima akan bergantung pada perspektif siapa pun yang
menjawab pertanyaan tersebut. Batasan masalah Big Data juga berubah karena lanskap teknologi
perangkat lunak dan perangkat keras yang terus berubah dan maju.

Pada Big Data terdapat 3 tipe data yang dikenal dengan data terstruktur, data yang tidak
terstruktur, dan data semi terstruktur. Data Terstruktur adalah data yang mengikuti format atau
struktur tertentu. Data terstruktur ini dapat dibaca mesin dan dapat disimpan, diakses, dan
diproses menggunakan pendekatan tradisional seperti structured query languages (SQL) untuk
mengekstrak informasi untuk kueri pengguna. Sekitar 20% data di dunia adalah data terstruktur.
Data dalam tabel dan spreadsheet database relasional adalah contoh paling umum dari data
terstruktur.

Fig 1. Symbol to represent structured data

Data Tidak Terstruktur adalah data yang tidak mengikuti format tertentu yang telah ditentukan
sebelumnya. Data tidak terstruktur ini tidak dapat dibaca oleh mesin, sehingga pemrosesan data
tidak terstruktur merupakan pekerjaan yang cukup rumit karena teknik tradisional (mengikuti
format terstruktur) tidak efektif. Saat ini sebagian besar data yang dihasilkan menggunakan web,

Big Data Technologies


perangkat seluler, jaringan sensor, dll., tidak terstruktur, Contoh : gambar, video, data sinyal dan
media lainnya.

Fig 2. all types of unstructured data

Data Semi Terstruktur adalah data yang tidak sepenuhnya terstruktur tetapi mengikuti beberapa
tingkat organisasi dalam penyajiannya. Kita perlu memproses data ini terlebih dahulu agar dapat
dibaca mesin. Karena sifat tekstual data ini dan kesesuaiannya dengan tingkat struktur tertentu,
data ini lebih mudah diproses dibandingkan data tidak terstruktur. Sebagian besar konten web
yang dikembangkan menggunakan HTML, JSON dan XML adalah data semi terstruktur.

Fig 3. all types of semi-structured data

Dengan berkembangnya zaman, maka jumlah data juga semakin banyak. Berikut evolusi big data
dari masa ke masa.

Big Data Technologies


• Tahap-1: Sistem manajemen database tradisional berdasarkan konten terstruktur seperti
RDBMS dan data warehouse. Aplikasi yang ditargetkan adalah OLTP dan OLAP-based
processing yang menggunakan teknik data mining yang khas.

• Tahap-2: Fokus dialihkan ke penggalian informasi dari konten tidak terstruktur berbasis
web. Aplikasi yang ditargetkan adalah Sistem Information Retrieval (IR), analisis
sentimen atau analisis opini analisis media social, dan sistem untuk menjawab
pertanyaan.

• Tahap-3: Penyimpanan dan manipulasi data sensor yang dihasilkan terutama dari
perangkat seluler dan jaringan sensor lainnya. Aplikasi yang ditargetkan adalah analisis
spasial-temporal, analisis emosi dan kepuasan subyektif, IoT, MIoT, IIoT, dll.

Fig 4. Evolution stages of big data

Karakteristik Big Data


Big data biasanya digambarkan dengan istilah V. Pada awalnya tiga V yang paling populer
adalah volume, kecepatan, dan variasi (Khan, 2017). Namun, di beberapa sumber dapat
ditemukan hingga 40 V yang digunakan untuk mendefinisikan big data. Dari sekian banyaknya
V, ada 5 V yang paling relevan dengan big data.

Big Data Technologies


Fig 5. Big data characteristics

Sejumlah besar data disebut sebagai “volume”. Salah satu ciri utama big data adalah volumenya
yang sangat besar. Kuantitas data merupakan faktor penting untuk dipertimbangkan ketika
menggunakannya untuk analisis. Istilah “big data” mengacu pada situasi di mana jumlah data
yang akan diproses sangat besar. Terdapat sekitar 44 zettabytes data di dunia pada tahun 2020.
Berdasarkan jumlah data yang dihasilkan setiap hari kemungkinan akan menjadi 175 zettabytes
pada tahun 2025 (Vuleta, 2021).

Big Data Technologies


Fig 6. Users world-wide create over 2.5 exabytes of data a day

Istilah “velocity” mengacu pada kecepatan pembuatan data atau seberapa cepat data dihasilkan
dan diproses. Saat ini data dihasilkan dengan kecepatan tinggi dari jaringan sensor, mesin
komputasi berproses tinggi, media sosial, industri hiburan digital, ponsel, dan sumber lainnya.
Sekitar 18,7 miliar pesan teks dibuat setiap hari. Facebook menghasilkan sekitar empat petabyte
data setiap hari (Vuleta, 2021)

Fig 7. Examples of high-velocity big data datasets

Big Data Technologies


“Variasi” mengacu pada berbagai bentuk data, yaitu apakah data tersebut terstruktur, tidak
terstruktur, atau semi terstruktur. Selain itu, ini juga merujuk pada banyak sumber data yang
berbeda. IBM memperkirakan bahwa lebih dari 90% data real time adalah data tidak terstruktur.

Fig 8. Examples of high-variety big data datasets

“Veracity” mengacu pada keandalan atau kualitas data yang akan digunakan untuk tujuan
analisis. Data yang masuk ke lingkungan Big Data perlu dinilai kualitasnya, yang dapat
mengarah pada kegiatan pemrosesan data untuk menyelesaikan data yang tidak valid dan
menghilangkan noise. Sehubungan dengan veracity, data dapat menjadi bagian dari sinyal atau
noise dari suatu kumpulan data. Noise adalah data yang tidak dapat diubah menjadi informasi
sehingga tidak memiliki nilai, sedangkan sinyal memiliki nilai dan menghasilkan informasi yang
bermakna.

Untuk organisasi mana pun, semua data yang tersedia tidak memiliki kegunaan atau nilai yang
sama. Data mentah tidak memiliki nilai atau signifikansi apa pun. Untuk mendapatkan informasi
yang berguna darinya, informasi tersebut harus terlebih dahulu diproses dan diubah sesuai
kebutuhan organisasi. Karakteristik nilai secara intuitif berkaitan dengan karakteristik kebenaran
semakin tinggi fidelitas data, semakin besar nilai yang dimilikinya bagi bisnis. Nilai dan waktu
mempunyai hubungan yang berbanding terbalik. Semakin lama waktu yang dibutuhkan data
untuk diubah menjadi informasi yang bermakna, semakin kecil nilainya bagi sebuah bisnis.

Big Data Technologies


Fig 9. Relationship between value, veracity, and time of data

Keuntungan dan Kerugian Big Data


Big data memberikan banyak manfaat dengan memanfaatkan sejumlah besar data yang tersedia
untuk mendapatkan informasi berharga dan membuat keputusan yang lebih baik. Namun, ada
beberapa poin penting yang membuat penanganan big data merugikan organisasi.

Berikut adalah keuntungan dari penggunaan big data:

• Memberikan wawasan bisnis yang lebih baik.

• Membantu dalam mengembangkan solusi inovatif.

• Membantu dalam memahami dan menargetkan pelanggan.

• Membantu dalam meningkatkan layanan pelanggan.

• Membantu dalam meningkatkan produktivitas.

• Membantu dalam deteksi penipuan.

Big Data Technologies


• Membantu dalam meningkatkan ketangkasan.

• Membantu dalam pengambilan keputusan yang lebih baik.

• Membantu dalam optimalisasi biaya.

• Membantu dalam mengoptimalkan proses bisnis.

• Membantu dalam meningkatkan ilmu pengetahuan dan penelitian.

• Meningkatkan sistem perawatan kesehatan.

• Membantu dalam trading.

• Membantu dalam keamanan dan penegakan hukum.

Berikut adalah kerugian dari penggunaan big data:

• Dibutuhkan banyak uang untuk menyimpan dan memelihara data besar.

• Sebagian besar konten big data tidak terstruktur.

• Analisis big data dapat membahayakan privasi individu.

• Sulit untuk mempertahankan kepatuhan terhadap masalah hukum.

• Data dapat dimanipulasi dengan niat yang salah.

• Hal ini dapat meningkatkan stratifikasi sosial.

• Dalam banyak kasus, analisis big data dapat memberikan hasil yang salah.

• Karena pembuatan data secara real-time, big data bisa saja gagal menyamai angka
sebenarnya karena factor delay dan lainnya.

• Kurangnya orang yang terampil untuk melakukan analisis big data.

• Ada risiko keamanan seperti otentikasi, keandalan, kepercayaan, dll.

Big Data Technologies


Dampak Big Data
Perusahaan-perusahaan besar dengan cepat mengadopsi analisis big data karena memberikan
mereka keunggulan kompetitif di pasar. Dengan memanfaatkan analisis big data, perusahaan
besar dapat memperoleh wawasan tentang perilaku pelanggan, tren pasar, dan perkembangan
industri, sehingga memungkinkan mereka mengambil keputusan yang tepat dan mengoptimalkan
operasi mereka. Namun, perusahaan besar harus mewaspadai masalah keamanan data dan
privasi, karena mereka lebih rentan terhadap serangan siber dan pelanggaran data. Selain itu,
perusahaan besar harus memastikan bahwa mereka memiliki bakat dan keahlian yang diperlukan
untuk memanfaatkan data besar secara efektif.

Dalam track recordnya, beberapa Perusahaan yang mengimplementasikan big data merasakan
dampak baik dan buruknya. Berikut beberapa contoh real terkait dampak dari penggunaan big
data pada bisnis.

• Amazon: Amazon memanfaatkan analisis big data untuk mempersonalisasi rekomendasi


produknya, memungkinkan perusahaan meningkatkan penjualan dan meningkatkan
pengalaman pelanggan. Dengan menganalisis perilaku dan preferensi pelanggan, Amazon
dapat merekomendasikan produk yang selaras dengan minat dan kebutuhan pelanggan.

• Netflix: Netflix menggunakan analisis big data untuk mempersonalisasi rekomendasi


kontennya, sehingga memungkinkan perusahaan meningkatkan keterlibatan dan retensi
pelanggan. Dengan menganalisis perilaku dan preferensi pelanggan, Netflix dapat
merekomendasikan konten yang sesuai dengan minat dan kebutuhan pelanggan.

• UPS: UPS menggunakan analisis big data untuk mengoptimalkan rute pengirimannya,
memungkinkan perusahaan meningkatkan efisiensi dan mengurangi biaya. Dengan
menganalisis data dari berbagai sumber, termasuk pola lalu lintas, kondisi cuaca, serta
ukuran dan berat paket, UPS dapat mengoptimalkan rutenya untuk memastikan
pengiriman tepat waktu dan hemat biaya.

Big Data Technologies


KESIMPULAN

Big Data memberikan keuntungan besar dalam pengambilan keputusan dan inovasi, tetapi perlu
mengatasi tantangan privasi, keamanan, dan pemeliharaan data. Perusahaan perlu menerapkan
analisis Big Data dengan bijak untuk mendapatkan manfaat maksimal.

Big Data Technologies


DAFTAR PUSTAKA

1. Husain, M. S., Khan, M. Z., & Siddiqui, T. (2023). Big Data Concepts, Technologies,
and Applications. CRC Press. ISBN: 9781003441595. Ch 1.

2. Erl, T., Khattak, W., & Buhler, P. (2016). Big data fundamentals: concepts, drivers &
techniques. Prentice Hall Press. ISBN: 978-0-13-429107-9. Ch 1.

3. Asif, H. (2023, September 23). Big Data / Data Analytics Fundamentals. LinkedIn.
https://www.linkedin.com/pulse/big-data-analytics-fundamentals-huzaifa-asif/

Big Data Technologies

Anda mungkin juga menyukai