Anda di halaman 1dari 2

Tugas Kelompok ke-1

Week 3

Jawablah soal berikut dengan benar!

A. Soal Essay
1. Apa beda Big Data, Data Science dan Machine Learning?
2. Menurut rekan - rekan, apa peran penting big data bagi perusahaan dan
hubungannya dengan strategi perusahaan?
3. Jelaskan kelebihan dan kekurangan antara data terstruktur dan data tidak
terstruktur, serta berikan contoh dari masing – masing tersebut.

4. Jelaskan tantangan yang dihadapi oleh teknologi big data. jelaskan


pendapat anda adakah solusi mengenai hal tersebut.
Jawab :
Banyak tantangan ketika berurusan dengan data. Beberapa data
terstruktur yang dapat disimpan dalam database tradisional, sementara
beberapa adalah video, gambar, dan dokumen, yang mungkin tidak
terstruktur atau semi-terstruktur, dihasilkan oleh sensor, media sosial,
satelit, transaksi bisnis, dan banyak lagi. Meskipun data ini dapat dikelola
secara independen, tantangan sebenarnya adalah bagaimana
memahaminya denganmengintegrasikan data yang berbeda dari sumber
yang beragam.
a. Heterogenitas dan ketidaklengkapan
Tipe data big data bersifat heterogen karena data terintegrasi dari
berbagai sumber dan karenanya harus disusun dan disajikan dengan hati-
hati sebagai data homogen sebelum analisis big data. Data yang
dikumpulkan mungkin tidak lengkap, membuat analisis menjadi lebih
rumit.
b. Volume dan kecepatan data
Mengelola volume big data yang besar dan terus meningkat adalah
perhatian terbesar di era big data. Di masa lalu, peningkatan volume data
ditangani dengan menambahkan unit memori tambahan dan sumber daya
komputer. Tetapi volume data meningkat secara eksponensial, yang tidak
dapat ditangani oleh model penyimpanan basis data tradisional yang ada.
Semakin besar volume data, semakin
lama waktu yang dibutuhkan untuk pemrosesan dan analisis.
Tantangan yang dihadapi dengan kecepatan tidak hanya berarti kecepatan
di mana data datang dari berbagai sumber tetapi juga kecepatan di mana
data harus diproses dan dianalisis dalam kasus analisis waktu nyata.
Misalnya, dalam kasus transaksi kartu kredit, jika dicurigai ada aktivitas
penipuan, transaksi harus ditolak secara real-time.
c. Penyimpanan data
Volume data yang disumbangkan oleh media sosial, Internet seluler, retail
online, dan sebagainya, sangat besar dan melampaui kapasitas
penanganan basis data tradisional. Hal ini membutuhkan mekanisme
penyimpanan yang sangat terukur untuk memenuhi permintaan yang terus
meningkat. Mekanisme penyimpanan harus mampu menampung data yang
terus bertambah, yang sifatnya kompleks. Ketika volume data diketahui
sebelumnya, kapasitas penyimpanan yang diperlukan ditentukan

Schlumb COMP6725 - Big Data Technologies


erger-
Private
sebelumnya. Namun dalam hal streaming data, kapasitas penyimpanan
yang dibutuhkan tidak ditentukan sebelumnya. Oleh karena itu, diperlukan
mekanisme penyimpanan yang mampu menampung data streaming ini.
Penyimpanan data harus dapat diandalkan dan juga toleran terhadap
kesalahan. Data yang disimpan harus diambil kembali di lain waktu. Data
ini dapat berupa riwayat pembelian pelanggan, rilis majalah sebelumnya,
detail karyawan perusahaan, umpan Twitter, gambar yang diambil oleh
satelit, catatan pasien di rumah sakit, transaksi keuangan pelanggan bank,
dan sebagainya.
d. Privasi data
Privasi data adalah kekhawatiran lain yang berkembang seiring dengan
peningkatan volume data. Akses yang tidak tepat ke data pribadi, EHRs,
dan transaksi keuangan merupakan masalah sosial yang mempengaruhi
privasi pengguna untuk sebagian besar. Data harus dibagikan dengan
membatasi tingkat pengungkapan data dan memastikan bahwa data yang
dibagikan cukup untuk mengekstrak pengetahuan bisnis darinya. Kepada
siapa akses ke data harus diberikan, batas akses ke data, dan
kapan data dapat diakses harus ditentukan sebelumnya untuk memastikan
bahwa data dilindungi.

5. Apa itu data ingestion dan parameter apa saja dimilikinya, berikan
penjelasan masing – masing parameter tersebut.

Week 3 ©Arif Schlumb 2|2


erger-
Private

Anda mungkin juga menyukai