Anda di halaman 1dari 7

Nama : Javier Aditama Falaq

Nim ; 2502081051

Tugas Personal ke-1


Week 2

Jawablah soal berikut dengan benar!

A. Soal Essay
1. Apakah big data itu dan apa peluang dan tantangan yang diberikan
buat pemasar?
2. Big data terdiri beberapa karakteristik bagian penting antara lain 10v.
jelaskan 10v tersebut?
3. Mengapa perlu mengintegrasikan Big Data untuk bisnis? Jelaskan
jawaban anda
4. Jelaskan siklus dari Big data dan jelaskan masing – masing bagian
tersebut.
5. Mengapa kita perlu menggunakan database NoSQL dalam pengelolaan
big data? jelaskan alasannya.

COMP6725 - Big Data Technologies


Jawab:
1. Big Data didefinisikan sebagai kumpulan kumpulan data yang volume,
kecepatan, atau variasinya sangat besar sehingga sulit untuk menyimpan,
mengelola, memproses, dan menganalisis data menggunakan basis data
tradisional dan alat pemrosesan data.
Big Data memiliki potensi untuk mendukung aplikasi pintar generasi
berikutnya yang akan memanfaatkan kekuatan data untuk membuat
aplikasi menjadi cerdas. Aplikasi big data menjangkau berbagai domain
seperti web, ritel dan pemasaran, perbankan dan keuangan, industri,
perawatan kesehatan, lingkungan, Internet of Things, dan sistem cyber-
fisik.
Analisis Big Data berkaitan dengan pengumpulan, penyimpanan,
pemrosesan, dan analisis data skala besar ini. Alat dan kerangka kerja
khusus diperlukan untuk analisis big data ketika:
a. volume data yang terlibat sangat besar sehingga sulit untuk
menyimpan, memproses, dan menganalisis data pada satu mesin.
b. Kecepatan data sangat tinggi dan data perlu dianalisis secara real-time.
c. Ada berbagai data yang terlibat, yang dapat terstruktur, tidak
terstruktur atau semi-terstruktur, dan dikumpulkan dari berbagai
sumber data.
d. Berbagai jenis kebutuhan analitik dilakukan untuk mengekstrak nilai
dari data seperti analisis deskriptif, diagnostik, prediktif dan
preskriptif. Alat dan kerangka kerja Big Data telah didistribusikan dan
arsitektur pemrosesan paralel dan dapat memanfaatkan penyimpanan
dan sumber daya komputasi dari sekelompok besar mesin.

Analisis big data melibatkan beberapa langkah mulai dari pembersihan


data, munging data (atau pertengkaran), pemrosesan data, dan visualisasi.
Siklus hidup analitik big data dimulai dari pengumpulan data dari berbagai
sumber data.

2. Karakteristik yang mendasari big data meliputi:


a. Volume
Big data adalah bentuk data yang volumenya sangat besar sehingga
tidak muat pada satu mesin, oleh karena itu diperlukan alat dan
kerangka kerja khusus untuk menyimpan proses dan menganalisis data
tersebut. Misalnya, aplikasi media sosial memproses miliaran pesan
setiap hari, sistem industri dan energi dapat menghasilkan terabyte data
sensor setiap hari, aplikasi agregasi taksi dapat memproses jutaan
transaksi dalam sehari, dll.
b. Velocity
Kecepatan data mengacu pada seberapa cepat data dihasilkan. Data
yang dihasilkan oleh sumber tertentu dapat sampai pada kecepatan
yang sangat tinggi, misalnya data media sosial atau data sensor.
c. Variety

Week 2 ©Arif 2|7


Varietas mengacu pada bentuk data. Big data datang dalam berbagai
bentuk seperti terstruktur, tidak terstruktur, atau semi terstruktur,
termasuk data teks, gambar, audio, video, dan data sensor.
d. Veracity
Veracity mengacu pada seberapa akurat data tersebut. Untuk
mengekstrak nilai dari data, data perlu dibersihkan untuk
menghilangkan noise.
e. Value
Nilai data mengacu pada kegunaan data untuk tujuan yang
dimaksudkan. Tujuan akhir dari setiap sistem analitik big data adalah
untuk mengekstrak nilai dari data. Nilai suatu data juga berkaitan
dengan kebenaran atau keakuratan data tersebut.
f. Validity
Kebenaran atau keakuratan data yang digunakan untuk mengekstrak
hasil berupa informasi result
g. Variability
Data datang secara konstan dari sumber yang berbeda dan seberapa
efisien membedakan antara data yang noisy atau data penting
h. Venue
Berbagai jenis data datang dari sumber yang berbeda melalui platform
yang berbeda seperti sistem personal dan cloud pribadi & public.
i. Vocabulary
Terminologi data seperti model data dan struktur data
j. Vagueness
Ketidakjelasan menyangkut kenyataan dalam informasi yang
menyarankan sedikit atau tidak ada pemikiran tentang apa yang
mungkin disampaikan masing-masing.

3. Karena Big Data dapat membantu perusahaan dalam mengenal serta


memahami para pelanggan dengan lebih baik. Hal ini menjadi salah satu
alasan mengapa perlu mengintegrasikan Big Data untuk bisnis.  Big Data
memang memiliki kemampuan analisis data yang hebat terhadap seluruh
informasi yang terkait pelanggan yang membeli produk. Dengan
memahami pelanggan, perusahaan bisa lebih mudah dalam menyediakan
produk yang sesuai dengan keinginan dan kebutuhan mereka. Setelah itu,
perusahaan pun akan lebih mudah meminimalisir komplain dari para
pelanggan.  

4. Siklus hidup big data:


a. Big Data Generation
Fase pertama dari siklus hidup big data adalah pembuatan data. Skala
data yang dihasilkan dari sumber yang beragam secara bertahap
berkembang.
b. Data Aggregation

Week 2 ©Arif 3|7


Fase agregasi data dari siklus hidup big data melibatkan pengumpulan
data mentah, mentransmisikan data ke platform penyimpanan, dan
memprosesnya terlebih dahulu

Week 2 ©Arif 4|7


c. Data Preprocessing
Pra-pemrosesan data adalah proses penting yang dilakukan pada data
mentah untuk mengubahnya menjadi format yang dapat dipahami dan
menyediakan akses ke data yang konsisten dan akurat. Ada beberapa
langkah yang terlibat dalam preprocessing data:
 Data integration, integrasi data melibatkan penggabungan data
dari sumber yang berbeda untuk memberikan tampilan data
terpadu kepada pengguna akhir.
 Data cleaning, proses pembersihan data mengisi nilai yang hilang,
memperbaiki kesalahan dan inkonsistensi, dan menghilangkan
redundansi dalam data untuk meningkatkan kualitas data.
 Reduksi data, merupakan konsep pengurangan volume data atau
pengurangan dimensi data, yaitu jumlah atribut.
 Data transformation, transformasi data mengacu pada
transformasi atau konsolidasi data ke dalam format yang sesuai
dan mengubahnya menjadi informasi logis dan bermakna untuk
manajemen dan analisis data. Transformasi data melibatkan
strategi berikut:
o Smoothing, yang menghilangkan noise dari data dengan
menggabungkan teknik binning, clustering, dan regresi.
o Agregasi, yang menerapkan ringkasan atau agregasi pada
data untuk memberikan data yang terkonsolidasi. (Misalnya,
keuntungan harian suatu organisasi dapat digabungkan untuk
memberikan omset bulanan atau tahunan yang
terkonsolidasi).
o Generalisasi, yang biasanya dipandang sebagai memanjat
hierarki di mana atribut digeneralisasikan ke tingkat yang
lebih tinggi dengan mengabaikan atribut di tingkat yang lebih
rendah. (Misalnya, nama jalan dapat digeneralisasikan
sebagai nama kota atau hierarki tingkat yang lebih tinggi,
yaitu nama negara).
o Diskritisasi, yang merupakan teknik di mana nilai mentah
dalam data (misalnya, usia) diganti dengan label
konseptual (misalnya, remaja, dewasa, senior) atau label
interval (misalnya, 0–9, 10–19, dll.)
d. Analisis big data
Mengumpulkan, menyimpan, dan memproses data sebelumnya hanya
menghasilkan sedikit nilai. Itu harus dianalisis dan pengguna akhir
harus membuat keputusan dari hasil untuk mendapatkan nilai bisnis
dari data.

Week 2 ©Arif 5|7


Week 2 ©Arif 6|7
e. Visualisasi Big Data
Visualisasi membuat siklus hidup big data selesai membantu pengguna
akhir untuk mendapatkan wawasan dari data.

5. Database NoSQL dibuat dengan tujuan khusus untuk model data spesifik
dan memiliki skema fleksibel untuk membuat aplikasi modern. Database
NoSQL dikenal secara luas karena kemudahan pengembangan,
fungsionalitas, dan kinerja dalam berbagai skala.
Database NoSQL sangat cocok untuk digunakan dengan berbagai aplikasi
modern seperti aplikasi seluler, web, dan gaming yang memerlukan
database yang fleksibel, dapat diskalakan, berkinerja tinggi, dan memiliki
fungsionalitas tinggi untuk memberikan pengalaman pengguna yang baik.
a. Fleksibilitas: Database NoSQL umumnya menyediakan skema fleksibel
yang memungkinkan pengembangan yang lebih cepat dan lebih
berulang. Model data fleksibel membuat database NoSQL ideal untuk
data yang semi terstruktur dan tidak terstruktur.
b. Skalabilitas: Database NoSQL umumnya didesain untuk meningkatkan
skala dengan menggunakan klaster perangkat keras yang terdistribusi
alih-alih meningkatkan skala dengan menambah server yang mahal dan
robust. Beberapa penyedia layanan cloud menangani aktivitas di balik
operasi ini sebagai layanan yang dikelola sepenuhnya.
c. Kinerja tinggi: Database NoSQL dioptimalkan untuk model data
spesifik dan pola akses yang memberikan kinerja yang lebih tinggi
dibandingkan jika Anda mencoba mendapatkan fungsionalitas yang
mirip dengan database relasional.
d. Fungsionalitas tinggi: Database NoSQL menyediakan API dan jenis
data fungsional yang dibuat secara khusus untuk setiap model data yang
sesuai.

Week 2 ©Arif 7|7

Anda mungkin juga menyukai