Anda di halaman 1dari 3

NAMA : Cikal Ryan Rawani

NPM : 2226011126
KELAS : 122PA

Halaman 23
1. Apa saja ketiga karakteristik Big Data, dan apa saja pertimbangan utama dalam mengolah Big
Data?
2. Apa yang dimaksud dengan sandbox analitik dan mengapa itu penting?
3. Jelaskan perbedaan BI dan Ilmu Data ?
4. Jelaskan tantangan arsitektur analitik saat ini bagi ilmuwan data.
5. Apa saja keahlian utama dan karakteristik perilaku seorang data scientist?

JAWAB

1. Karakteristik Big Data


- Volume: Menunjukkan jumlah data yang sangat besar yang dihasilkan dan dikumpulkan.
- Velocity: Kecepatan di mana data dihasilkan, diterima, dan diolah.
- Variety: Beragamnya jenis dan sumber data yang tersedia.

Pertimbangan utama dalam mengolah Big Data meliputi:


- Pengumpulan Data: Mengumpulkan data yang bersifat masif.
- Kecepatan Pengolahan: Kemampuan pengolahan data yang cepat untuk mendapatkan insight
tepat waktu.
- Kualitas dan Keandalan Data: Memastikan data yang diolah berkualitas dan dapat diandalkan.
- Privasi dan Keamanan Data: Menjaga privasi dan keamanan data yang diolah.

2. Sandbox Analitik adalah lingkungan uji coba yang digunakan oleh analis data dan ilmuwan data
untuk bereksperimen dengan data dan mengeksplorasi berbagai pendekatan analitis tanpa
mempengaruhi lingkungan produksi. Ini penting karena memungkinkan eksplorasi dan inovasi
dengan risiko yang lebih rendah, serta kolaborasi dan berbagi pekerjaan dengan rekan kerja.

3. Perbedaan BI dan Ilmu Data:


- Business Intelligence (BI) berfokus pada analisis data historis untuk memonitor area yang perlu
diperhatikan dan menarik insight.
- Data Science menghasilkan insight prediktif dari pola data yang dianalisa dengan algoritma
Machine Learning.

4. Tantangan Arsitektur Analitik bagi ilmuwan data meliputi integrasi data real-time dari berbagai
sumber yang mungkin menjalankan beban kerja transaksi, operasional, atau analitik dan menyimpan
jenis data terstruktur dan tidak terstruktur.

5. Keahlian Utama dan Karakteristik Perilaku Data Scientist:


- Keahlian Utama: Penguasaan matematika, statistika, dan pemrograman. Kemampuan dalam
pengolahan data, machine learning, dan bahasa pemrograman seperti Python dan SQL.
- Karakteristik Perilaku: Rasa ingin tahu yang tinggi, intuisi terhadap data, kreativitas, dan
keterampilan interpersonal yang baik untuk kerja tim.

Halaman 61
1. Pada fase manakah tim akan menginvestasikan sebagian besar waktu proyeknya? Mengapa? Di
mana tim akan menghabiskan waktu paling sedikit?
2. Apa manfaat melakukan program percontohan sebelum metodologi analisis baru diluncurkan
secara penuh?
3. Alat apa saja yang akan digunakan pada fase berikut ini, dan skenario penggunaannya seperti
apa?
JAWAB
1.Tim ilmu data akan menginvestasikan sebagian besar waktu proyeknya pada Fase 1 (Penemuan) dan
Fase 2 (Persiapan Data). Hal ini karena kedua fase ini melibatkan pengidentifikasian masalah yang tepat
dan penyelidikan yang cermat terhadap kumpulan data yang diperlukan untuk analisis mendalam.
Persiapan data adalah langkah kritis karena data yang berkualitas tinggi dan relevan adalah fondasi dari
setiap analisis yang sukses. Waktu paling sedikit mungkin dihabiskan pada Fase 6 (Operasionalkan),
karena setelah sistem diterapkan, tugas utamanya adalah pemeliharaan dan pemantauan rutin.

2. Manfaat melakukan program percontohan sebelum peluncuran penuh metodologi analisis baru
meliputi:
- Pengujian efektivitas: Memastikan bahwa metodologi baru berfungsi seperti yang diharapkan dalam
kondisi nyata.
- Identifikasi masalah: Mengungkapkan masalah atau kekurangan yang mungkin tidak terlihat selama
fase perencanaan.
- Pelatihan pengguna: Memberikan kesempatan bagi pengguna untuk membiasakan diri dengan sistem
baru sebelum diluncurkan secara luas.
- Pengumpulan umpan balik: Memperoleh masukan dari pengguna awal yang dapat digunakan untuk
meningkatkan sistem sebelum peluncuran skala penuh.

3. Alat yang akan digunakan pada masing-masing fase adalah:


- Fase 1 (Penemuan): Alat untuk analisis kebutuhan dan pemetaan masalah, seperti diagram alir dan
papan cerita.
- Fase 2 (Persiapan Data): Alat untuk pembersihan dan transformasi data, seperti perangkat lunak ETL
(Extract, Transform, Load) dan alat visualisasi data.
- Fase 3 (Perencanaan Model): Alat untuk pemilihan model statistik atau pembelajaran mesin, seperti
perangkat lunak analisis prediktif.
- Fase 4 (Pembuatan Model): Alat untuk pengembangan dan validasi model, seperti lingkungan
pengembangan terintegrasi (IDE) untuk data science.
- Fase 5 (Komunikasikan Hasilnya): Alat untuk visualisasi data dan pembuatan laporan, seperti
dashboard interaktif dan alat presentasi.
- Fase 6 (Operasionalkan): Alat untuk otomatisasi dan pemantauan model, seperti scheduler tugas dan
sistem manajemen performa.

Anda mungkin juga menyukai