Anda di halaman 1dari 3

Nama : Haykal Dzikri Putra Aditya

NRT : 2022.2692.1.02
Prodi : Administrasi Keimigrasian B

1. Sebutkan contoh-contoh data terstruktur dan data tidak terstruktur!


Jawab :
• Data terstruktur adalah data yang diatur dalam format yang terorganisir dengan baik, dengan
skema yang jelas dan definisi yang spesifik. Contoh data terstruktur :
 File CSV (Comma-Separated Values): Data yang diatur dalam format teks dengan
nilai-nilai yang dipisahkan oleh tanda koma.
 Spreadsheet: Data yang diatur dalam lembar kerja dengan kolom dan baris yang dapat
diurutkan dan difilter.
 XML (eXtensible Markup Language): Data yang diatur menggunakan tag-tag yang
mendefinisikan struktur dan hierarki.
 JSON (JavaScript Object Notation) adalah format data ringan yang digunakan untuk
pertukaran data antar aplikasi sehingga dapat mudah untuk ditulis dan dipahami.
• Data tidak terstruktur adalah data yang tidak memiliki format yang terorganisir dan tidak
dapat diatur dalam skema yang jelas.Data tidak terstruktur sering kali memerlukan teknik
pemrosesan khusus untuk mengekstraksi informasi yang berharga darinya. Contoh data tidak
terstruktur :
 Teks bebas: Data dalam bentuk paragraf atau dokumen teks yang tidak memiliki
struktur terdefinisi.
 Gambar
 Audio atau Video
 Email

2. Apa yang harus diperhatikan untuk mengidentifikasikan data yang ada , apakah data tersebut
big data atau bukan?
Jawab :
Volume
Volume data adalah ukuran awal dan jumlah data yang dikumpulkan. Semakin besar volume
data yang dikumpulkan, semakin besar kemungkinan data tersebut dianggap sebagai Big
Data.
Velocity
Kecepatan merujuk pada seberapa cepat data dihasilkan dan bergerak. Kecepatan data
menjadi aspek penting bagi perusahaan yang membutuhkan data mereka mengalir dengan
cepat, sehingga tersedia pada waktu yang tepat untuk membuat keputusan bisnis terbaik.
Variety
Salah satu karakteristik utama dari Big Data adalah kemampuannya untuk menangkap semua
hal yang berharga dalam ekosistem bisnis. Selain data terstruktur yang biasa digunakan dalam
bisnis, terdapat pula kumpulan data tidak terstruktur seperti gambar, video, suara, file datar,
badan email, file log, dan lain sebagainya. Meskipun data ini tidak langsung memiliki nilai,
alat canggih dapat digunakan untuk mengolahnya dan memperoleh wawasan yang berharga
dalam membangun sistem yang lebih cerdas.
Veracity
Konsep ini berkaitan dengan kualitas dan akurasi data yang dikumpulkan. Terkadang, data
yang dikumpulkan mungkin memiliki bagian yang hilang, tidak akurat, atau bahkan tidak
memberikan wawasan yang berguna. Veracity merujuk pada tingkat kepercayaan yang ada
dalam data yang dikumpulkan secara keseluruhan.

3. Jelaskan perbedaan terkait Traditional Architecture dengan Dostributed Computing!


Jawab :
Traditional Architecture dan Distributed Computing adalah dua pendekatan yang berbeda
dalam desain dan implementasi sistem komputasi. Traditional architecture cenderung terpusat
dengan satu pusat kontrol dan keterbatasan skala, sedangkan distributed computing
menawarkan distribusi sumber daya, skalabilitas, kinerja terdistribusi, dan ketahanan terhadap
kegagalan. Distributed computing sering digunakan dalam sistem yang membutuhkan
pemrosesan paralel, pemrosesan data besar, dan ketahanan tinggi.

4. Apa yang kalian ketahui tentang Hadoop? jelaskan!


Jawab :
Hadoop adalah kerangka kerja (framework) sumber terbuka yang dirancang untuk mengelola
dan menganalisis data yang sangat besar secara terdistribusi. Tujuan utama Hadoop adalah
memungkinkan pengolahan data yang cepat, andal, dan efisien melalui paralelisasi dan
pengelompokan tugas pada sejumlah besar komputer Hadoop.
Dalam keseluruhan, Hadoop adalah kerangka kerja yang kuat dan populer untuk pemrosesan
data skala besar yang memungkinkan organisasi untuk mengatasi tantangan yang terkait
dengan pemrosesan dan penyimpanan data yang besar dan kompleks.
5. Apa yang harus diperhatikan sebelum kita menginstall big data distribution? Jelaskan!
Jawab :
Sebelum menginstal distribusi big data, ada beberapa hal yang perlu diperhatikan. Berikut
adalah beberapa faktor yang harus dipertimbangkan sebelum menginstal big data distribution:
1) Kebutuhan Bisnis: Pertama-tama, identifikasi kebutuhan bisnis Anda dengan jelas. Apa
yang ingin Anda capai dengan menggunakan teknologi big data? Pemahaman yang jelas
tentang tujuan dan kebutuhan bisnis Anda akan membantu Anda dalam memilih distribusi
big data yang tepat.
2) Skala dan Volume Data: Pertimbangkan jumlah data yang ingin Anda kelola dan analisis.
Apakah volume data yang besar atau sedang? Beberapa distribusi big data dapat lebih
cocok untuk skala yang lebih besar daripada yang lain. Pastikan distribusi yang Anda pilih
dapat menangani jumlah data yang Anda miliki.
3) Kompatibilitas Hardware dan Software: Periksa persyaratan perangkat keras dan
perangkat lunak yang diperlukan oleh distribusi big data. Pastikan infrastruktur IT Anda
memenuhi persyaratan ini atau siap untuk diupgrade jika diperlukan.

Anda mungkin juga menyukai