1825041024
PTA S1 B/02
TUGAS PERTEMUAN 3
LATIHAN ULANGAN
a. Mobile Sensors
b. Social Media
c. Video Surveillance
d. Video Rendering
e. Smart Grids
f. Geophysical Exploration
g. Medical Imaging
h. Gene Sequencing
3. Jelaskan contoh masing-masing dari empat tipe utama struktur data yang
mungkin terlihat?
Jawaban:
a. Terstruktur data: Data yang berisi tipe data yang ditentukan, format,
dan struktur (yaitu, data transaksi, pengolahan analitik online [OLAP]
data kubus, RDBMS tradisional, file CSV, dan bahkan spreadsheet
sederhana).
b. Data semi-terstruktur: File data tekstual dengan pola yang dapat
dilihat yang memungkinkan parsing (seperti file data Extensible
Markup Language [XML] yang mendeskripsikan diri dan ditentukan
oleh skema XML).
c. Quasi-structured data: Data tekstual dengan format data tidak menentu
yang dapat diformat dengan upaya, alat, dan waktu (misalnya, data
clickstream web yang mungkin berisi ketidakkonsistenan dalam nilai
dan format data).
d. Data tidak terstruktur: Data yang tidak memiliki struktur yang
melekat, yang mungkin termasuk dokumen teks, PDF, gambar, dan
video.
Meskipun manfaat EDW dan 81, sistem ini cenderung membatasi fleksibilitas
yang diperlukan untuk melakukan analisis data yang kuat atau eksplorasi.
Dengan model EDW, data dikelola dan dikendalikan oleh kelompok TI dan
administrator basis data (D8A), dan analis data harus bergantung pada TI
untuk akses dan perubahan pada skema data. Ini membebankan lead time
yang lebih lama bagi analis untuk mendapatkan data; sebagian besar waktu
dihabiskan untuk menunggu persetujuan daripada memulai pekerjaan yang
berarti. Selain itu, banyak kali aturan EDW membatasi analis dari
membangun dataset. Akibatnya, adalah umum untuk sistem tambahan untuk
muncul yang berisi data penting untuk membangun kumpulan data analitik,
yang dikelola secara lokal oleh pengguna daya. Kelompok TI umumnya tidak
menyukai keberadaan sumber data di luar kendali mereka karena, tidak
seperti EDW, kumpulan data ini tidak dikelola, diamankan, atau dicadangkan.
Dari perspektif analis, EDW dan 81 memecahkan masalah yang terkait
dengan akurasi dan ketersediaan data. Namun, EDW dan 81 memperkenalkan
masalah baru yang terkait dengan fleksibilitas dan kelincahan, yang kurang
menonjol ketika berhadapan dengan spreadsheet.
Ada beberapa hal yang perlu dipertimbangkan dengan proyek Big Data
Analytics untuk memastikan pendekatan sesuai dengan sasaran yang
diinginkan. Karena karakteristik Big Data, proyek-proyek ini memberikan
dukungan keputusan untuk pengambilan keputusan strategis bernilai tinggi
dengan kompleksitas pemrosesan yang tinggi. Teknik analitik yang
digunakan dalam konteks ini harus iteratif dan fleksibel, karena tingginya
volume data dan kompleksitasnya. Melakukan analisis yang cepat dan
kompleks membutuhkan koneksi jaringan throughput yang tinggi dan
pertimbangan untuk jumlah latensi yang dapat diterima. Misalnya,
mengembangkan rekomendasi produk real-time untuk situs web
memberlakukan tuntutan sistem yang lebih besar daripada mengembangkan
pendorong waktu nyata, yang mungkin masih memberikan kinerja yang dapat
diterima, memiliki latensi sedikit lebih besar, dan mungkin lebih murah untuk
diterapkan. Pertimbangan ini memerlukan pendekatan yang berbeda untuk
memikirkan tantangan analitik, yang akan dieksplorasi lebih lanjut di bagian
selanjutnya.
5. Berikanlah Contoh tentang Big data Analytics?
Jawaban:
Hadoop mewakili contoh lain dari inovasi Big Data pada infrastruktur TI.
Apache Hadoop adalah kerangka kerja open source yang memungkinkan
perusahaan untuk memproses sejumlah besar informasi dengan cara yang
sangat paralel. Hadoop merupakan implementasi spesifik dari paradigma
MapReduce dan dirancang oleh Doug Cutting dan Mike Cafarella pada tahun
2005 untuk menggunakan data dengan berbagai struktur. Ini adalah kerangka
teknis yang ideal untuk banyak proyek Big Data, yang bergantung pada
kumpulan data besar atau berat dengan struktur data yang tidak konvensional.
Salah satu manfaat utama dari Hadoop adalah menggunakan sistem file
terdistribusi, yang berarti dapat menggunakan sekumpulan server dan
perangkat keras komoditas terdistribusi untuk memproses sejumlah besar
data.
Pada 2014, Linkedln memiliki lebih dari 250 juta akun pengguna dan telah
menambahkan banyak fitur tambahan dan produk terkait data, seperti
perekrutan, alat pencari kerja, iklan, dan lnMaps, yang menunjukkan grafik
sosial dari jaringan profesional pengguna. Gambar 1-14 adalah contoh dari
visualisasi In Map yang memungkinkan pengguna Linked In untuk
mendapatkan pandangan yang lebih luas tentang keterkaitan kontaknya dan
memahami bagaimana dia tahu sebagian besar dari mereka.
6. Jelaskan Pengertian Data Warehouse?
Jawaban:
a. Pembuatan Laporan.
Pembuatan laporan merupakan salah satu kegunaan data warehouse
yang paling umum dilakukan. Dengan menggunakan query sederhana
didapatkan laporan perhari,perbulan, pertahun atau jangka waktu
kapanpun yang diinginkan.
Metadata dalam sebuah Data Warehouse mirip dengan kamus data atau
katalog data dalam sebuah DBMS. Dalam kamus data, informasi seperti
struktur data dijaga, informasi mengenai file dan alamatnya, informasi
mengenai indeks dan lain sebagainya. Kamus data berisikan data tentang data
di dalam database. Komponen Metadata adalah data mengenai data di dalam
Data Warehouse. Metadata di dalam Data Warehouse mirip dengan sebuah
sebuah kamus data, namun lebih dari sekedar kamus data.