Disusun oleh:
L200200001
TAHUN 2022/2023
QUIZ 1
Jelaskan mengenai lambda dan kappa arsitektur. Penjelasan meliputi komponen yang ada
pada arsitektur dan perang masing-masing komponen tersebut. Selanjutnya buatlah tabel
perbandingan untuk mengkomparasi kelebihan dan kekurangan kedua arsitektur tersebut.
1. Arsitektur Lambda
Ketika bekerja dengan himpunan data yang sangat besar, diperlukan waktu lama
untuk menjalankan jenis kueri yang dibutuhkan klien. Kueri ini tidak dapat dilakukan
secara waktu nyata, dan sering kali memerlukan algoritme seperti MapReduce yang
beroperasi secara paralel di seluruh kumpulan data. Hasilnya kemudian disimpan secara
terpisah dari data mentah dan digunakan untuk kueri.
Arsitektur lambda mengatasi masalah ini dengan membuat dua jalur untuk aliran
data. Semua data yang masuk ke sistem melewati dua jalur ini:
Lapisan batch (jalur dingin) menyimpan semua data yang masuk dalam bentuk
mentahnya dan melakukan pemrosesan batch pada data. Hasil dari pemrosesan ini
disimpan sebagai tampilan batch.
Lapisan kecepatan (jalur panas) menganalisis data secara real time. Lapisan ini
dirancang untuk latensi rendah, dengan mengorbankan akurasi.
2. Arsitektur Kappa
Arsitektur kappa diusulkan oleh Jay Kreps sebagai alternatif dari arsitektur
lambda. Itu memiliki tujuan dasar yang sama dengan arsitektur lambda, tetapi dengan
perbedaan penting: Semua data mengalir melalui satu jalur, menggunakan sistem
pemrosesan aliran.
Ada beberapa kesamaan dengan lapisan batch arsitektur lambda, karena data
peristiwa tidak berubah dan semuanya dikumpulkan, bukan merupakan subset. Data
diserap sebagai aliran peristiwa ke dalam log terpadu yang terdistribusi dan toleran
terhadap kesalahan. Peristiwa-peristiwa tersebut diurutkan, dan keadaan peristiwa saat ini
diubah hanya oleh acara baru yang ditambahkan. Mirip dengan lapisan kecepatan
arsitektur lambda, semua pemrosesan peristiwa dilakukan pada aliran input dan bertahan
sebagai tampilan real-time.
Jika Anda perlu menyusun ulang seluruh kumpulan data (setara dengan apa yang
dilakukan lapisan batch di lambda), Anda cukup memutar ulang aliran, biasanya
menggunakan paralelisme untuk menyelesaikan perhitungan secara tepat waktu.
3. Perbandingan kelebihan dan kekurangan kedua arsitektur.