Anda di halaman 1dari 5

Soal

1. Tuliskan DDL Employee dan AnnualReviews

// Pembuatan Database dan Pembuatan Tabel Untuk Employee

mysql> CREATE DATABASE Employee;

mysql> CREATE TABLE Employee (FirstName VARCHAR(25),


LastName VARCHAR(25), ID VARCHAR(20), HireDate DATE,
TerminationDate DATE, Salary VARCHAR(25), PRIMARY KEY
(Employee));

// Pembuatan Database dan Pembuatan Tabel Untuk AnnualReviews

mysql> CREARE DATABASE AnnualReviews;

mysql> CREATE TABLE (ID VARCHART(20), EmpID VARCHART(20),


ReviewDate DATE));
2. Tuliskan kueri

SELECT [FirstName], [LastName], [ID], [HireDate],


[TerminationDate], [Salary]
FROM [Employee]

UNION

SELECT [ID], [EmpID], [ReviewDate]


FROM [AnnualReviews]

Pertanyaan Pengetahuan Dasar Data Engineer

1. Jelaskan apa yang kamu ketahui tentang Data Engineer.


2. Jelaskan apa yang kamu ketahui mengenai tugas sehari-hari dari seorang Data Engineer.
3. Jelaskan apa yang kamu ketahui tentang Data Modelling.
4. Jelaskan masing-masing perbedaan dalam design schemas pada Data Modelling. Jelaskan
dengan contoh.
5. Sebutkan ETL Tools yang biasa kamu pergunakan dan jelaskan perbandingannya dengan tools
ETL yang lain.
6. Sebutkan Teknologi/Bahasa Pemrograman yang harus di pelajari dan di kuasai ketika menjadi
seorang Data Engineer.

Jawaban Pengetahuan Dasar Data Engineer

1. Data Engineer adalah seseorang yang mengembangkan dan membuat desain arsitektur
manajemen data dan memelihara atau memonitor infrastruktur data, seperti sistem
database, data warehouse, data lake, dan sistem pemrosesan data berskala besar
2. Memiliki tugas untuk membangun infrastruktur data besar yang masih belum terstruktur,
setelah itu data engineer mengambil beberapa data yang penting yang butuhkan untuk suatu
analisa tertentu.
3. Model Data adalah sekumpulan konsep-konsep untuk menerangkan data, hubungan-
hubungan antara data dan batasan-batasan data yang terintegrasi di dalam suatu organisasi.
4. Perbedaan design schemas pada Data Modelling
- Kardinalitas (Cardinality) Antar Tabel
Database relasional menyimpan data dalam bentuk tabel dua dimensi tersusun atas
baris dan kolom. Sebuah tabel juga memiliki primary key berupa satu atau beberapa kolom.
Dua buah tabel bisa berelasi jika memiliki kolom yang serupa, dan kolom yang
serupa tersebut di satu tabel bertindak sebagai foreign key yang nilainya mengacu pada
kolom primary key di tabel lainnya. Relasi antar tabel memiliki rasio, perbandingan jumlah
baris di satu tabel dengan tabel lainnya, disebut juga kardinalitas. Macam-macam
kardinalitas relasi antar tabel yang mungkin adalah:
 one-to-many,
 one-to-one, dan
 many-to-many.
- Kardinalitas (Cardinality) Sebuah Tabel
Setelah kita pahami kardinalitas relasi antar tabel seperti yang dijelaskan di atas,
maka kita juga perlu memahami bahwa sebuah tabel yang terlibat dalam relasi juga
memiliki kardinalitasnya sendiri, antara lain:
- Zero-or-one, contoh kasusnya adalah seorang karyawan maksimal hanya akan
bertugas di satu departemen saja, namun bisa jadi ada karyawan lain yang tidak
terlibat di departemen apapun ketika menjabat sebagai direksi - one to (zero or
one).
- One-and-only one, contoh kasusnya adalah pemisahan tabel pasfoto terakhir yang
kita simpan dalam field BLOB di tabel EMPLOYEE_PICTURE mengahruskan
setiap karyawan harus memiliki satu saja pasfoto terakhir - one to (one and only
one).
- Zero-or-one or many, contoh kasusnya adalah seorang karyawan back
office mungkin tidak akan terlibat dalam satu project tertentu, namun karyawan
lain yang bertugas di lapangan minimal akan menangani satu proyek, atau
beberapa proyek sekaligus one-to-(zero or one or many).
- One-or-many, contoh kasusnya adalah relasi kemampuan berbahasa seorang
karyawan, yaitu setiap karyawan pasti menguasai minimal satu bahasa, namun
bisa jadi menguasai bahasa lain one-to (one or many).
5. ETL adalah sekumpulan proses yang harus dilalui dalam pembentukan data warehouse.
Tujuan ETL adalah mengumpulkan, menyaring, mengolah dan menggabungkan datadata
yang relevan dari berbagai sumber untuk disimpan ke dalam data warehouse. Proses ETL
sendiri terdiri dari extracting, transforming, loading, Berikut adalah penjelasan dari tiap
proses :
1. Extract
Extract adalah proses memilih dan mengambil data dari satu atau beberapa sumber
dan membaca/mengakses data yang dipilih tersebut. Proses ini dapat menggunakan
query.
2. Transform
Pada Proses ini data yang telah diambil pada proses extract akan dibersihkan
dan mengubah data dari bentuk asli menjadi bentuk yang sesuai dengan kebutuhan data
warehouse.
3. Load
Load adalah proses terakhir yang berfungsi untuk memasukkan data ke dalam target
akhir, yaitu ke dalam data warehouse. Cara untuk memasukkan data adalah dengan
menjalankan SQL script secara periodik. Pada proses ini akan mengubah data kedalam
bentuk Dimensional Data Store agar format data cocok untuk diterapkan pada proses
analisis dan telah terintegrasi dengan beberapa sumber data. Proses Load yang termasuk
proses terakhir dalam ETL akan sampai ke berbagai macam output yang sesuai dengan
skemanya,
Data warehouse tidak mungkin ada tanpa adanya proses ETL karena Proses
ETL merupakan suatu landasan dari sebuah data warehouse. Proses ETL ini sangat
penting karena sangat berperan terhadap kualitas data dalam data warehouse, sehingga
data warehouse nantinya dapat digunakan untuk keperluan business intelligence atau
aktivitas analisis yang lain.
6. - Java - Javascrip
- Phyton - C++
- Php - Visual Basic

Anda mungkin juga menyukai