Disusun Oleh :
Kelompok 7 SI-45-01
ETL atau Extract Transform Load adalah proses integrasi data yang menggabungkan
data dari berbagai sumber ke dalam satu penyimpanan yang konsisten dan dimuat ke dalam
gudang data atau sistem lainnya. Singkatnya, sistem ETL adalah dasar dari pengolahan data,
khususnya big data. ETL pertama kali diperkenalkan pada tahun 1970-an untuk
mengintegrasikan proses pemuatan data ke dalam superkomputer untuk dianalisis lebih
lanjut. Sejak akhir 1980 hingga pertengahan 200, ETL menjadi proses utama untuk membuat
gudang data yang mendukung aplikasi business intelligence (BI). Di masa sekarang, ETL
lebih direkomendasikan untuk menyimpan data yang lebih kecil dan tidak memerlukan
pembaruan terlalu sering. Alternatifnya, kamu bisa menggunakan data integrasi lain, seperti
bELT, CDC, dan virtualisasi data untuk mengolah data real time dan selalu berubah. Berikut
merupakan cara kerja ETL
1. Ekstraksi Data data harus diekstrak terlebih dahulu dari sumbernya sebelum
dipindahkan ke tempat yang lain. Pada langkah pertama proses ETL ini, data
terstruktur dan tidak terstruktur diimpor dan dikonsolidasikan ke dalam satu wadah
penyimpanan.
2. Transformasi ETL merupakan pembersihan dan mempersiapkan agregasi untuk
analisis. Langkah ini sangat penting dalam proses ETL karena membantu memastikan
data yang akan diolah sepenuhnya siap dan kompatibel.
3. Loading adalah proses terakhir dalam ETL, yaitu memuat data yang sudah diubah ke
tujuan baru. Data tersebut dapat dimuat sekaligus (full load) atau interval terjadwal
(incremental load).
I.6 Pengertian OLAP
OLAP adalah teknologi database yang telah dioptimalkan untuk membuat kueri dan
pelaporan, dan bukan memproses transaksi. Data sumber untuk OLAP adalah database
Pemrosesan Transaksi online (OLTP, Online Transactional Processing) yang umumnya
disimpan di gudang data.
Database OLAP dirancang untuk mempercepat pengambilan data. Karena server
OLAP, daripada Microsoft Office Excel, menghitung nilai yang diringkas, lebih sedikit data
yang perlu dikirim ke Excel saat membuat atau mengubah laporan. Pendekatan ini
memungkinkan bekerja dengan jumlah data sumber yang jauh lebih besar daripada yang bisa
dapatkan jika data ditata dalam database tradisional, di mana Excel mengambil semua catatan
individu lalu menghitung nilai yang diringkas.
Database OLAP berisi dua tipe dasar data: pengukuran, yang merupakan data
numerik, kuantitas dan rata-rata yang digunakan untuk membuat keputusan bisnis yang
diinformasikan, dan dimensi, yang merupakan kategori yang digunakan untuk menata ukuran
ini. Database OLAP membantu menata data berdasarkan banyak tingkat detail, menggunakan
kategori yang sama yang biasa kenal untuk menganalisis data.
BAB II
HASIL ANALISIS
II.1 Objective
Berdasarkan data yang telah disediakan, pada kesempatan kali ini analisis objective
Data Warehouse dengan fokus pada "Analisis Perusahaan dengan Pendapatan Terbanyak dan
Gaji Karyawan Tertinggi" dengan tujuan untuk memahami dan mengidentifikasi faktor-faktor
yang mempengaruhi hubungan antara pendapatan perusahaan dan gaji karyawan, dengan
menggunakan data yang tersimpan dalam data warehouse. Fokusnya adalah pada perusahaan
yang memiliki pendapatan terbanyak dan membayar gaji karyawan tertinggi.
Analisis objective ini memanfaatkan data warehouse sebagai sumber informasi untuk
menggali wawasan yang mendalam tentang bagaimana pendapatan perusahaan berdampak
pada gaji karyawan tertinggi. Dengan demikian, perusahaan dapat mengambil keputusan
yang lebih cerdas dan terinformasi dalam manajemen keuangan dan sumber daya manusia.
Dari gambar diatas bisa dilihat bahwa alur sistem order terdiri dari 7 tabel dimensi yaitu
checkouts, products, offices, payments, employees, empdetails serta date, 1 tabel fakta yaitu
orders, dan 1 tabel measure.
⇒ Fact Table
⇒ Dimension Table
Pada ilustrasi diatas dimensi yang akan diolah menggunakan operasi OLAP terdiri dari 3
dimensi yaitu :
⇒ Dimensi 1 (country) = Canada, Spain, Singapore
⇒ Dimensi 2 (salary) = HRD, R&D, Operasional
⇒ Dimensi 3 (prodName) = Milk, Barbel, Clothes
Operasi selanjutnya yang dilakukan dalam OLAP setelah dimensi-dimensi telah ditentukan
adalah "Roll-Up." Roll-Up adalah salah satu operasi OLAP yang digunakan untuk
menggabungkan data pada tingkat yang lebih tinggi dalam hierarki dimensi. Operasi Roll-Up
berguna untuk menyederhanakan analisis dan memberikan pandangan yang lebih umum
dalam Data Warehouse. Pada operasi Roll-Up ini dilakukan pengelompokan pada dimensi
menjadi 2 kategori, yaitu Country (Canada, Spain, Singapore) dan Salary (HRD, R&D,
Operasional)
Dari proses OLAP (Online Analytical Processing) yang telah didesain, selanjutnya
kita dapat menganalisis data dengan operasi Roll-up, kemudian membuat visualisasi terhadap
data yang tersedia guna memudahkan pembacaan data dan memberikan gambaran yang
berfokus pada hubungan antara pendapatan perusahaan dan gaji karyawan dengan hasil:
● Berdasarkan data yang telah diolah, perusahaan mencapai pendapatan terbanyak
terdapat pada negara Spanyol (Spain). Hal ini menunjukkan bahwa Spanyol adalah
pasar yang sangat menguntungkan bagi perusahaan ini.
● Selain pendapatan terbanyak, data juga menunjukkan bahwa perusahaan membayar
gaji karyawan tertinggi terdapat pada negara Spanyol (Spain). Hal ini
mengindikasikan bahwa di Spanyol, perusahaan ini cenderung memberikan
kompensasi yang lebih tinggi kepada karyawannya dibandingkan dengan
negara-negara lain di mana perusahaan ini beroperasi.
Kesimpulan yang dapat dihasilkan dari hasil analisis ini ialah pendapatan perusahaan
memiliki dampak yang signifikan pada tingkat gaji karyawan. Dengan kata lain, terdapat
korelasi positif antara pendapatan perusahaan dan gaji karyawan. Ketika pendapatan
perusahaan tinggi, gaji karyawan cenderung juga tinggi. Ini dapat dijelaskan dengan berbagai
faktor, seperti kebijakan upah di Spanyol, tingkat kehidupan yang lebih tinggi, atau
keberhasilan perusahaan dalam mengeksploitasi pasar Spanyol.
BAB III
PENUTUP
Kesimpulan
Jadi pada penugasan Mata Kuliah Data Warehouse dan Business Intelligence ini, kami
mengambil objective yaitu “Analisis perusahaan dengan pendapatan terbanyak dan gaji
karyawan tertinggi” dengan menggunakan 7 tabel dimensi yaitu checkouts, products, offices,
payments, employees, empdetails serta date, 1 tabel fakta yaitu orders, dan 1 tabel measure.
Proses pembuatan Data Warehouse kami menggunakan ETL (Extract, Transform,
Load) yang telah dijelaskan sebelumnya dalam pendahuluan, termasuk impor data dari
berbagai format file ke database, menghubungkan ke database, dan melakukan transformasi
data.
Selanjutnya, kami dapat melengkapi penutup dengan menjelaskan langkah-langkah
dan hasil operasi OLAP yang dilakukan dalam analisis Data Warehouse ini. Kami dapat
memberikan ringkasan dari operasi-operasi OLAP yang telah dibahas dalam dokumen dan
hasil analisis yang ditemukan. Di operasi OLAP kami mendesain Rubik Cube dan
menggunakan operasi Roll-Up yang memungkinkan penggabungan data pada tingkat yang
lebih tinggi dalam hierarki dimensi.
Dengan demikian, kesimpulan akan memberikan gambaran umum tentang bagaimana
Data Warehouse telah dibuat, bagaimana data telah diimpor dan diproses, serta hasil dari
analisis operasi OLAP yang telah dilakukan untuk mencapai tujuan analisis yang telah
ditentukan.
Pembagian Tugas
No Nama Tugas
Referensi
https://docs.google.com/spreadsheets/d/17pfLm_jsTa5wwPQQsfjp1HFd_Z_qAxpT/edit?usp
=sharing&ouid=112494931819936485343&rtpof=true&sd=true