Anda di halaman 1dari 30

TUGAS 1

LATIHAN PENGUKURAN KINERJA


DATA WAREHOUSE DAN BUSINESS INTELLIGENCE

Disusun Oleh :
Kelompok 7 SI-45-01

Lisa Dwi Aprillia 1202210344

Novia Rachma Sekar Adji Pangukir 1202213149

Yunisa Aini Fatmala 1202210004

PROGRAM STUDI STRATA 1 SISTEM INFORMASI


FAKULTAS REKAYASA INDUSTRI
UNIVERSITAS TELKOM
2023
BAB I
PENDAHULUAN

I.1 Pengertian Data Warehouse


Dalam bukunya "Building The Data Warehouse" yang diterbitkan pada tahun 2005,
W.H. Inmon mendefinisikan data warehouse sebagai kumpulan data yang fokus pada subjek
(subject-oriented), terpadu dan konsisten, berubah seiring waktu (time-variant), dan tetap
(non-volatile).
Sedangkan menurut Reinardi dalam bukunya "Building Data Warehouse in SQL
Server 2008" yang diterbitkan di tahun 2008, beliau mendefinisikan bahwa data warehouse
sebagai sistem yang secara berkala mengambil dan menggabungkan data dari berbagai
sumber ke dalam penyimpanan dimensional dan dalam bentuk yang ternormalisasi. Data
yang disimpan adalah data historis yang digunakan untuk permintaan data dalam konteks
bisnis intelligence dan analisis.
Berdasarkan definisi yang diberikan oleh W.H. Inmon dan Reinardi, dapat
disimpulkan bahwa data warehouse adalah suatu sistem yang mengintegrasikan data dari
berbagai sumber menjadi satu kumpulan data yang fokus pada subjek, terintegrasi, konsisten,
berubah seiring waktu, tetap, dan tersusun dalam format yang telah dinormalisasi.
Data warehouse menjadi alat penting dalam bisnis yang memungkinkan organisasi
untuk mengelola dan menganalisis data historis dengan cara yang memudahkan pengambilan
keputusan yang didasarkan pada bukti-bukti dan informasi yang konsisten dan terintegrasi.
Selain itu, data warehouse juga menjadi sebuah sistem yang beroperasi secara berkala
untuk mengambil, menggabungkan, dan menyusun data dari berbagai sumber informasi. Data
ini kemudian disimpan dalam format yang mengikuti struktur dimensional dan telah
mengalami proses normalisasi. Pemrosesan data ini memungkinkan data warehouse untuk
menyimpan informasi historis yang mencakup rentang waktu tertentu.
Data yang disimpan di dalam data warehouse memiliki nilai yang signifikan dalam
konteks analisis bisnis dan keputusan strategis. Informasi ini digunakan untuk menjawab
permintaan data yang berkaitan dengan bisnis intelligence, analisis kinerja, dan pemantauan
tren bisnis. Dengan demikian, data warehouse memainkan peran penting dalam membantu
organisasi membuat keputusan yang didasarkan pada bukti-bukti dan informasi yang akurat.
Beberapa karakteristik dari data warehouse adalah:
● Integrasi data – Integrasi data dalam data warehouse mengacu pada penggabungan
data menjadi satu kesatuan yang dapat diakses dan dibagikan dengan mudah oleh
berbagai pihak dalam organisasi, dengan penekanan pada data yang terhubung.
● Statis dan terbentuk secara periodic – Data warehouse dibentuk secara berkala, baik
mingguan, bulanan, atau sesuai dengan kebutuhan perusahaan atau organisasi,
sehingga data tetap up-to-date.
● Fokus pada analisis data – Fokus utama data warehouse adalah melayani kebutuhan
analisis data, dengan tujuan memfasilitasi pengambilan keputusan yang efektif dan
sesuai dengan kebutuhan perusahaan.
Sebagai sistem basis data yang menyimpan catatan dari proses bisnis, data warehouse
terdiri dari berbagai sumber basis data yang berbeda yang digabungkan. Dalam proses ini,
data warehouse menggabungkan informasi dengan melakukan ringkasan dan pengelompokan
data. Informasi yang disajikan dalam data warehouse ini telah ditentukan oleh pengguna
berdasarkan kebutuhan mereka dalam pengambilan keputusan. Dengan kata lain, data
warehouse hanya berisi informasi yang relevan dan sesuai dengan kebutuhan pengguna untuk
mendukung proses pengambilan keputusan.

I.2 Pengertian Pentaho


Menurut Phi-Integration.com menjelaskan bahwa Pentaho adalah sebuah perusahaan
yang menyediakan produk Business Intelligence (BI) yang mencakup integrasi data, layanan
OLAP, pelaporan, dashboard, data mining, serta kemampuan ETL (Extract, Transform, Load)
melalui alat yang disebut Kettle.
Pentaho menjadi salah satu solusi perangkat lunak Business Intelligence (BI) berbasis
open source yang tidak hanya menyediakan alat dan platform untuk mengembangkan aplikasi
Business Intelligence (BI), tetapi juga mengintegrasikan berbagai program komputer untuk
memberikan solusi Business Intelligence (BI) secara komprehensif. Sistem Pentaho terdiri
dari berbagai komponen yang bekerja bersama-sama, membentuk rangkaian lengkap untuk
memenuhi kebutuhan analisis bisnis.
Pentaho memiliki berbagai komponen yang beroperasi pada berbagai tingkatan.
Beberapa komponen berada di tingkat dasar yang menyediakan fungsi-fungsi dasar,
sedangkan yang lain berfungsi pada tingkat yang lebih tinggi, bergantung pada fungsionalitas
yang disediakan oleh komponen di tingkat bawah. Dalam keseluruhan koleksi komponen
dalam Pentaho, terdapat hierarki yang dapat dibandingkan dengan suatu tumpukan (stack).
Pada tumpukan ini, semakin tinggi levelnya, semakin mendekati pengguna akhir (end-user)
dan menyediakan kemudahan penggunaan serta pemahaman yang lebih baik. Dengan kata
lain, Pentaho membentuk suatu struktur yang terorganisir dan efisien, memungkinkan
pengguna untuk mengakses dan menganalisis data dengan lebih mudah sesuai dengan
kebutuhan mereka dalam Business Intelligence (BI).
Keseluruhan produk pembangun aplikasi Business Intelligence (BI) biasa disebut
dengan Pentaho Business Intelligence (BI) Suite yang terdiri dari beberapa produk, dimana
masing-masingnya memiliki spesifikasi fungsi tersendiri, antara lain :
1. Pentaho Reporting - Pentaho Reporting adalah serangkaian proyek open source yang
dirancang untuk membuat, menghasilkan, dan menyebarkan laporan dengan beragam
format tampilan dan sumber data yang beragam.
a. Pentaho Report Designer
b. Pentaho Metadata Editor
2. Pentaho Analysis - Pentaho Analysis Server / Mondrian merupakan OLAP server
yang berjalan di atas platform Java dan bersifat free open source dan telah digunakan
di berbagai framework Business Intelligence (BI) seperti Pentaho dan Jasper.
a. Pentaho Schema Workbench
3. Pentaho Dashboards - Pentaho Dashboards dimaksudkan untuk memberikan
dukungan kepada pemilik perusahaan dalam mengelola inventaris. Tujuan dari
informasi yang disajikan dalam bentuk dashboard adalah untuk memfasilitasi
pengambilan keputusan oleh pemilik perusahaan. Pembuatan dashboard dapat
memanfaatkan berbagai teknologi dalam bidang Business Intelligence (BI).
a. Pentaho Design Studio
4. Pentaho Data Integration (ETL) : Pentaho Data Integration (ETL) adalah komponen
Pentaho yang digunakan untuk mengambil, mentransformasikan, dan memuat data
dari berbagai sumber ke dalam penyimpanan data untuk analisis. Pentaho Data
Integration (ETL) ini juga sering disingkat sebagai PDI atau Kettle.
a. Pentaho Data Integration
5. Pentaho Data Mining - Pentaho Data Mining merupakan salah satu dari komponen
dari platform Business Intelligence (BI) Pentaho yang digunakan untuk melakukan
analisis data untuk menemukan pola, tren, dan wawasan yang berguna dalam
pengambilan keputusan.
a. Weka
I.3 Pengertian OLTP
OLTP atau Online Transaction Processing adalah sistem yang bertugas untuk
mengelola berbagai transaksi secara real time (langsung) yang terkoneksi dalam satu jaringan
melalui berbagai komputer. Menurut Connolly, et al tahun 2015 mengatakan “Online
Transaction Processing adalah sebuah sistem yang dibuat untuk menangani berbagai transaksi
dalam jumlah tinggi setiap harinya, transaksi ini biasanya harus ditangani oleh perusahaan”.
Menurut E. Turban, et al. pada tahun 2014 mengatakan “Online Transaction
Processing adalah sistem yang berguna untuk pemrosesan transaksi Standard Query
Language (SQL) secara langsung (realtime)”. Fungsi Online Transaction Processing adalah
untuk menyediakan berbagai informasi atau data untuk sebuah perusahaan. Data atau
informasi ini nantinya akan digunakan oleh perusahaan untuk membantu proses pengambilan
keputusan.

I.4 Pengertian Star Schema


Star Schema adalah bentuk paling sederhana dari model dimensi yang digunakan
dalam intelijen bisnis dan pergudangan data di mana data diatur dalam dimensi dan fakta.
Dalam skema bintang, ada satu tabel fakta, yang biasanya diekspresikan dalam bentuk normal
ketiga (3NF), dan beberapa tabel dimensi de-normalisasi yang terhubung dengannya,
memancar keluar seperti titik-titik bintang. Adapun komponen penyusun Star Schema, yaitu:
1. Fact Table atau tabel fakta berisi metrik proses sebuah bisnis. Data yang dimuat
dalam tabel ini harus bersifat numerik (dalam bentuk angka) dan bisa ditambah.
2. Dimensions Table atau tabel dimensi memuat informasi mengenai kapan mana, apa,
dan lain-lain. Berbeda dengan tabel fakta, tabel dimensi berisi informasi yang bersifat
kualitatif.
3. Measure Table adalah tabel hasil pengukuran atau penambahan atribut berdasarkan
tabel fakta.
I.5 Pengertian ETL

ETL atau Extract Transform Load adalah proses integrasi data yang menggabungkan
data dari berbagai sumber ke dalam satu penyimpanan yang konsisten dan dimuat ke dalam
gudang data atau sistem lainnya. Singkatnya, sistem ETL adalah dasar dari pengolahan data,
khususnya big data. ETL pertama kali diperkenalkan pada tahun 1970-an untuk
mengintegrasikan proses pemuatan data ke dalam superkomputer untuk dianalisis lebih
lanjut. Sejak akhir 1980 hingga pertengahan 200, ETL menjadi proses utama untuk membuat
gudang data yang mendukung aplikasi business intelligence (BI). Di masa sekarang, ETL
lebih direkomendasikan untuk menyimpan data yang lebih kecil dan tidak memerlukan
pembaruan terlalu sering. Alternatifnya, kamu bisa menggunakan data integrasi lain, seperti
bELT, CDC, dan virtualisasi data untuk mengolah data real time dan selalu berubah. Berikut
merupakan cara kerja ETL
1. Ekstraksi Data data harus diekstrak terlebih dahulu dari sumbernya sebelum
dipindahkan ke tempat yang lain. Pada langkah pertama proses ETL ini, data
terstruktur dan tidak terstruktur diimpor dan dikonsolidasikan ke dalam satu wadah
penyimpanan.
2. Transformasi ETL merupakan pembersihan dan mempersiapkan agregasi untuk
analisis. Langkah ini sangat penting dalam proses ETL karena membantu memastikan
data yang akan diolah sepenuhnya siap dan kompatibel.
3. Loading adalah proses terakhir dalam ETL, yaitu memuat data yang sudah diubah ke
tujuan baru. Data tersebut dapat dimuat sekaligus (full load) atau interval terjadwal
(incremental load).
I.6 Pengertian OLAP
OLAP adalah teknologi database yang telah dioptimalkan untuk membuat kueri dan
pelaporan, dan bukan memproses transaksi. Data sumber untuk OLAP adalah database
Pemrosesan Transaksi online (OLTP, Online Transactional Processing) yang umumnya
disimpan di gudang data.
Database OLAP dirancang untuk mempercepat pengambilan data. Karena server
OLAP, daripada Microsoft Office Excel, menghitung nilai yang diringkas, lebih sedikit data
yang perlu dikirim ke Excel saat membuat atau mengubah laporan. Pendekatan ini
memungkinkan bekerja dengan jumlah data sumber yang jauh lebih besar daripada yang bisa
dapatkan jika data ditata dalam database tradisional, di mana Excel mengambil semua catatan
individu lalu menghitung nilai yang diringkas.
Database OLAP berisi dua tipe dasar data: pengukuran, yang merupakan data
numerik, kuantitas dan rata-rata yang digunakan untuk membuat keputusan bisnis yang
diinformasikan, dan dimensi, yang merupakan kategori yang digunakan untuk menata ukuran
ini. Database OLAP membantu menata data berdasarkan banyak tingkat detail, menggunakan
kategori yang sama yang biasa kenal untuk menganalisis data.
BAB II
HASIL ANALISIS

II.1 Objective
Berdasarkan data yang telah disediakan, pada kesempatan kali ini analisis objective
Data Warehouse dengan fokus pada "Analisis Perusahaan dengan Pendapatan Terbanyak dan
Gaji Karyawan Tertinggi" dengan tujuan untuk memahami dan mengidentifikasi faktor-faktor
yang mempengaruhi hubungan antara pendapatan perusahaan dan gaji karyawan, dengan
menggunakan data yang tersimpan dalam data warehouse. Fokusnya adalah pada perusahaan
yang memiliki pendapatan terbanyak dan membayar gaji karyawan tertinggi.
Analisis objective ini memanfaatkan data warehouse sebagai sumber informasi untuk
menggali wawasan yang mendalam tentang bagaimana pendapatan perusahaan berdampak
pada gaji karyawan tertinggi. Dengan demikian, perusahaan dapat mengambil keputusan
yang lebih cerdas dan terinformasi dalam manajemen keuangan dan sumber daya manusia.

II.2 Perancangan Star Schema


Dari dataset yang didapatkan, terdapat format file yang beragam seperti .csv, .json,
dan .sql. Masing-masing format file tersebut memiliki beberapa tabel, oleh karena itu perlu
dilakukan sebuah desain Data Warehouse. Sebelum membuat desain Data Warehouse, wajib
untuk membuat atau menggambarkan ERD atau relasi dari tiap tiap tabel yang ada dan wajib
diketahui. Penting untuk mencatat bahwa dalam proses perancangan Data Warehouse,
keselarasan dan pemahaman yang mendalam tentang struktur dataset yang beragam sangat
diperlukan.
Berdasarkan hasil analisis didapatkan relasi tabel yang tercipta dari dataset yang telah
diberikan tabel-tabel dimensi seperti checkouts, products, offices, payments, employees,
empdetails, dan date mungkin mengandung informasi yang mendukung pemahaman tentang
perusahaan, produk, kantor, metode pembayaran, karyawan, detail karyawan, dan tanggal.
Tabel fakta orders, kemungkinan besar, akan mencakup data yang menghubungkan semua
dimensi ini dalam konteks transaksi atau pesanan. Sementara tabel pengukuran atau measure
akan berisi metrik atau data yang akan dianalisis dan diukur dalam konteks bisnis. Dalam
perancangan ERD, hubungan antara tabel-tabel ini akan digambarkan dengan jelas, dengan
tabel fakta berperan sebagai pusat utama yang menghubungkan tabel dimensi dan tabel
pengukuran. Dengan desain ERD yang baik, struktur Data Warehouse akan lebih efisien
dalam mengintegrasikan data dari berbagai format sumber yang berbeda. Ini akan
memungkinkan organisasi untuk melakukan analisis data yang lebih mendalam dan
pengambilan keputusan yang lebih baik dalam berbagai aspek bisnis mereka. Berikut gambar
relasi Tabel dari dataset yang diberikan :

Dari gambar diatas bisa dilihat bahwa alur sistem order terdiri dari 7 tabel dimensi yaitu
checkouts, products, offices, payments, employees, empdetails serta date, 1 tabel fakta yaitu
orders, dan 1 tabel measure.

⇒ Fact Table

No Table Attribute Keterangan

1 Orders orderNo Nomor induk order

status Status keterlambatan pembayaran


⇒ Measures Table

No Table Attribute Keterangan

1 measure_table orderDate Tanggal order

status Status keterlambatan pembayaran

⇒ Dimension Table

No Table Attribute Keterangan

1 Checkouts checkoutNo Nomor induk checkout

qtyOrdered Jumlah pesanan

2 Products productCode Nomor induk produk

prodName Nama produk

3 Offices officeCode Nomor induk kantor tempat


karyawan bekerja

country Lokasi kantor

4 Payments checkNo Nomor pembayaran

amountINT Jumlah yang harus dibayarkan oleh


customer

5 Employees employeeNo Nomor induk karyawan

officeCode Nomor induk kantor tempat


karyawan bekerja

6 Empdetails employeeNo Nomor induk karyawan

salary Gaji karyawan

7 Date ID_Date Identifikasi unik tanggal

day Menyimpan informasi tentang hari


dalam setiap tanggal

month Menyimpan informasi tentang


bulan dalam setiap tanggal

years Menyimpan informasi tentang


tahun dalam setiap tanggal
II.2.1 Implementasi Star Schema di RDBMS
Star schema adalah salah satu metode desain yang umum digunakan dalam data
warehousing dan sistem manajemen basis data relasional (RDBMS) untuk
mengorganisasi data dalam format yang memungkinkan analisis bisnis yang efisien.
Penerapan star schema di RDBMS memungkinkan organisasi untuk dengan mudah
menganalisis data bisnis yang besar dan kompleks. Dengan struktur yang terorganisir
dengan baik, pengguna dapat dengan cepat mendapatkan wawasan yang berharga dari
data yang tersimpan dalam data warehouse. Berikut merupakan implementasi yang kami
lakukan dengan menggunakan script DDL untuk membuat RDBMS :

CREATE DATABASE tugas1_dwbi;


CREATE TABLE dim_offices (
officeCode VARCHAR (25) NOT NULL PRIMARY KEY,
country VARCHAR (25) NOT NULL
);

CREATE TABLE dim_employees (


employeeNo INT NOT NULL PRIMARY KEY,
officeCode VARCHAR (25) NOT NULL,
FOREIGN KEY (officeCode) REFERENCES dim_offices(officeCode)
);

CREATE TABLE dim_empdetails (


employeeNo INT NOT NULL,
salary INT NOT NULL,
FOREIGN KEY (employeeNo) REFERENCES dim_employees(employeeNo)
);

CREATE TABLE dim_products (


productCode VARCHAR (25) NOT NULL PRIMARY KEY,
prodName VARCHAR (25) NOT NULL,
officeCode VARCHAR (25) NOT NULL,
FOREIGN KEY (officeCode) REFERENCES dim_offices(officeCode)
);

CREATE TABLE dim_payments (


checkNo INT NOT NULL PRIMARY KEY,
amountINT INT NOT NULL
);
CREATE TABLE dim_orders (
orderNo INT NOT NULL PRIMARY KEY,
checkNo INT NOT NULL,
status VARCHAR (25) NOT NULL,
FOREIGN KEY (checkNo) REFERENCES dim_payments(checkNo)
);

CREATE TABLE dim_checkouts (


checkoutNo INT NOT NULL PRIMARY KEY,
orderNo INT NOT NULL,
productCode VARCHAR (25) NOT NULL,
qtyOrdered INT NOT NULL,
FOREIGN KEY (orderNo) REFERENCES dim_orders(orderNo),
FOREIGN KEY (productCode) REFERENCES dim_products(productCode)
);

CREATE TABLE dim_date (


ID_Date INT NOT NULL PRIMARY KEY,
day INT NOT NULL,
month INT NOT NULL,
years INT NOT NULL
);

CREATE TABLE factTable (


orderNo INT NOT NULL,
checkoutNo INT NOT NULL,
productCode VARCHAR (25) NOT NULL,
officeCode VARCHAR (25) NOT NULL,
employeeNo INT NOT NULL,
checkNo INT NOT NULL,
ID_Date INT NOT NULL,
status VARCHAR (25) NOT NULL,
FOREIGN KEY (orderNo) REFERENCES dim_orders(orderNo),
FOREIGN KEY (checkoutNo) REFERENCES dim_checkouts(checkoutNo),
FOREIGN KEY (productCode) REFERENCES dim_products(productCode),
FOREIGN KEY (officeCode) REFERENCES dim_offices(officeCode),
FOREIGN KEY (employeeNo) REFERENCES dim_employees(employeeNo),
FOREIGN KEY (checkNo) REFERENCES dim_payments(checkNo),
FOREIGN KEY (ID_Date) REFERENCES dim_date(ID_Date)
);
Setelah berhasil membuat database dengan menggunakan script DDL, kita bisa
mendapatkan hasil design RDBMS dalam bentuk Star Schema.

II.3 Desain dan Implementasi ETL


Proses ETL dilakukan untuk membuat data menjadi bentuk Unnormalized Form
(bentuk tidak normal) yang mana di dalam nya terdapat banyak data yang redundan. Hal
tersebut dilakukan untuk memudahkan dalam menganalisis data. Oleh karena itu, perlu
dilakukannya ETL dengan tujuan untuk menggabungkan semua data, khususnya di pentaho.
Sebelum menginputkan data .sql ke dalam pentaho, maka perlu dilakukannya import
data ke dalam database di MySQL pada phpMyAdmin, kemudian lakukan connection data
mySQL ke pentaho yang selanjutnya bisa dilanjutkan dengan menginputkan file data lain
seperti file .csv dan file .json untuk dilakukannya implementasi ETL. Berikut detail langkah
pengerjaan yang kami lakukan pada proses OLTP, yaitu :

⇒ Import data pemesanan.sql ke database di phpMyAdmin

⇒ Database dengan 4 kolom beserta record datanya berhasil terbuat


⇒ 4 tabel di database pemesanan.sql
⇒ Record data tabel “Checkouts”

⇒ Record data tabel “Orders”


⇒ Record data tabel “Productlines”

⇒ Record data tabel “Products”


⇒ Setting connection database SQL ke Pentaho

⇒ Database SQL berhasil terkoneksi ke Pentaho


Gambar di bawah ini merupakan desain transformasi yang dilakukan dalam
pengimplementasian ETL pada proses OLTP, yaitu :

⇒ Hasil transformasi data


⇒ Hasil load data ke file excel

II.4 Operasi OLAP

Pada ilustrasi diatas dimensi yang akan diolah menggunakan operasi OLAP terdiri dari 3
dimensi yaitu :
⇒ Dimensi 1 (country) = Canada, Spain, Singapore
⇒ Dimensi 2 (salary) = HRD, R&D, Operasional
⇒ Dimensi 3 (prodName) = Milk, Barbel, Clothes
Operasi selanjutnya yang dilakukan dalam OLAP setelah dimensi-dimensi telah ditentukan
adalah "Roll-Up." Roll-Up adalah salah satu operasi OLAP yang digunakan untuk
menggabungkan data pada tingkat yang lebih tinggi dalam hierarki dimensi. Operasi Roll-Up
berguna untuk menyederhanakan analisis dan memberikan pandangan yang lebih umum
dalam Data Warehouse. Pada operasi Roll-Up ini dilakukan pengelompokan pada dimensi
menjadi 2 kategori, yaitu Country (Canada, Spain, Singapore) dan Salary (HRD, R&D,
Operasional)
Dari proses OLAP (Online Analytical Processing) yang telah didesain, selanjutnya
kita dapat menganalisis data dengan operasi Roll-up, kemudian membuat visualisasi terhadap
data yang tersedia guna memudahkan pembacaan data dan memberikan gambaran yang
berfokus pada hubungan antara pendapatan perusahaan dan gaji karyawan dengan hasil:
● Berdasarkan data yang telah diolah, perusahaan mencapai pendapatan terbanyak
terdapat pada negara Spanyol (Spain). Hal ini menunjukkan bahwa Spanyol adalah
pasar yang sangat menguntungkan bagi perusahaan ini.
● Selain pendapatan terbanyak, data juga menunjukkan bahwa perusahaan membayar
gaji karyawan tertinggi terdapat pada negara Spanyol (Spain). Hal ini
mengindikasikan bahwa di Spanyol, perusahaan ini cenderung memberikan
kompensasi yang lebih tinggi kepada karyawannya dibandingkan dengan
negara-negara lain di mana perusahaan ini beroperasi.
Kesimpulan yang dapat dihasilkan dari hasil analisis ini ialah pendapatan perusahaan
memiliki dampak yang signifikan pada tingkat gaji karyawan. Dengan kata lain, terdapat
korelasi positif antara pendapatan perusahaan dan gaji karyawan. Ketika pendapatan
perusahaan tinggi, gaji karyawan cenderung juga tinggi. Ini dapat dijelaskan dengan berbagai
faktor, seperti kebijakan upah di Spanyol, tingkat kehidupan yang lebih tinggi, atau
keberhasilan perusahaan dalam mengeksploitasi pasar Spanyol.
BAB III
PENUTUP

Kesimpulan
Jadi pada penugasan Mata Kuliah Data Warehouse dan Business Intelligence ini, kami
mengambil objective yaitu “Analisis perusahaan dengan pendapatan terbanyak dan gaji
karyawan tertinggi” dengan menggunakan 7 tabel dimensi yaitu checkouts, products, offices,
payments, employees, empdetails serta date, 1 tabel fakta yaitu orders, dan 1 tabel measure.
Proses pembuatan Data Warehouse kami menggunakan ETL (Extract, Transform,
Load) yang telah dijelaskan sebelumnya dalam pendahuluan, termasuk impor data dari
berbagai format file ke database, menghubungkan ke database, dan melakukan transformasi
data.
Selanjutnya, kami dapat melengkapi penutup dengan menjelaskan langkah-langkah
dan hasil operasi OLAP yang dilakukan dalam analisis Data Warehouse ini. Kami dapat
memberikan ringkasan dari operasi-operasi OLAP yang telah dibahas dalam dokumen dan
hasil analisis yang ditemukan. Di operasi OLAP kami mendesain Rubik Cube dan
menggunakan operasi Roll-Up yang memungkinkan penggabungan data pada tingkat yang
lebih tinggi dalam hierarki dimensi.
Dengan demikian, kesimpulan akan memberikan gambaran umum tentang bagaimana
Data Warehouse telah dibuat, bagaimana data telah diimpor dan diproses, serta hasil dari
analisis operasi OLAP yang telah dilakukan untuk mencapai tujuan analisis yang telah
ditentukan.
Pembagian Tugas

No Nama Tugas

1 Lisa Dwi Aprillia ● Melakukan seleksi data yang digunakan


● Melakukan implementasi Star Schema di
RDBMS dengan script DDL
● Melakukan proses ETL di Pentaho
● Melakukan analisis dengan proses OLAP
operasi Roll-up

2 Novia Rachma Sekar Adji ● Mengerjakan BAB 1


● Melakukan proses ETL di Pentaho
Pangukir
● Mengerjakan implementasi star schema
dan mendeskripsikannya
● Memberikan deskripsi mengenai OLAP

3 Yunisa Aini Fatmala ● Mengerjakan BAB 1


● Mengerjakan implementasi star schema
dan membuat tabel
● Mengerjakan desain kubik cube dan proses
OLAP
LAMPIRAN

Link Pendukung (Drive)


https://drive.google.com/drive/folders/1nMA_zyQQqWKpN1oDC-iUw7ipHd8clEDI?usp=sh
aring

Referensi
https://docs.google.com/spreadsheets/d/17pfLm_jsTa5wwPQQsfjp1HFd_Z_qAxpT/edit?usp
=sharing&ouid=112494931819936485343&rtpof=true&sd=true

Anda mungkin juga menyukai