Anda di halaman 1dari 44

Data Preparation for Data Analytics

Learning Objective

Peserta mampu menyiapkan data untuk proses


Data Analytics
Outline

1. Persiapan Data
2. Extract, Transform, dan Loading
3. Hands on
Mengapa Perlu Persiapan Data?

1. Data untuk keperluan analytics haruslah data


yang bersifat integrated
2. Berasal dari berbagai sumber data:
a. Operasional (ERP, CRM, SC, CC)
b. Data arsip
c. Data Eksternal
5
Mengapa Perlu Persiapan Data?

1. Diperlukan Data Staging yang digunakan untuk:


mengumpulkan, memilih, mengelola,
menggabungkan data untuk keperluan data
analytics
2. Data ini bersifat: Integrated, Summarized,
Historical dan memiliki rancangan yang cocok
untuk analisis.
Problema?

1. Sumber data bersifat heterogen:


a. Berbeda Mesin dan System Operasi
b. Sistem lama (legacy system) dengan teknologi
lama – (core banking)
c. Kualitas data yang berbeda
d. Representasi data yang berbeda
e. Tidak ada standar penamaan
f. Data tidak konsisten, null
Extract Transform Load

Persiapan data untuk Data Analytics disebut Extract


– Transform – Load (ETL) Process
ETL - Extract
Ekstraksi Data dari berbagai sumber data baik
homogen maupun heterogen
ETL - Transform
Seluruh data dianalisis dan fungsi tertentu akan
dikenakan agar data bersih dan sesuai utk analisis.
ETL - Load
Proses loading data yg telah diproses ke data
repository dengan sumber daya minimal data
Extract Transform Load Process
Data Warehouse
1. Repository Data yang dirancang untuk Data
Analytics yang efisien
2. Memiliki sifat: Subjek Oriented, Integrated, Time
Variant, dan Non-Volatile
3. Model: Star Schema (Fact – Dimension)
Data Warehouse
Dimensional Model
Kami menjual kopi dan produk lain di beberapa lokasi
dan menghitung capaian kami sepanjang waktu

Kopi Inc.
sales volume
profit

facts dimensions
Data Warehouse (Cube) Facts? Dimensions?

DIMENSIONS

Year
Store

FACT

Product

16
Initial and Incremental Load

17
Initial and Incremental Load

18
ETL with SSIS

19
ETL with SSIS

20
What is an ETL Tool

21
Kelebihan ETL Tools

22
Kelebihan ETL Tools

23
SQL Server Integration Services (SSIS)

24
SQL Server Integration Services (SSIS)

25
SSIS Terminology

26
SSIS Step

27
SSIS Step

28
29
30
31
SSIS Step

32
33
34
35
36
37
SSIS Step

38
Containers

39
Containers

40
41
42
43
44

Anda mungkin juga menyukai