Anda di halaman 1dari 22

PRAKTIKUM DATA WAREHOUSE

STUDI KASUS TALEND OPEN STUDIO

Disusun Oleh :
Dhea Aryani Nurhilda - 10107021
Tania Cahaya Permata Hidayat - 10107057

Dosen Pengampu :

Tri Herdiawan A., S.ST., M.T.

PRODI SISTEM INFORMASI


JURUSAN MANAJEMEN INFORMATIKA
POLITEKNIK NEGERI SUBANG
2022
DAFTAR ISI

DAFTAR ISI...............................................................................................................................................2
BAB I..........................................................................................................................................................3
PENDAHULUAN......................................................................................................................................3
I. Latar Belakang.................................................................................................................................3
II. Tujuan.................................................................................................................................................3
III. Manfaat........................................................................................................................................3
BAB II........................................................................................................................................................4
TEORI PEMBAHASAN...........................................................................................................................4
BAB I PENDAHULUAN

I. Latar Belakang
Data warehouse adalah suatu tempat penyimpanan data yang berasal dari berbagai
sumber dan data yang disimpan tersebut mempunyai karakteristik yang terintegrasi,
berorientasi pada subjek, mempunyai dimensi waktu, serta bersifat tetap. Data warehouse
juga merupakan data penunjang keputusan yang mengandung data yang biasanya mewakili
sejarah bisnis dari suatu perusahaan . Data warehouse tersusun dari beberapa komponen,
adapun diantaranya :
1. Warehouse atau gudang
Merupakan suatu tempat penyimpanan database dan akan diproses secara
transaksional. Didalamnya juga terdapat memori yang sudah terintegrasi pada bagian
utama konfigurasi.
2. Warehouse Management atau manajemen Gudang Data
Merupakan bentuk pengoperasian data. Di dalam warehouse management, data
akan bisa digabungkan dengan berbagai sumber dan dibuat pengarsipannya secara
baik.
3. Akses Tools
Dalam data warehouse dengan menggunakan akses tools berbentuk OLAP, query
and reporting tools, data mining serta application development tools.
4. Meta Data
Merupakan potongan informasi yang menjelaskan isi data. Komponen data
warehouse ini bertujuan memperjelas konteks data supaya lebih mudah dipahami saat
nanti digunakan.
5. Tools ETL
ETL (Extract, Transform, and Load) merupakan alat untuk mengorganisasikan
data. Mulai dari penyimpanan, pemindahan, modifikasi format, penyaringan, dsb.

Data Warehouse memiliki proses ETL (Extract,Transform, dan Load). Talend


open studio merupakan salah satu aplikasi open source yang dapat digunakan untuk
integrasi data atau menggabungkan data dari beberapa sumber. Aplikasi ini juga
membantu dalam mengelola semua aspek dari tahap ekstraksi data, transformasi data, dan
loading data secara efisien dan efektif. Talend open studio terdapat beberapa fitur yang
dapat memudahkan dalam pemodelan data dengan menggunakan desain tool secara drag
dan drop.
Dengan adanya Aplikasi talend open studio untuk Data Integration dapat
mengimplementasikannya langsung dengan mengimigrasikan data anda ke Talend Data
Integration selain itu juga telah menyediakan solusi lengkap untuk membangun,
menyebarkan, dan mengelola layanan integrasi data. 
II. Tujuan
1. Mengetahui pengertian data warehouse
2. Mengetahui komponen apa saja yang ada dalam data warehouse
3. Membuat skema dengan Talend Open Studio
4. Memahami dan mengetahui tool-tools yang ada dalam Talend Open Studio
5. Mengetahui dan memahami cara bagaimana pengaplikasian talend open studio dengan
ETL dengan mengekstrak dan menggabungkan data, menyalin dan mengecek file.
BAB II TEORI PEMBAHASAN
A. Teori
1. Datawarehouse
Datawarehouse adalah proses pengumpulan data dari berbagai sumber, sehingga
menjadi suatu informasi yang terstruktur. Data warehouse berfungsi untuk
pengambilan keputusan, mempermudah dalam pengaksesan data dan menciptakan
konsistensi data.
Data warehouse memiliki karakteristik sebagai berikut:
a. Berorientasi subjek
Dimana data warehouse mampu menganalisis data dan menyediakan informasi
pada suatu subjek.
b. Terintegrasi
Dimana data warehouse dapat menyimpan data dari berbagai sumber ke dalam
suatu format yang saling berhubungan.
c. Time-Variant
Data warehouse mempunyai dimensi waktu dimana dalam setiap objek data yang
disimpan dapat menyimpan data dari awal terbentuk hingga data terbaru.
d. Non-Volatile
Dimana data warehouse tidak akan merubah data dan akan menyimpan data baru
yang akan disatukan dengan data yang sebelumnya.
2. Integrasi
Integrasi adalah penggabungan data dari berbagai sumber dimana biasanya dimulai
dengan proses penyerapan yang mencakup langkah-langkah seperti pembersihan data,
pemetaan ETL (Extract, Transform, and Load), dan transformasi. Tempat yang
dijadikan penyimpanan data harus fleksibel dan dapat menampung data dengan
jumlah besar.
3. Extract, Transform, and Load (ETL)
Extract, Transform, and Load (ETL) adalah proses pemetaan data dengan
mengintegrasikan data-data kemudian menyimpan data tersebut ke dalam data
warehouse.
a. Extract
Extraction adalah pemilihan data dari berbagai sumber.
b. Transform
Transform adalah proses mengukur bagaimana cara data tersebut dapat digunakan
untuk dilakukan analisis.
c. Loading adalah proses menginputkan nilai data ke dalam sebuah database.
4. Talend Open Studio
Talend Open Studio merupakan salah satu aplikasi yang digunakan dalam praktikum
Data Warehouse yang digunakan untuk integrasi antara sistem operasional, dan
migrasi data oleh beberapa sumber. Selain itu bisa digunakan untuk memanipulasi
string, penanganan lookup otomatis, dan mampu menjalankan extract, transform dan
load. Selain itu terdapat juga beberapa objek yang digunakan dalam penggunaan
talend beberapa objek tersebut adalah sebagai berikut.
Gambar Objek Nama Objek Fungsionalitas
tFileInputExcel Digunakan untuk
menginputkan file
metadata excel

tMap Digunakan untuk


menghubungkan
beberapa file

tLogRow Digunakan Untuk


melihat hasil output
secara console.

tfileCopy Duginakan untuk


mengcopy file

tfileOutputDelimited Untuk menampilkan file


output dari proses yang
terjadi

tfilterRow Digunakan untuk


memfilter data

tFileCopy Menyalin file atau folder


ke direktori
B. Pembahasan
Tugas study kasus ini dibuat untuk memenuhi nilai ujian praktikum data warehouse.
Adapun langkah - langkah yang harus di lakukan pada praktikum ini yaitu :
1. Buka aplikasi talend open source
2. Buat file baru pada aplikasi talend open source (create job)
Isi form diatas sesuai dengan nama file yang akan dibuat untuk membuat lembar
kerja, lalu klik finish.
3. Setelah lembar kerja telah dibuat masukan object object untuk membentuk schema
pada talend open source.
4. Buat file delimited di metadata lalu klik (create file delimited)
a. Masukan nama lalu next
b. Browse file dengan format file csv untuk diinputkan, lalu ubah format dibawah
menjadi windows kemudian next

c. Ceklis set heading rows as coloumn names, next


d. Lalu finish

e. Drop file delimited yang sudah dibuat dan pilih componentnya sebagai
tfileinputdelimited
5. Buat file exel di metadata lalu klik (create file exel)

a. Masukan nama (studi) lalu next


b. Browse file yang akan diinputkan lalu centang all sheetsdan next
c. Centang set heading row as coloumn names lalu next
d. Lalu klik finish

e. Saat file sudah dibuat drop file tersebut ke lembar kerja dengan pilih component
tFileinputexcel.
6. Lakukan hal yang sama dengan mengcreate file excel di metadata, buat 2 file excel
Kembali dengan isian data yang berbeda untuk file studykasus2 dan stok lalu drop
file ke lembar kerja dan pilih component tFileinputexcel.
7. Selanjunya cari pada find component objek tmap lalu drop ke lembar kerja.

a. Hubungkan file yang tadi sudah di inputkan ke lembar kerja dan hubungkan
menggunakan row (main)

b. Dengan cara klik kanan piih row main lalu hubungkan ke objek tmap

8. Setelah menghubungkan setiap file nya ke tmap menggunakan row (main), klik 2
kali pada tmap dan akan muncul tampilan seperti dibawah ini.
a. Klik icon + diatas untuk membuat table output, table pertama dibuat dengan nama
table hasil akhir, lalu buat lagi table kedua untuk data yang direject dengan nama
tabel hasilsalah
b. Masukan data dari beberapa row sebelah kanan untuk digabungkan di table
hasilakhir dan table hasilsalah
c. Setelah itu apply lalu klik ok

9. Cari lagi di find component tfileOutputdelimited lalu drop ke lembar kerja


a. Hubungkan tmap pada tfileOutputDelimited_1 menggunakan row hasilakhir
b. Hubungkan tmap pada tfileOutputDelimited_2 menggunakan row hasilsalah

10. Hasil output pada tFileOutputDelimited_1 filter menggunakan objek tfilterrow


dihubungkan mmenggunakan row (main)

11. Dari objek filterrow dihubungkan dengan tfieOutputDelimited_3 dan


tfileOutputDelimited_4 unuk menampilkan hasil keluaran dari data yang sudah di
filter

a. tfleOutputDelimited_3 dihubungkan dengan row filter

b. tfileOutputDelimited_4 dihubungkan dengan row reject yang berarti ketika data


sudah di filter namun masih ada data yang tidak seharusnya ada dalam hasil
output ini maka akan dipisahkan ke tfileOutputDelimited_4 ini
12. Drop objek tLogRow

13. Drop tFileCopy

14. Masukkan file yang akan disimpan berbentuk .txt dan ubah Namanya menjadi
nilai1.txt
15. Pada tfileoutputdelimited2 masukkan file yang akan disimpan berbentuk .txt dan ubah
nama menjadi nilai2.txt

16. Pada tfileoutputdelimited3 masukkan file seprti sebelumnya dan ubah nama menjadi
nilai3.txt
17. Sama halnya dengan tfileoutputdelimited sebelumnya dan ubah nama menjadi
nilai4.txt
BAB III KESIMPULAN

Data Warehouse dapat digunakan untuk mempermudah dalam penyimpanan data


yang banyak dalam pembuatan laporan harian, mingguan dan bulanan. Dalam
pembuatannya terdapat Extract Transformation Load (ETL) yang merupakan sebuah
proses untuk memilah, mengubah, dan menggabungkan data yang berasal dari berbagai
sumber untuk di masukan ke dalam data warehouse. Untuk menjalankan ETL tersebut
dapat digunakan sebuah aplikasi bernama Talend Open Studio dimana aplikasi tersebut
dapat dengan mudah membantu dalam proses integrasi data.

Anda mungkin juga menyukai