Anda di halaman 1dari 15

Data

Wrangling
dengan
Python
Alfazrin Banapon
Data Wrangling
Jika ada yang bertanya kepada data analysts, data scientists, atau statisticians tentang tugas apa yang paling sering
mereka lakukan, the answer is Data Wrangling

Data wrangling, data munging, atau data transformation adalah proses transformasi data ‘mentah’ menjadi
format siap pakai dalam analisis.

Sebagai data scientist keterampilan Data Wrangling merupakan core yang harus dimiliki

75%
Waktu pekerjaan Data
Science di habiskan di
tahapan ini

Data Wrangling adalah Dirty Work dalam alur kerja analisis data
6 Core Data Data
Aktifitas 01 Discovering 04 Enrichment

dalam
Proses
Data Data Data
02 Structuring 05 Validating
Wrangling

Data Data
03 Cleaning 06 Publishing

Trifacta
01

Which
Programing Language can we use ?
Which
Library in Python can
we use, for Data
Wrangling ?
Kenalan
Dulu
Sama
Data
Data are characteristics or
information, usually
numerical, that are collected
through observation. In a
more technical
sense, data are a set of
values of qualitative or
quantitative variables about
one or more persons or
objects, while a datum
(singular of data) is a single
value of a single variable.
Data
Structured
Data:
Tabular
Data Cleaning

01

Renaming

02
Sorting and
Recording
Data Cleaning

03
Removing
Duplicate Data

04
Handling
Missing Value
Data Cleaning

05
Data Type
Confersion
Data Cleaning

06
Handling
Outlier
Data tersedia dalam
Data berbagai ukuran dan
bentuk, sebagai data
Structuring scientist pada proses ini
dapat dilakukan proses
merge, order or reshape
data.

Atau juga biasanya


melakukan perubahan
pada struktur data, hal
ini biasanya melibatkan
switch pada baris dan
kolom
Data
Enrichment
02

Mostly pada bagian ini, Bining


digunakan untuk
memperkaya data.
Dapat digunakan untuk
menggabungkan data
baru atau membuat
kolom baru
berdasarkan data yang 01
sudah ada, Beberapa
cara untuk Enrichment
Data adalah Adding New Column
Are you
ready for
coding
with dirty
work ?

Anda mungkin juga menyukai