Anda di halaman 1dari 25

01 - What is It Like to be Data Analyst

- Data Analyst berperan sebagai penghubung antara data yang telah didapat dari
berbagai macam sumber dan manajemen. Nah, dimana angka dan data yang rumit
diubah menjadi outcomes dan sugesti yang mudah untuk dimengerti.
- Data ini bisa menjawab pertanyaan - pertanyaan bisnis dan menyelesaikan masalah
yang sedang dihadapi perusahaan.

- Untuk melihat jenjang karirnya: data analytics sebagai “umbrella term” dimana di sebuah
perusahaan, data analyst dapat berupa
- Business Analyst
- Management Reporting
- Corporate Strategy Analyst
- Compensation & benefit Analyst
- Budget Analyst
- Insurance Underwriting Analyst
- Actuary
-
- What skills do you need to master at?
1. Communication Skills
Sebagai data analyst kita harus bisa berkomunikasi dengan stakeholders, kolega
kerja, penyedia data, pemilik sistem dan masih banyak lagi yang terlibat dalam
proses mengembangkan insight untuk pengambilan keputusan. Meningkatkan
skill komunikasi secara verbal, tertulis melalui sangat penting.
2. Critical Thinking
Berpikir kritis maksudnya adalah berpikir lebih dari tugas yang diberikan
kepadamu. Misalnya: “Apa yang sebenarnya dimaksud dari hal ini?” dan “Impact
apa yang akan dihasilkan oleh hal ini pada proses?”. Ketika kamu mendapatkan
tanggung jawab, nantinya akan terbiasa melihat suatu permasalahan tentang
data lebih dalam.
3. Data Visualization Skills
Tidaklah penting media apa yang dipakai untuk membagikan insight. Dapat
menggambarkan proses secara komprehensif justru menjadi hal yang penting
dimiliki oleh setiap Data Analyst.

Kamu akan sering mengkomunikasikan insight mu melalui report, dashboard


interaktif atau sebuah chart. Dan pastikan kamu memakai tipe chart yang tepat
untuk data dan desain kerjamu, agar temuan kuncinya dapat tersampaikan.

- What type of person is best suited for this career?


1. Strong Analytics Aptitude
Analis wajib mempunyai kekuatan pemikiran secara logika, verbal dan kuantitatif.
Karena kamu akan selalu bermain dengan data, maka kamu akan selalu
tergambar kemungkinan, pola, dan proses dari data tersebut kalau kamu
memiliki pemikiran analitik yang kuat.
2. Curious as a cat
Analisis terbaik biasanya selalu penasaran dengan apa yang customer inginkan,
apa yang bekerja, apa yang tidak, dan kenapa. Bisa jadi tidak tahu setiap
jawabannya, tapi dengan rasa penasaran, mereka dapat mengambil ilmu dari
koleganya, dan menggunakan data untuk membuktikan dan mengkuantifikasikan
insight tersebut.
3. Motivated by impact
Sebagai seorang analis, tentunya kamu terbiasa termotivasi untuk
menyelesaikan masalah dengan membuat perubahan dan menyalurkan impact
menggunakan data dan insight.
4. Structured Problem Solver
Analisis yang baik selalu ingin untuk mencari solusi dari isu yang datang dari
background sains dan engineering. Mereka adalah pemecah masalah yang baik
karena kemampuan mereka dalam mengambil masalah, memilahnya menjadi
kecil, dan mencari solusi pendekatan berdasarkan hipotesis mereka.

- How to Get Started in Data Analyst?


1. Excel Analysis, Pivot Table
2. SQL (Structured Query Language), yaitu bahasa yang memperbolehkan kita
untuk berinteraksi dengan database yang menyimpan data. Dengan mempelajari
SQL, kita dapat menganalisis data secara cepat dan mudah dan memungkinkan
kamu melakukan analisis dari jutaan set data secara relatif lebih cepat.
3. Data visualization, ini berguna untuk mengambil keputusan. Dengan melihat
hasil pengolahan secara visual grafik, chart dll. Ini dapat mengidentifikasi tren
dan pola dan memahami informasi yang kompleks.

Buku referensi:
- Business Intelligence for Dummies by Swain Scheps
- Data Analytics for Dummies by Lilian Pierson

02 - Introductory to Data Analytics


Part I - Introductory to Data Analytics
Setelah menyelesaikan materi ini, kamu akan mempunyai pemahaman mengenai:
1. Apa itu Data Analytics
2. Skills yang dibutuhkan untuk menjadi Data Analyst
3. Data Analysis Framework
4. Data Cleaning & Transformation

Apa itu Data Analytics


Data Analytics adalah sebuah proses mengumpulkan, merapikan dan menganalisis data
sehingga diperoleh informasi yang bernilai guna untuk membantu penentuan keputusan dan
keberlangsungan sistem.
Menjadi seorang Data Analyst, kamu harus mampu memiliki skills berikut:
- Analytics Skills
- Communication Skills
- Critical Thinking
- Attention to Detail
- Math Skills
- Technical Skills (SQL, R, Python , Hadoop)

Data Analytics Framework


1. Pre Analysis
Ada beberapa poin yang kita harus kenali sebelum menganalisis data, yaitu:
a) Analytics Lifecycle
Analytics Lifecycle - cycle dari analisis dari beberapa fase, yang bisa terjadi pada
saat yang bersamaan.
Phases:
Objective - pahami bidang bisnis beserta goals yang sedang diteliti
Understand the Data - cek apakah data dapat memenuhi objektif apa tidak
Data Cleaning & Transformation - menghilangkan data yang buruk dan
mengubah data sesuai kebutuhan
Data Enhancement - menambah nilai dari data dengan melihat sumber
eksternal
Data Analytics - Analisis kinerja data secara statistik untuk menjawab objektif
bisnis.
Data Visualization - analisis data adalah tentang storytelling, oleh karena itu
presentasikan hasilnya secara baik

b) Goal Tree
Goals Tree - pahami goals bisnismu, terjemahkan jadi metrics, susun metricsnya
sampai jadi goals tree.
Goals tree ini penting banget sebagai proses menerjemahkan goals bisnis
menjadi lengkah optimasi konkrit.
c) Garbage in Garbage Out
Kualitas informasi yang keluar setelah proses pengolahan data, tidak akan lebih
baik dari kualitas informasi yang masuk sebelum diolah. Oleh karena itu, penting
untuk memastikan data yang masuk adalah data yang sesuai dengan objektif.

2. Data Management
Data management adalah proses mendapatkan, memvalidasi, menyimpan, melindungi dan
memproses data yang dibutuhkan. Dan ada beberapa parameter kualitas data yang penting
untuk diketahui:
- Validity - Data yang sesuai dengan peraturan di bisnismu
- Accuracy - Data yang sesuai dengan nilai benar objektifmu
- Completeness - Data tidak berupa sebagian dari objektif
- Consistency - Agar data dapat di analisa untuk mendapatkan informasi
- Uniformity - Mempunyai satuan pengukuran yang sama

3. Data Gathering

Proses ini merupakan proses yang paling penting dan krusial dalam Data Analytics. Objektif
dari proses ini adalah memastikan data yang diambil kaya akan informasi dan dapat
dipertanggungjawabkan.

Terdapat 7 cara dalam mengumpulkan data, yaitu:


1. Survey - melalui survey bisa langsung bertanya ke customer untuk informasi kualitatif
dan kuantitatif
2. Online Tracking - web dan apps bisnismu adalah tools yang baik untuk mengambil data
customer
3. Transactional Data Tracking - melalui e-commerce atau transaksi offline.
4. Collecting Subscription and Registration - seperti yang sering dilihat di website
5. Online Marketing Analysis - bisa juga mendapatkan data dari campaign marketingmu
6. Social Media Monitoring - bisa lihat dari list followermu, karakteristik umum mereka,
untuk lebih memahami audiencemu
7. In-store Traffic Monitoring - bisa memonitor toko offline kamu untuk melihat jam dan dari
kapan kamu paling sibuk.

4. Data Interpretation
- Interpretasi data adalah proses untuk menjelaskan hasil dari sekumpulan data yang
telah diolah.

Data Cleaning
Di data cleaning terdapat 4 proses yang bisa dilakukan:

1. Remove Unwanted Observations


Langkah pertama dari data cleaning adalah menghilangkan observasi yang tidak
diinginkan dari dataset kita.

2. Fix Structural Error


Error ini adalah error yang biasanya terjadi dalam pengelompokkan data yang tidak
konsisten, coba saja cek apa ada typo dan huruf kapital yang gak konsisten dari data
supaya kamu dapat terhindar dari error ini.

3. Managing Unwanted Outlier


Outlier adalah data yang memiliki karakteristik berbeda dengan data lainnya. Jangan
dihapus, mungkin outlier di datamu menyimpan informasi menarik. Kita harus punya
alasan logis untuk menghapus outlier, misal karena pengukuran yang mencurigakan
sehingga keaslian data diragukan.
4. Handle Missing Data
Cara untuk mengisi data yang hilang sebenarnya bisa dilakukan dengan 3 cara:
- Melakukan observasi kembali
- Memasukkan nilai berdasarkan observasi data yang lain
- Melakukan pengaturan secara technical. (Misalnya: missing categorical data ->
label them as ‘Missing’)

Data Transformation
Setidaknya ada 3 teknik analisis data yang biasa dipakai untuk mendapatkan insight baru:
a) Statistical Descriptive
Dengan melakukan pendekatan statistik, kamu dapat mengkarakterisasi data
berdasarkan sifatnya. Nah terdapat 4 sifat pengukuran yang biasa dipakai:
- Measures of frequency (gunakan ini kalau kamu ingin memperlihatkan seberapa
sering data muncul)
- Measures of central tendency (gunakan ini kalau kamu ingin tau rata-rata dari
data)
- Measures of dispersion or variation (gunakan ini kalau kamu ingin tahu seberapa
tersebarnya data)
- Measures of position (gunakan ini kalau kamu ingin membandingkan nilai
dengan standar sebaran normal)

b) Linear Regression (trend analysis)


Ketika kamu mendapatkan 2 variable dimana 1 variabel bersifat independen dan 1
variabel bersifat dependen, kamu bisa menggunakan scatter chart di excel dan
mendapatkan garis tren beserta persamaanya.
c) Correlation Analysis
Korelasi adalah pengukuran statistik yang mengindikasi bagaimana hubungan antar
variabel. Korelasi positif menandakan hubungan saling menguatkan antar variabel (A
naik maka B naik, sebaliknya). Sementara, korelasi negatif menandakan hubungan
berlawanan antar variabel (A naik maka B turun, sebaliknya)
03 - Excel Fundamental for Data Analytics
- VLOOKUP() - vlookup dapat membantu untuk mencari dan menghasilkan nilai yang kita
inginkan dari sebuah tabel. Nilai yang akan di “lookup” haruslah nilai yang berbeda di
paling kiri tabel, dengan kolom “ lookup” disebelah kanannya.
- Syntax dasar dari vlookup:
a) VLOOKUP(Key to lookup, Source_table, column of source table, relative match?)
Contoh:
Disini, kita ingin mencari nilai email di tabel berdasarkan nilai ID 622, maka kita
bisa menggunakan fungsi vlookup dengan syntax:
=VLOOKUP(D4;B8:F17;4;FALSE)
b) CONCATENATE() - Concetenate berguna untuk menyatukan teks dari dua atau
lebih cell menjadi satu cell.
Contoh:
Untuk mendapatkan kolom URL, kita perlu menyatukan kedua kolom
menggunakan fungsi concatenate.
Syntax dasar yang bisa dipakai adalah:
=CONCATENATE(Text1; Text2; Text 3)

Dengan menuliskan syntax


=CONCATENATE(C3;D3)
(nomor pada kolom tergantung barus yang diinginkan), maka dihasilkan hasil
seperti tabel dibawah:

c) IF() - melalui fungsi ini, kita dapat mengatur kondisi kapan suatu nilai benar, dan
kapan suatu nilai salah. Kemudian menentukan output dari setiap kondisi
tersebut.
Syntax dasar dari IF:
=IF(TesLogika, KondisiTerpenuhi, KondisiTidakTerpenuhi)

Contoh:
Misal, passing grade bagi siswa untuk dinyatakan lulus atau tidak adalah total
nilainya lebih besar dari 140. Fungsi if dapat digunakan untuk pengkondisian
tersebut.
Jika yang jadi patokan adalah Nilai A dan Nilai B, maka:

Jika, yang menjadi patokan jumlah, maka:


d) Pivot Table - merupakan sebuah fitur tabel interaktif yang dimiliki excel untuk
mendapatkan ringkasan perhitungan statistik dari jumlah data yang benar.

“Ketika kita bekerja dengan data dari perusahaan, mungkin kita akan
membutuhkan jawaban dari pertanyaan seperti:
- Berapa total keuntungan yang di dapat dari Daerah Jawa Barat?
- Berapa rata-rata customer perbulan untuk produk A?

Nah hal itu semua dapat dijawab dengan menggunakan Pivot Table.Ilustrasi
penggunaannya bisa kamu lihat pada gambar di bawah:

1) Buat table diatas di sheet yang baru, beri nama TableSumberStore


2) Setelah data kamu siap, kamu bisa cari fitur PIvot Table di: Insert ->
PivotTable

3) Kemudian setelah dari menu tersebut, akan muncul dialog box “Creative
PivotTable” seperti gambar dibawah ini:
4) Di sebelah kanan bidang, terdapat PivotTable Fields, Pada bagan ini,
diatur PivotTable mana saja yang akan ditempatkan sebagai Row,
Column, Value, atau filter.

Keterangan:
FILTERS: Area ini diisi dengan field penyaring data dari table pivot yang
akan dibuat
COLUMNS: Area ini berisi field yang menjadi header dari pivot table yang
akan dibuat
ROWS: Area ini berisi field yang akan ditampilkan secara menurun
(vertikal) secara urut di sebelah kiri area PivotTable.
VALUE: Bidang ini berisi fields yang menentukan data mana saja yang
akan disajikan di area tabel pivot sesuai kebutuhan. Biasanya berupa
angka-angka.

5) Isi PivotTable field seperti ini:


6) Maka hasilnya seperti ini:

Untuk TV, average sales store A adalah 3, dan store B adalah 6. Namun,
Untuk produk DVD, hanya store B yang menghasilkan revenue, dengan
average sales 8.

Data Cleaning in Excel


Excel memiliki fitur yang bisa membantu untuk membersihkan data. Yaitu:
a) Remove Duplicate Values
Ini adalah fitur built-in untuk menghilangkan nilai ganda dari tabel.
1) Pada tabel dibawah ini, terlihat A001 dan A002 punya beberapa nilai yang sama.

2) Select Data -> Go to Data Ribbon -> Remove Duplicates

b) Text to Columns
Dibawah ini, kamu bisa liat nilai yang kepisah titik koma (;) kan?

Kemudian, Select Data -> Go to Data Ribbon -> Click “Text to Columns” -> Set to Delimiter
& Semicolon -> finish
04 - How to Manage Your Data
Pada Part ke-3 ini, akan belajar tentang me-manage data kamu menggunakan syntax-
syntax dasar yang biasa dipakai di SQL

SQL (Standard Query Language) adalah bahasa pemrograman yang berkomunikasi


dengan database sehingga semua data yang dimiliki dapat diatur sedemikian rupa.

Per hari ini, hampir semua bisnis, mulai dari toko online kecil sampai korporasi
menggunakan data dalam menjalankan bisnis mereka. Oleh karena itu, itu kebutuhan
akan ahli database meningkat terus dari tahun ke tahun.

1) Creating Database
SQL database adalah koleksi data pada sistem elektronik yang mudah untuk
diakses, di update, dan diubah.
- Syntax dasar untuk membuat database adalah:
CREATE DATABASE database_name;
- Sementara untuk menghapus database syntax yang digunakan adalah:
DROP DATABASE database_name;

2) SELECT function
Perlu diingat, clause SELECT itu penting banget

Pernyataan SELECT digunakan untuk mengambil data dari tabel database yang
mengembalikan data dalam bentuk tabel.
- Syntax dasar dalam menggunakan SELECT adalah:
SELECT column1, column2, columnN FROM table_name;

Dimana column1, column2, dst. Adalah posisi tabel yang ingin kamu
ambil di kolom berapa, jika kamu ingin mengambil semua data maka
syntax yang bisa dipakai adalah:
SELECT * FROM table_name;
SELECT Clause in Detail

3) WHERE clause for querying data


SQL Where digunakan untuk mengambil data sesuai kondisi yang diinginkan dari
satu tabel atau dengan menggabungkan beberapa tabel. Kamu akan
menggunakan klausa WHERE untuk menyaring output data untuk mendapatkan
data yang kamu butuhkan saja.

- Syntax dasarnya adalah:


SELECT column1, column2, columnN
FROM table_name
WHERE [condition]

Dari contoh ini, jadi kita hanya mendapatkan customer dengan ID 1 saja.

Kamu bisa menjelaskan kondisinya dengan menambahkan operator >, <,


=, LIKE, NOT, dll.

Contoh:
SQL> SELECT ID, NAME, SALARY
FROM CUSTOMERS
WHERE SALARY > 2000;
Dengan syntax ini, kamu ingin mengambil data dari kolom ID, NAME, dan
SALARY tapi hanya data dengan kondisi SALARY lebih besar dari 2000.

4) ORDER BY function
Jadi kalau kita ingin sort customer dengan nama pertamanya, maka ini yang kita
tulis:
Karena tadi sudah tulis WHERE dimana yang muncul customer ID 1 saja,
makanya kita coba untuk menghapusnya:

Maka seperti ini munculnya:

5) INSERT function
SQL INSERT berfungsi untuk menambahkan baris data ke tabel di database yang
kamu miliki
- Syntax dasarnya adalah:
INSERT INTO TABLE_NAME VALUES
(value1,value2,value3,...valueN);

Contoh:
INSERT INTO CUSTOMERS
(ID,NAME,AGE,ADDRESS,SALARY)
VALUES (1,’Ramesh’, 32, ‘Ahmedabad’, 2000.00);

INSERT INTO CUSTOMERS


(ID,NAME,AGE,ADDRESS,SALARY)
VALUES (2, ‘Khilan’, 25, ‘Delhi’, 1500.00);

Pada syntax tersebut, kamu akan menambahkan 6 baris data


(ID,NAME,AGE,ADDRESS,SALARY) di tabel CUSTOMERS

Atau kamu juga bisa pakai syntax seperti ini:


INSERT INTO CUSTOMERS
VALUES (7, ‘Muffy’, 24, ‘Indore’,10000.00 );

Nah bisa juga memindahkan data antar tabel dengan menambahkan fungsi
SELECT dalam fungsi INSERT

Contoh syntax:
INSERT INTO first_table_name
[(column1, column2, … columnN)]
SELECT column1, column2, ...columnN
FROM second_table_name
[WHERE condition];

6) DELETE query
SQL DELETE digunakan untuk menghapus data pada tabel. Kamu dapat
menggunakan fungsi WHERE dalam menghapus data pada kondisi tertentu.

- Berikut syntax dasar DELETE yang turut menggunakan WHERE:


DELETE FROM table_name
WHERE [condition];
Kita bisa menggabungkan beberapa kondisi dengan operator AND and OR.
Contoh penggunaan:

SQL> DELETE FROM CUSTOMERS


WHERE ID = 6;
Nah di syntax ini, berarti data dari tabel customer dimana nilai IDnya sama
dengan 6 akan dihapus.

7) UPDATE query
Fungsi UPDATE digunakan untuk memodifikasi data yang telah ada di tabel. Kita
dapat menggunakan fungsi WHERE untuk memodifikasi data pada kondisi yang
kita inginkan.

Syntax dasar fungsi UPDATE menggunakan fungsi WHERE:


UPDATE table_name
SET column1 = value1, column2 =
value2…., columnN = valueN
WHERE [condition]:

Kita bisa menambahkan kondisi-kondisi lainnya operator AND and OR.

Contoh:
SQL> UPDATE CUSTOMERS
SET ADDRESS = ‘Pune’
WHERE ID = 6;

Maka dengan syntax ini, kamu akan mengupdate tabel CUSTOMERS dengan
mengganti address menjadi Pune pada ID ke 6

Anda mungkin juga menyukai