Anda di halaman 1dari 32

Excel for Data Analysis

Muhammad Sifa’ul Rizky


@rizky_sifaul
Day 1
What to learn?
Day 1 Day 3
Day 2
Intro to Excel Conditional if-else-ifs
Data Formatting
(Formula & Function + Conditional
and Cleansing
+ Basic Statistics formatting

Day 4
Join multi sheet Day 5 Day 6
(vlookup/index Data visualization What if analysis
match) + pivot table

Day 7
Group Project
Presentation
Excel/Spreadsheet Tools
Intro to Sheet Interface
Nilai Sel (Cell
Nama Sel Value)
(Cell Kolom
Name)
Baris

Sel
(Cell)
Formula and Function

Menentukan jumlah
Sales
Formula Function
=C2+C3+C4+C5 =SUM(C2:C5)
Perbedaan sederhana antara formula dengan function adalah formula didasarkan pada kumpulan
sel/data yang kita pilih, sedangkan function adalah formula default yang sudah didesain untuk
memudahkan kita ketika melakukan sesuatu, bisa menjumlahkan, cari rata-rata, dkk.
Relative and absolute reference

Relative reference artinya setiap sel yang bergeser untuk formula di baris/kolom tersebut akan
ikut berubah, misal di gambar atas, jika formula dari Total Price adalah Quantity * Product Price,
maka bila digeser kebawah, maka formulanya akan mengikuti.
Relative and absolute reference

Absloute reference artinya adalah sel yang mau kita gunakan bisa tidak bergeser sama sekali,
sehingga nilai yang didapatkan selalu tepat. Sebagai contoh untuk mendapatkan After Disc adalah
sel D8 * Total Price, dengan $ sebagai penentu absolute maka bila kita geser kebawah, nilai
Discount tidak akan berubah sehingga formula yang dibuat dapat akurat.
Absolute reference
• Absolute row reference (A$1) (hanya mengunci baris saja)
• Absolute column reference ($A1) (hanya mengunci kolom saja)
• Absolute row-column reference ($A$1) (mengunci keduanya)

Row reference Column reference

Untuk row reference, di sel C2 diisi =A$2 (10) Untuk column reference, di sel I2 diisi =$G2 (10)
Sehingga bila digeser kebawah, nilai akan tetap Sehingga bila digeser kebawah, nilai akan
10 karena mengunci baris, sedangkan kalau menyesuaikan dengan kolom G, namun jika digeser
digeser kesamping dia tetap akan berubah. kesamping, nilai tetap sesuai dengan kolom G
karena mengunci kolom.
Basic Sorting and Filtering

Order ID Ship Mode Customer ID Segment City

CA-2016-152156 Second Class CG-12520 Consumer Henderson

CA-2016-152156 Second Class CG-12520 Consumer Henderson

CA-2016-138688 Second Class DV-13045 Corporate Los Angeles

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale


Basic Sorting and Filtering

Sorting (A-Z)

Filtering City = Fort


Lauderdale
Aggregasi

Menghitung jumlah data dalam kolom B Count : menghitung data numerik saja
dan C
Counta: menghitung data apapun
(numerik atau teks)

=COUNT(B2:B6) =COUNTA(B2:B6)
0 5
=COUNT(C2:C6) =COUNTA(C2:C6)
5 5
Statistika Dasar
• Secara umum, statistika dibagi jadi beberapa bagian, namun yang
paling sering adalah Deskriptif Statistik dan Inferensial Statistik.

Menghitung berapa data yang dimiliki


Nilai minimum

Nilai maksimum
Nilai rata-rata
Nilai yang paling sering keluar
Deskriptif atau Inferensial
• Fokus utama adalah menceritakan bagaimana kondisi data yang kita
miliki, hasil dari summary atau ringkasan data yang bisa berupa
rata-rata, median atau modus, dapat disajikan dalam bentuk grafik
yang sederhana.
• Statistik inferensial adalah sebuah sebuah metode yang dapat
digunakan untuk menganalisis kelompok kecil data dari data induknya
(sample yang diambil dari populasi) sampai pada peramalan dan
penarikan kesimpulan terhadap kelompok data induknya atau
populasi.
Kuartil

Secara umum, konsep kuartil adalah membagi data kedalam beberapa bagian yang sama rata
ukurannya, jadi jangan kaget kalau data yang dimiliki kok angkanya besar atau kecil.
Untuk Q1 itu berada di bagian pertama dari data yang kita miliki, dibagi lagi dengan Q2 serta Q3
sehingga data terbagi menjadi 4 bagian.
Excel for Data Analysis

Muhammad Sifa’ul Rizky


@rizky_sifaul
Day 2
What to learn?
Day 1 Day 3
Day 2
Intro to Excel Conditional if-else-ifs
Data Formatting
(Formula & Function + Conditional
and Cleansing
+ Basic Statistics formatting

Day 4
Join multi sheet Day 5 Day 6
(vlookup/index Data visualization What if analysis
match) + pivot table

Day 7
Group Project
Presentation
Data formatting

Nilai Tipe data


30 Number
30,5 Number
0.8 String
MySkill String
10 Jan Date
10 Jan 2022 Date

Sebelum kita bisa membersihkan data Excel, kita wajib tahu dulu format data/nilai dalam Excel,
ada banyak loh tipenya, mulai dari Number, Text, Date, dan lain-lain, cuma yang paling sering
digunakan ya tiga diatas.
Extract data from many form (time)

=DAY(A2)
=MONTH(A3)
=YEAR(A4)
=TEXT(A5;”mmmm”)
=TEXT(A6;”mmm yyyy”)
=NETWORKDAYS(A2;A7)

Untuk format Date, ada banyak function yang bisa digunakan untuk mengekstraksi data dari sana,
bisa buat hanya ambil tanggal, bulan atau tahun dari sana. Selain itu juga bisa buat selisih antar
tanggal juga loh, jadi lebih memudahkan buat kita.
Extract data from many form (text)
=CONCAT(A2, ”-” ,E2)
1-Second Class
=LEFT(F2, 2)
CG

=RIGHT(F2, 5)
12520
=FIND(“-”, B2,5)
Berlaku pula buat yang Text, kita bisa mengambil data apapun dari sana, ini biasanya dibutuhkan
jika kita ada kebutuhan soal mengambil data secara sebagian, sebagai contoh untuk mengambil
dua huruf pertama dari Customer ID atau lima digit dari Customer ID.
Duplicate data

Masalah yang terkadang selalu dibicarakan adalah soal data yang duplikat, jadi maksudnya adalah
jika ada data yang sama persis berada di baris yang berbeda, itu akan sangat mempengaruhi hasil
analisis, oleh karena itu harus dihapus. Excel memiliki fitur untuk menghapusnya.
Data validation

Untuk mencegah agar orang tidak sembarangan mengisi datanya, kita dapat menggunakan Data
Validation dengan nilai yang sudah kita persiapkan. Kolom Usia sudah dibatasi antara nilai 17
hingga 60, kalau dipaksakan diluar itu, muncul error.
Excel for Data Analysis

Muhammad Sifa’ul Rizky


@rizky_sifaul
Day 3
What to learn?
Day 1 Day 3
Day 2
Intro to Excel Conditional if-else-ifs
Data Formatting
(Formula & Function + Conditional
and Cleansing
+ Basic Statistics formatting

Day 4
Join multi sheet Day 5 Day 6
(vlookup/index Data visualization What if analysis
match) + pivot table

Day 7
Group Project
Presentation
Kondisi ketika
benar
if and ifs
=IF(D2 == “Consumer”, “Yes”, “No”)

Mencari data jika berada dalam kondisi Kondisi ketika


tertentu. If dengan 2 kondisi saja, ifs salah
dengan banyak kondisi.
Order ID Ship Mode Customer ID Segment City

CA-2016-152156 Second Class CG-12520 Consumer Henderson

CA-2016-152156 Second Class CG-12520 Consumer Henderson

CA-2016-138688 Second Class DV-13045 Corporate Los Angeles

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale


Data yang
muncul jika
Kondisi pertama kondisi pertama

if and ifs terpenuhi

Data yang
=IFS(E2 = “Henderson”, “HN”, muncul jika
Kondisi kedua
E2 = “Los Angeles”, “LA”, kondisi kedua
Perbedaan sederhana antara if dengan ifs adalah kalau if
hanya digunakan untuk memiliki 2 kondisi saja, sedangkan ifs E2 = “Fort Lauderdale”,”FL”)
Kondisi ketiga Data yang
bisa digunakan di lebih dari 2 kondisi. Sebagai contoh, di sini muncul jika
kita ingin mengubah City menjadi singkatan, sehingga perlu 3
kondisi ketiga
kondisi disana, Henderson, Los Angeles dan Fort Lauderdale.

Order ID Ship Mode Customer ID Segment City Value

CA-2016-152156 Second Class CG-12520 Consumer Henderson HN

CA-2016-152156 Second Class CG-12520 Consumer Henderson HN

CA-2016-138688 Second Class DV-13045 Corporate Los Angeles LA

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale FL

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale FL


and or
=AND(B2 = “Second Class”,
Konsep and sebenarnya adalah menggabungkan 2/lebih E2 = “Henderson”)
kondisi dengan kata sambung dan, sedangkan or dengan kata
sambung atau. Sehingga akan berguna jika ingin memiliki
banyak kondisi yang wajib/sunah.

Mencari data yang Ship Mode adalah Second Class dan City adalah Henderson.

Order ID Ship Mode Customer ID Segment City Is_city

CA-2016-152156 Second Class CG-12520 Consumer Henderson True

CA-2016-152156 Second Class CG-12520 Consumer Henderson True

CA-2016-138688 Second Class DV-13045 Corporate Los Angeles False

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale False

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale False


and or
=OR(B2 = “Standard Class”,
Konsep and sebenarnya adalah menggabungkan 2/lebih E2 = “Los Angeles”)
kondisi dengan kata sambung dan, sedangkan or dengan kata
sambung atau. Sehingga akan berguna jika ingin memiliki
banyak kondisi yang wajib/sunah.

Mencari data yang Ship Mode adalah Standard Class atau City adalah Los Angeles.

Order ID Ship Mode Customer ID Segment City Is_city

CA-2016-152156 Second Class CG-12520 Consumer Henderson False

CA-2016-152156 Second Class CG-12520 Consumer Henderson False

CA-2016-138688 Second Class DV-13045 Corporate Los Angeles True

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale True

US-2015-108966 Standard Class SO-20335 Consumer Fort Lauderdale True

Untuk output dari function and dan or ini selalu TRUE atau FALSE ya.
Implementation

• Countif/countifs
• Sumif/sumifs
• Averageif/averageifs
Countif/countifs
Mencari berapa data dengan Name adalah PS5

=COUNTIF(A2:A11;"PS5")
Rentang data Kondisi yang
yang mau mau dicari
dicari

Mencari berapa data dengan Name adalah PS5 dan Stock yang dibawah 2

=COUNTIFS(A2:A11;"PS5";B2:B11;"<2")
Rentang Rentang kedua
pertama dari dari data yang
data yang mau mau dicari
dicari
Kondisi Kondisi kedua
pertama yang yang mau
mau dicari dicari
Sumif/sumifs
Mencari jumlah stock Xbox Series S

=SUMIF(A2:A11;"Xbox Series S";B2:B11)


Rentang data Rentang data
yang mau Kondisi yang
mau dicari yang mau
dicari dijumlahkan

Mencari jumlah stock Xbox Series S yang Stock nya diatas 6

=SUMIFS(B2:B11;A2:A11;"Xbox Series S";B2:B11;">6")


Rentang Rentang kedua
Rentang data pertama dari dari data yang
yang mau data yang mau mau dicari
dijumlahkan dicari
Kondisi Kondisi kedua
pertama yang yang mau
mau dicari dicari
Averageif/averageifs
Mencari rata-rata stock Nintendo Switch

=AVERAGEIF(A2:A11;"Nintendo Switch";B2:B11)

Rentang data Rentang data


yang mau Kondisi yang
mau dicari yang mau
dicari dirata-rata

Mencari rata-rata stock Nintendo Switch dengan stock diatas 8

=AVERAGEIFS(B2:B11;A2:A11;"Nintendo Switch";B2:B11;">8")

Rentang Rentang kedua


Rentang data pertama dari dari data yang
yang mau data yang mau mau dicari
dirata-rata dicari
Kondisi Kondisi kedua
pertama yang yang mau
mau dicari dicari
Conditional formatting

• Conditional formatting bertujuan


agar kita dapat memetakan data
mana yang sesuai dengan kriteria
kita, misal untuk membedakan
antara PS5, Xbox Series S dan
Nintendo Switch, sehingga
berbeda dengan filter sederhana,
memetakannya berdasarkan
warna dan akan lebih
memudahkan dalam membaca
data.

Anda mungkin juga menyukai