Anda di halaman 1dari 21

Data Analysis

by Ezra Libertino

© 2023 Ezra Libertino


Apa itu Data?
Data adalah kumpulan informasi dari masa
lalu atau masa sekarang. Data bisa dianalisis
untuk menemukan tren/pola, yang dapat
memprediksi peristiwa di masa depan dan
mengambil keputusan yang lebih baik.

Data Analysis Data-Driven


Decisions
Apa yang dibutuhkan
untuk Data Analysis?

Raw Data Math and Tools (Excel,


Statistics Python, AI, etc)
Tahapan
Data Analysis

Tentukan Tujuan Pengumpulan Data Pengolahan Data Visualisasi Data


Apa yang ingin Bisa dengan berbagai Pembersihan data, Tampilkan tabel, grafik,
dicapai/diketahui metode. Data harus analisis dengan tools atau chart agar mudah
dari analisis? banyak tapi akurat. yang sesuai. dipahami.
1
1. Buat SMART Goal
Specific: Jelas, fokus, dan detail.
Measurable: Bisa diukur kuantitatif/kualitatif.
Achievable: Bisa dicapai, tidak terlalu sulit.
Relevant: Harus sesuai/berguna.
Time-Bound: Harus memiliki deadline.

Aku mau cari tahu cara belajar terbaik


biar bisa dapat nilai rata-rata 90,
dengan melakukan eksperimen
selama 2 bulan kedepan!
2. Buat Hipotesis
Hipotesis adalah dugaan sementara, yang harus
dibuktikan kebenarannya melalui hasil analisis.
Jika hipotesis benar, akan berubah jadi teori.
Jika hipotesis salah, itu bukan berarti kegagalan
tetapi dapat menjadi peluang untuk mencari
kebenaran.

Karena aku suka nonton YouTube,


sepertinya belajar dari video YouTube
akan lebih meningkatkan nilaiku
daripada belajar dari buku.
2
Metode Pengumpulan Data
Analytics
Eksperimen Wawancara
Software

Data
Observasi Kuesioner
Sekunder
Validitas/Reliabilitas
3
Pembersihan Data
Memperbaiki typo/salah ketik.
Penghapusan data duplikat/salah.
Memeriksa data outlier (jika outlier memang
benar terjadi, data tidak boleh dihapus).
Pengisian/imputasi nilai kosong (bisa dengan
mean/modus/median/regresi/hot deck/dll.)
Penyederhanaan Data
Penyortiran sesuai jenis/kategori.
Integrasi (menggabungkan beberapa sumber
data ke satu tempat, agar mudah dianalisis).
Reduksi (menghapus data yang kurang relevan).
Agregasi (menggabungkan beberapa nilai data
menjadi satu nilai, bisa dengan mean/total/max).
Sampling (mengambil sebagian kecil data
untuk mewakili keseluruhan).
Analisis Data
Rata-rata (mean): memberi gambaran umum tentang data yang
diolah, namun dapat terganggu oleh outlier.
Median: tidak terganggu outlier, tapi tidak memberi gambaran
jelas tentang data yang diolah.
Modus: gambaran tentang data yang paling sering muncul.
Regresi: menemukan pola, memprediksi nilai (interpolasi).
Korelasi: menentukan kekuatan hubungan/keterkaitan.
ANOVA: menentukan apakah ada perbedaan signifikan.

Tools:

Excel Tableau Power BI SPSS Python R


Penyimpanan Data
Beberapa informasi bisa digunakan di kemudian hari,
maka data perlu disimpan di tempat yang aman,
memiliki backup di tempat terpisah, dilengkapi
metadata (tanggal/keterangan/dll.), dan menetapkan
standar/kebijakan yang jelas dan konsisten seperti
batasan akses data, periode penyimpanan data, dan
penghapusan data yang tidak lagi diperlukan.
4
Tujuan Visualisasi
Memahami data dengan lebih baik dan jelas.
Mempermudah identifikasi dan perbandingan.
Membuat data terlihat lebih menarik.
Metode Visualisasi (Part 1/3)
Item 5 Item 1
40 25 20% 20%

20
30

15
20
10 Item 4 Item 2
20% 20%
10
5

0 0 Item 3
Item 1 Item 2 Item 3 Item 4 Item 5 Item 1 Item 2 Item 3 Item 4 Item 5
20%

Line Chart Bar Chart Pie Chart


Metode Visualisasi (Part 2/3)

Candlestick Heatmap Radar


Metode Visualisasi (Part 3/3)

Bubble Map Square Area


Thank
You
© 2023 Ezra Libertino

Anda mungkin juga menyukai