Data Analytics
Dewi Febriani, M.Ak., SAS, CA
Putri Syifa Amalia, M.Sc., Acc.
Dr. Rochania Ayu Yunanda, M.Sc., Acc.
Perception Students Have
1. Informasi dan pengetahuan apa yang bisa kita dapatkan dari data dibawah ini?
Tambahan: Veracity
(Keakuratan atau
kualitas data)
Teknologi Big Data
● SQL (Structured Query Language) -
https://dev.mysql.com/downloads/
● Hadoop Distributed File System -
https://hadoop.apache.org/releases.html
● MapReduce
● Hive - https://hive.apache.org/downloads.html
● Pig - https://pig.apache.org/releases.html
● Hbase -
https://hbase.apache.org/downloads.html
● Drill - https://drill.apache.org/download/
● Dan lain-lain
Perbedaan Data Mining & Data Analytics
● Data Mining adalah proses
mengidentifikasi hubungan dan pola
dalam kumpulan data yang besar, secara
efektif mengubah data mentah menjadi
informasi penting yang berguna.
● Data analytics adalah proses
menggunakan data untuk mengekstrak
wawasan dan mendapatkan pemahaman
tentang perilaku atau kinerja bisnis, serta
melakukan analisis yang terkait dengan
tujuan bisnis tertentu, seperti membuat
keputusan atau mengembangkan
strategi.
Machine Learning
Unsupervised Learning = menarik
kesimpulan dan mempelajari struktur dari
data tanpa diberi label, klasifikasi, atau
kategori apa pun.
● Clustering: Misalnya, kita memiliki
kumpulan data pelanggan toko online
yang berisi informasi tentang produk
yang dibeli, jumlah uang yang
dihabiskan, lokasi pengiriman, dan
sebagainya.
● Anomaly detection: Misalnya, kita
memiliki kumpulan data tentang
transaksi kartu kredit yang mencakup
informasi seperti tanggal, waktu,
jumlah, dan jenis pembelian.
Machine Learning
Supervised Learning = mempelajari fungsi
yang memetakan satu set variable input ke
variabel output menggunakan satu set
contoh pasangan input-output.
● Klasifikasi: Misalnya, kita memiliki
kumpulan data pelanggan toko online
yang berisi informasi tentang produk
yang dibeli, jumlah uang yang
dihabiskan, lokasi pengiriman, dan
sebagainya, serta label yang
menunjukkan apakah pelanggan itu loyal
atau tidak.
● Regresi: Misalnya, kita memiliki
kumpulan data tentang harga rumah
yang mencakup informasi seperti ukuran
rumah, jumlah kamar tidur, dan lokasi.
Sources of Data
Internal Sources
● Datawarehouse
● Sumber data internal seperti email,
spreadsheet, dokumen pengolah kata
● Web server logs
● Customer surveys
External Sources
● Clickstreams
● Google Finance
● Google Trends
● Climate Data
● Social Media
● Sumber lain seperti BPS, Kementerian,
Situs Publik dan lain-lain
Types of Analytics
● Descriptive Analytics
Mengambil data mentah dan meringkas atau
menggambarkannya untuk memberikan
informasi yang bergunan tentang masa lalu.
---"What has happened in the past?“---
● Predictive Analytics
Membangung model statistik dari data
mentah yang diproses.
---"What will happen in the Future?“---
● Prescriptive Analytics
Pengembangan analitik prediktif untuk
memperkirakan hasil dimasa depan
berdasarkan masa lalu dan tindakan yang
disarankan untuk menentukan tindakan
terbaik yang akan diambil.
---" What should we do?“---
Jazakumullah khayran
Thanks to slidego