21/481452/EK/23654
Tugas Meringkas Chapter
- Extracting data
- Transforming data
- Loading data
- Sharing results
Data storytelling adalah proses menerjemahkan analisis data yang seringkali rumit menjadi lebih mudah
untuk dipahami untuk pengambilan keputusan yang lebih baik. Storytelling yang efektif harus :
1. Mengingat pertanyaan yang memulai proses analitik
2. Mempertimbangkan audiens
3. Visualisasi data yang baik dengan menggunakan representasi grafis dari data untuk menyampaikan
makna dengan bantuan data dashboard
A.Introduction
- Attributes of high-quality data
1. Accurate : benar, bebas dari kesalahan, akurat mewakili peristiwa dan kegiatan
2. Complete : tidak menghilangkan aspek acara atau kegiatan, cukup luas dan mendalam
3. Consistent : disajikan dalam format yang sama di atas waktu
4. Timely : disediakan pada waktunya untuk keputusan pembuat untuk membuat keputusan
5. Valid : data mengukur apa yang dimaksudkan untuk mengukur, sesuai dengan sintaks aturan dan
persyaratan
B.Data Structuring
- Aggregate data
Penyajian data dalam bentuk ringkasan. Data agregrat memiliki lebih sedikit detail daripada data terpilah. Saat
mengubah data, sangat penting untuk memahami tingkat agregasi untuk setiap data sumber karena
menggabungkan data yang dikumpulkan pada tingkat yang berbada dapat menimbulkan masalah.
- Data joining
Bagian penting dalam query database adalah menggabungkan informasi dari table yang berbeda ke dalam satu
table sehingga data yang digabungkan dapat dianalisis.
- Data pivoting
Pivot data adalah memutar data dari baris ke kolom. Beberapa program perangkat lunak dirancang untuk
menggunakan data yang di-pivot daripada data yang tidak di-pivot. Memahami desain program menjadi data
akan membantu menentukan apakah data perlu diputar atau tidak.
C. Data Standardization
Standardisasi data adalah proses standarisasi struktur dan arti dari setiap data sehingga dapat dianalisa dan
digunakan dalam pengambilan keputusan. Standarisasi data khususnya penting ketika menggabungkan data
dari beberapa sumber. Mencapai data standar mungkin melibatkan: mengubah data ke format umum, tipe data,
atau skema pengkodean. Standarisasi data juga
mencakup memastikan informasi terkandung di bidang yang benar dan bidang diatur dengan cara yang
bermanfaat.
D. Data Cleaning
Dirty data adalah data yang tidak konsisten, tidak akurat, atau tidak lengkap. Sedangkan data cleaning adalah
proses dari memperbarui data agar konsisten, akurat, dan lengkap.
- Data De-duplication : proses menganalisis data dan menghapus dua atau lebih catatan yang berisi informasi
identic.
- Data Filtering : proses dari menghapus catatan atau bidang informasi dari sumber data.
- Data Contradiction Errors : sebuah kesalahan yang ada ketika entitas yang sama dijelaskan dalam dua cara
yang saling bertentangan.
- DataThreshold Violations : kesalahan data yang terjadi ketika sebuah nilai data berada di luar tingkat yang
diijinkan.
- Violated Attribute Dependencies : kesalahan yang terjadi ketika atribut sekunder dalam deretan data tidak
cocok dengan atribut yang utama
- Data Entry Errors : semua jenis kesalahan yang berasal dari memasukkan data yang salah.
E. Data Validation
Proses dari menganalisis data untuk memstikan data memiliki sifat data berkualitas tinggi seperti akurasi,
kelengkapan, konsistensi, ketepatan waktu, dan validitas.
- Visual Inspection : memeriksa data menggunakan penglihatan manusia untuk melihat jika ada masalah.
- Basic Statistical Tests : untuk bidang numeric, hitung statistic deskriptif dasar untuk setiap bidang seperti
minimum, maksimum, rata-rata, median, dan jumlah. Sedangkan untuk bidang teks, perbandingan dapat
dilakukan dengan menghitung total jumlah catatan atau jumlah record yang berbeda dari sebelumnya dan data
sudah ditransformasi.
- Audit a Sample
- Advanced Testing Techniques
A. Data Analysis
Terdapat empat kategori analisis data diantaranya analisis descriptive, diagnostic, predictive, dan prescriptive.
- Descriptive Analytics
Analisis deskriptif adalah komputasi yang menjawab pertanyaan dasar “apa yang terjadi?” Terdapat beberapa
fungsi analisis deskriptif seperti untuk menghitung margin keuntungan dan rasio leverage untuk memeriksa
apakah risiko bisnis berubah secara signifikan selama satu periode dan untuk mengidentifikasi kemungkinan
penipuan. Akuntan perusahaan menghitung analisis deskriptif untuk memahami bagaimana bisnis sedang
berjalan. Contoh metriks analisis deskriptif yaitu cost-per-unit, inventory turnover ratios, customer acquisition
costs, dan variance of budgets-to-actual expenses and revenues. Analisis deskriptif menggunakan teknik
exploratory data analisis yang berusaha memeriksa data dengan mengeksplorasi data tanpa menguji model
formal atau hipotesis.
- Diagnostic Analytics
Analisis diagnostic mencoba menjawab pertanyaan “kenapa ini terjadi”. Dalam analisis diagnostic analisis
formal maupun informal (dibangun dari analisis deskriptif) dapat ditiadakan. Analisis diagnostic
menggunakan logika dan tes dasar untuk mencoba mengungkapkan hubungan dalam data yang menjelaskan
mengapa sesuatu terjadi. Analisis diagnostic menggunakan metode Confirmatory data analysis yang menguji
hipotesis dan memberikan bukti statistic dari kemungkinan bahwa bukti menyangkal atau mendukung
hipotesis. Umumnya, hipotesis harus dianggap sebagai dua pernyataan yaitu hipotesis nol dan hipotesis
alternative, meskipun terkadang keduanya tidak dinyatakan secara eksplisit. Dengan hipotesis nol dan
alternatif yang ditentukan, dua kesalahan mungkin terjadi. Kesalahan tipe I adalah penolakan yang salah dari
hipotesis nol yang benar. Kesalahan tipe II adalah kegagalan untuk menolak kesalahan hipotesis nol
- Predictive Analytics
Analitik prediktif digunakan untuk menjawab pertanyaan “apa mungkin terjadi di masa depan?” Analisis
prediktif yang berhasil dapat menjadi transformative dalam sebuah organisasi. Analitik prediktif menggunakan
data historis untuk menemukan pola yang mungkin terwujud dalam masa depan. Peningkatan dalam daya
komputasi dan data historis yang tersedia memungkinkan komputer untuk menemukan hubungan yang
manusia tidak bisa temukan. Namun, agar berhasil, analitik prediktif mengharuskan peristiwa masa depan
dapat diprediksi berdasarkan data masa lalu dan organisasi telah mengumpulkan data yang diperlukan untuk
prediksi. Hasil dari analitik prediktif dapat berbentuk categorical value atau numeric value. Categorical data
adalah item data yang mengambil jumlah terbatas nilai yang ditetapkan untuk mewakili kelompok yang
berbeda. Classification analysis adalah teknik yang mengidentifikasi berbagai kelompok dan kemudian
mencoba untuk mengklasifikasikan pengamatan baru menjadi salah satu kelompok-kelompok itu.
- Prescriptive Analytics
Analitik preskriptif menjawab pertanyaan “apa yang harus dilakukan?” Analitik preskriptif dapat berupa
rekomendasi untuk diambil atau tindakan terprogram yang dapat dilakukan sistem berdasarkan hasil analisis
prediktif. Analisis preskriptif menggunakan teknik seperti kecerdasan buatan, pembelajaran mesin, dan
statistic lain untuk menghasilkan prediksi.
2. Emphasis
Menekankan bahwa yang paling penting adalah pesan mudah diidentifikasi dalam desain. Kualitas yang
dibutuhkan yaitu data yang paling relevan, penting, dan tepat waktu bagi pengambil keputusan. Setelah
tujuan diputuskan, tiga teknik berbeda dapat digunakan yaitu penyorotan, pembobotan, dan pengurutan.