Data Analysis Series from Data Science & Data Analysis Path MySkill.id
dan pemodelan data sehingga dapat mengetahui pola serta informasi yang terdapat di
dalam data.
mengidentifikasi pola atau tren dalam data, menemukan hubungan antara variabel, dan
membuat prediksi atau kesimpulan yang dapat digunakan sebagai pendukung dalam
pengambilan keputusan.
perekonomian mereka di tengah pandemi? hal ini dapat dijawab oleh data yang
sebelumnya.
kejadian tertentu. Dengan tujuan utama untuk menentukan penyebab akar dari suatu
masalah dan menemukan solusi yang efektif untuk mengatasinya.
Analisis diagnostik dapat dilakukan dengan berbagai metode dan teknik, termasuk
penyebab suatu penyakit dan menentukan metode pengobatan yang paling efektif.
3. Analisa Prediktif : merupakan jenis analisis data yang digunakan untuk membuat
prediksi tentang kejadian atau hasil masa depan berdasarkan data historis atau saat ini.
Tujuan utama dari analisis prediktif adalah untuk membantu dalam membuat keputusan
yang lebih baik berdasarkan prediksi yang mungkin terjadi. Model ini dapat digunakan
untuk memprediksi peluang sukses dalam bisnis, risiko kredit, tingkat penjualan produk,
dan sebagainya.
rekomendasi atau saran tindakan yang harus diambil untuk mencapai tujuan tertentu.
Tujuan utama dari analisis preskriptif adalah untuk mengambil keputusan yang lebih
baik berdasarkan pemahaman tentang dampak dari tindakan yang mungkin diambil.
Data memiliki manfaat yang sangat besar dalam dunia bisnis saat ini, beberapa
dapat membuat keputusan yang lebih baik dan lebih tepat waktu.
sehingga dapat mengidentifikasi area di mana mereka dapat mengurangi biaya dan
meningkatkan produktivitas.
Namun, dengan semakin banyak manfaat yang dapat diberikan data juga menjadi
1. Volume: Volume mengacu pada jumlah besar data yang dihasilkan dan
dikumpulkan setiap harinya. Tantangan dalam mengelola volume data adalah
menyimpan dan memproses data yang sangat besar secara efektif dan efisien.
2. Variety: Variety mengacu pada keragaman jenis data yang dikumpulkan, termasuk
data struktural dan tidak terstruktur, seperti gambar, video, suara, dan data teks.
3. Veracity: Veracity mengacu pada keakuratan dan keandalan data. Dalam beberapa
kasus, data dapat tidak akurat, tidak lengkap, atau bahkan salah. Tantangan dalam
mengelola veracity data adalah memastikan keakuratan data dan mengidentifikasi
4. Velocity: Velocity mengacu pada kecepatan data yang dihasilkan dan dikumpulkan
setiap harinya. Tantangan dalam mengelola kecepatan data adalah memproses data
secara cepat dan efektif sehingga dapat digunakan untuk pengambilan keputusan
proses umum yang digunakan dalam analisis data. Metode ini melibatkan enam tahap
DM adalah memahami permasalahan bisnis yang ingin diselesaikan. Pada tahap ini
pertanyaan yang harus dijawab adalah mengenai apa saja yang dibutuhkan oleh
bisnis atau masalah apa yang sedang dicoba diselesaikan oleh bisnis
2. Data understanding: Tahap kedua adalah memahami data yang tersedia. Pada
tahap ini pertanyaan yang harus dijawab adalah mengenai apa saja data yang
3. Data preparation: Tahap ketiga adalah mempersiapkan data untuk analisis. Pada
tahap ini pertanyaan yang harus dijawab adalah bagaimana data tersebut disiapkan.
Hal ini dapat dilakukan dengan menghapus data yang tidak relevan atau buruk, dan
4. Modeling: Tahap keempat adalah mengembangkan model analisis. Pada tahap ini
pertanyaan yang harus dijawab adalah mengenai model apa saja yang bisa
diterapkan dan model analisis apa yang tepat untuk menjawab tujuan bisnis.
model ke dalam lingkungan bisnis. Pada tahap ini perlu dipastikan hasil analisis
dapat diintegrasikan dengan sistem bisnis yang ada dan model analisis dapat
mining, machine learning, dan big data analytics. Dalam setiap tahap, tim proyek harus
memastikan hasil yang akurat, relevan, dan dapat diandalkan untuk mengambil
Seorang data analyst perlu menguasai berbagai tools atau perangkat lunak yang dapat
membantunya dalam mengelola dan menganalisis data dengan efektif. Berikut ini adalah
beberapa tools yang perlu dikuasai oleh seorang data analyst:
1. SQL: SQL (Structured Query Language) adalah bahasa yang digunakan untuk
mengelola dan mengambil data dari database relasional. Seorang data analyst harus
menguasai dasar-dasar SQL agar dapat mengekstraksi data yang diperlukan untuk
analisis. SQL memiliki banyak akses alternatif yang dapat disesuakan dengan
Server
prediktif.
3. Data Visualization Tools: Data visualization tools seperti Tableau, Power BI,
dan QlikView membantu data analyst untuk menghasilkan grafik dan visualisasi
data yang dapat dipahami oleh orang awam. Seorang data analyst harus menguasai
penggunaan tools ini untuk membuat presentasi dan laporan yang jelas dan
informatif.
Skills and Tools in Data
Analysis
Data Analysis Series from Data Science & Data Analysis Path
MySkill.id
Contoh:
Contoh :
Fishbone Diagram
Fishbone diagram. Sumber : templatelab.com
Flowchart
Diagram Flowchart . Sumber : rechargecolorado.org
1. Data null: Data null atau kosong biasanya terjadi karena data
yang tidak diisi atau karena terjadi kesalahan saat
pengumpulan data. Data null bisa mengganggu analisis data
karena bisa mempengaruhi hasil akhir analisis.
- Mengisi data null: Jika data null harus diisi, maka kita bisa
menggunakan teknik imputasi untuk mengisi data null. Teknik
imputasi dapat dilakukan dengan menggunakan nilai rata-rata,
median, modus, atau dengan menggunakan algoritma Machine
Learning.
2. Outlier: Outlier adalah data yang berbeda dengan data yang lain
dalam set data. Outlier bisa muncul karena kesalahan pengukuran atau
karena adanya data yang tidak biasa. Outlier bisa mempengaruhi hasil
analisis data dan menghasilkan kesimpulan yang salah.