Big Data Siklus Hidup Big Data Analytic 9 Tahap Big Data Analytics LifeCycle
1. Evaluasi Kasus Bisnis.
2. Identifikasi Data. 3. Akuisisi & Pemfilteran Data. 4. Ekstraksi Data. 5. Validasi & Pembersihan Data. 6. Agregasi & Representasi Data. 7. Analisis data. 8. Visualisasi data. 9. Pemanfaatan hasil analisis. 1. Evaluasi Kasus Bisnis. • Kasus bisnis yang terdefinisi dengan baik yang menyajikan pemahaman yang jelas tentang pembenaran, motivasi, dan tujuan pelaksanaan analisis • menentukan apakah masalah bisnis yang ditangani benar-benar merupakan masalah Big Data. • Agar memenuhi syarat sebagai masalah Big Data, masalah bisnis harus berhubungan langsung ke satu atau lebih karakteristik Big Data berupa volume, kecepatan, atau variasi. 2. Identifikasi Data • Untuk mengidentifikasi kumpulan data diperlukan untuk proyek analisis dan sumbernya. • Mengidentifikasi sumber data yang lebih beragam dapat meningkatkan kemungkinan menemukan pola dan korelasi tersembunyi. • Sumbernya dapat berasal dari internal dan/atau eksternal perusahaan. 3. Akuisisi & Pemfilteran Data. • Data dikumpulkan dari semua sumber data yang diidentifikasi pada tahap sebelumnya. • Data yang diperoleh kemudian difilter secara otomatis untuk menghilangkan data yang rusak atau data yang dianggap tidak memiliki nilai bagi tujuan analisis. 4. Ekstraksi Data. Beberapa data yang diidentifikasi sebagai masukan untuk analisis mungkin datang dalam format yang tidak kompatibel dengan solusi Big Data. Kebutuhan untuk mengatasi jenis data yang berbeda lebih mungkin terjadi pada data yang berasal dari sumber eksternal. Tahap siklus hidup Ekstraksi Data, didedikasikan untuk mengekstraksi data yang berbeda dan mengubahnya menjadi format yang dapat digunakan oleh solusi Big Data untuk tujuan analisis data. Tingkat ekstraksi dan transformasi yang diperlukan bergantung pada jenis analitik dan kemampuan solusi Big Data. 5. Validasi & Pembersihan Data • Data yang tidak valid dapat menyimpang dan memalsukan hasil analisis. • Tahap Validasi dan Pembersihan Data, didedikasikan untuk pembentukan seringkali aturan validasi yang rumit dan menghapus data tidak valid yang diketahui. • Solusi Big Data sering kali menerima data redundan di kumpulan data yang berbeda. Redundansi ini dapat dimanfaatkan untuk mengeksplorasi kumpulan data yang saling berhubungan guna menyusun parameter validasi dan mengisi data valid yang hilang. 6. Agregasi & Representasi Data. • Data mungkin tersebar di beberapa kumpulan data, sehingga mengharuskan kumpulan data digabungkan menjadi data yang lebih umum. • Tahap Agregasi dan Representasi Data, didedikasikan untuk mengintegrasikan beberapa kumpulan data untuk menghasilkan tampilan terpadu. 7. Analisis data. • Tahap Analisis Data didedikasikan untuk melaksanakan tugas analisis sebenarnya, yang biasanya melibatkan satu atau lebih jenis analisis. • Tahap ini dapat bersifat berulang, terutama jika analisis data bersifat eksploratif, yang mana analisis diulangi hingga ditemukan pola atau korelasi yang sesuai. 8. Visualisasi data. • Kemampuan untuk menganalisis data dalam jumlah besar dan menemukan wawasan yang berguna tidak banyak gunanya jika satu-satunya yang dapat menginterpretasikan hasilnya adalah para analis. • Tahap Visualisasi Data, didedikasikan untuk menggunakan teknik dan alat visualisasi data untuk mengkomunikasikan hasil analisis secara grafis untuk interpretasi yang efektif oleh pengguna bisnis. • Pengguna bisnis harus mampu memahami hasil untuk memperoleh nilai dari analisis dan selanjutnya memiliki kemampuan untuk memberikan umpan balik, seperti yang ditunjukkan oleh garis putus-putus yang mengarah dari tahap 8 kembali ke tahap 7. • Hasil penyelesaian tahap Visualisasi Data memberikan pengguna kemampuan untuk melakukan analisis visual sehingga memungkinkan ditemukannya jawaban atas pertanyaan yang bahkan belum dirumuskan pengguna 9. Pemanfaatan hasil analisis • Setelah hasil analisis tersedia bagi pengguna bisnis untuk mendukung pengambilan keputusan bisnis, seperti melalui dasbor, mungkin ada peluang lebih lanjut untuk memanfaatkan hasil analisis. • Tahap Pemanfaatan Hasil Analisis bertujuan untuk menentukan bagaimana dan di mana data analisis yang diproses dapat dimanfaatkan lebih lanjut. • Tergantung pada sifat masalah analisis yang ditangani, hasil analisis dapat menghasilkan “model” yang merangkum wawasan dan pemahaman baru tentang sifat pola dan hubungan yang ada dalam data yang ada. • Sebuah model mungkin terlihat seperti persamaan matematika atau seperangkat aturan. Model bisa saja digunakan untuk meningkatkan logika proses bisnis dan logika sistem aplikasi, dan keduanya dapat terbentuk dasar dari sistem atau program perangkat lunak baru.