NIM : 239008
KELAS : 3SDSN-A
MATA KULIAH : Data Sains
TUGAS :5
SOAL
1. Jelaskan kembali apa yang dimaksud dengan Siklus Hidup Data Analisis!
Jawaban:
Siklus Hidup Data Analisis merupakan serangkaian Langkah/tahapan yang ditempuh
dalam melakukan analisis data, mulai dari perencanaan hingga penyajian hasil. Berikut ini
meruakan penjelasan singkat mengenai setiap tahap dalam siklus hidup data analisis:
1) Perencanaan (Planning)
Tahap awal dalam siklus ini melibatkan penentuan tujuan analisis,
identifikasi sumber data, dan perumusan pertanyaan penelitian. Pada tahap ini juga
disusun rencana analisis dan dikumpulkan sumber daya yang diperlukan.
4) Analisis (Analysis)
Pada tahap ini, metode analisis yang sesuai diterapkan untuk menjawab
pertanyaan penelitian atau mencari pola dan hubungan dalam data. Analisis
statistik, analisis regresi, dan metode analisis lainnya dapat digunakan tergantung
pada sifat data dan tujuan analisis.
5) Interpretasi (Interpretation)
Hasil analisis dievaluasi dan diinterpretasikan. Temuan signifikan
diidentifikasi, dan kesimpulan ditarik berdasarkan analisis data. Interpretasi ini
membantu menjawab pertanyaan penelitian atau mencapai tujuan analisis.
6) Dokumentasi (Documentation)
Seluruh proses analisis, termasuk metode, alat, dan parameter yang
digunakan, didokumentasikan. Dokumentasi ini penting untuk memastikan
transparansi, reproducibility, dan memungkinkan orang lain memahami dan
memeriksa analisis.
7) Komunikasi (Communication)
Hasil analisis disampaikan kepada pemangku kepentingan atau pihak yang
berkepentingan. Komunikasi dapat dilakukan melalui laporan tertulis, presentasi,
atau visualisasi data, tergantung pada audiens yang dituju.
2. Apa perbedaan siklus hidup analisis data dan siklus hidup basis data?
Jawaban:
Antara Siklus Hidup Analisis Data dan Siklus Hidup Basis Data merupakan dua konsep
yang berbeda, akan tetapi keduanya memiliki peran penting dalam mengelola informasi.
Berikut adalah perbedaan antara Siklus Hidup Analisis Data dan Siklus Hidup Basis Data:
• Siklus Hidup Analisis Data:
1. Definisi Tujuan Analisis: Tahap awal dari siklus hidup analisis data adalah
menetapkan tujuan analisis. Ini melibatkan pemahaman masalah yang ingin
dipecahkan atau pertanyaan yang ingin dijawab melalui analisis data.
2. Pengumpulan Data: Data yang relevan dikumpulkan dari berbagai sumber. Data
ini bisa bersumber dari internal perusahaan (misalnya, basis data internal) atau
eksternal (misalnya, data pasar, data pemerintah).
3. Pembersihan dan Pemrosesan Data: Data yang dikumpulkan kemudian
dibersihkan dan diproses untuk menghilangkan ketidakakuratan, kekurangan, atau
outliers yang mungkin mempengaruhi hasil analisis.
4. Analisis Data: Proses ini melibatkan penerapan berbagai metode analisis statistik
atau teknik ilmu data untuk mendapatkan wawasan dan pola dari data. Ini mungkin
melibatkan penggunaan algoritma pembelajaran mesin atau teknik analisis
prediktif.
5. Interpretasi dan Pelaporan: Hasil analisis diinterpretasikan dan dilaporkan
kepada pemangku kepentingan yang bersangkutan. Ini bisa berupa laporan tertulis,
presentasi, atau visualisasi data.
3. Tuliskan kembali fase siklus hidup analisis data minimal 1 halaman khusus fase siklus
hidup analisis data.
Jawaban:
6 Fase Siklus Hidup Analisis Data
Analisis data terutama melibatkan enam fase penting yang dilakukan dalam satu siklus.
1. Data Discovery (Penemuan data)
Data discovery adalah suatu proses untuk menemukan, mengidentifikasi, dan memahami
pola atau informasi yang tersembunyi dalam kumpulan data. Tujuan utama dari data discovery
adalah untuk menggali wawasan yang bernilai dari data yang ada, baik itu untuk mendukung
pengambilan keputusan, menemukan tren, atau mengidentifikasi peluang bisnis.
Contohnya seperti ini, pemilik bisnis, analis, CIO, serta setiap staf yang bekerja di
perusahaan membutuhkan cara untuk membaca, memahami, dan mengumpulkan nilai dari
semua informasi yang masuk dalam bentuk data.
2. Pembersihan Data:
• Mengidentifikasi dan menangani nilai yang hilang atau kosong.
• Mendeteksi dan menangani outlier atau nilai ekstrem yang mungkin mempengaruhi
analisis.
• Menangani duplikat dan menghilangkan data yang tidak relevan atau tidak valid.
3. Transformasi Data:
• Menormalisasi atau standarisasi nilai-nilai data untuk memastikan konsistensi.
• Mengonversi format data ke format yang sesuai untuk analisis atau model yang akan
dibuat.
• Menerapkan teknik encoding untuk data kategorikal menjadi bentuk yang dapat diolah
oleh algoritma.
5. Pemisahan Data:
• Memisahkan data menjadi set pelatihan, validasi, dan pengujian.
• Memastikan bahwa proporsi kelas atau kategori dijaga agar tidak ada
ketidakseimbangan yang signifikan.
7. Pemodelan Data:
• Mempertimbangkan pembuatan model statistik atau grafik untuk memahami distribusi
dan hubungan antar variabel.
8. Validasi Data:
• Melakukan pengujian konsistensi data.
• Memastikan bahwa data tidak mengandung kesalahan yang dapat merusak analisis atau
model.
Terdapat beberapa jenis permodelan data, dua jenis yang umum adalah:
1. Permodelan Konseptual:
• Fokus pada pemahaman bisnis dan kebutuhan pengguna.
• Menghasilkan diagram konsep yang mencerminkan entitas-entitas bisnis dan hubungan
antar entitas tersebut.
• Penggunaan diagram Entity-Relationship (ER) umum dalam permodelan konseptual.
2. Permodelan Fisik:
• Berfokus pada implementasi teknis dan struktur penyimpanan data di tingkat database.
• Merinci bagaimana tabel, kolom, indeks, dan kunci akan diatur dalam basis data.
• Penggunaan diagram seperti diagram tabel dan skema basis data.
2. Permodelan Konseptual:
• Membangun model konseptual yang mencerminkan entitas dan hubungan dalam bisnis.
3. Permodelan Logis:
• Mentransformasikan model konseptual ke dalam model logis yang lebih terkait dengan
struktur data yang dapat diimplementasikan.
4. Permodelan Fisik:
• Menyusun rincian teknis untuk implementasi basis data, termasuk skema tabel, indeks,
dan kunci.
4. Pembagian Data:
• Pisahkan data menjadi set pelatihan (training set), set validasi (validation set), dan set
pengujian (test set) untuk menguji kinerja model.
5. Pemilihan Model:
• Pilih model atau algoritma yang sesuai dengan karakteristik data dan tujuan analisis.
• Contoh model termasuk regresi linear, decision tree, neural network, dan lainnya.
6. Pelatihan Model:
• Gunakan set pelatihan untuk melatih model dengan menyesuaikan parameter dan bobot
agar sesuai dengan data.
• Evaluasi kinerja model menggunakan set validasi untuk mencegah overfitting.
8. Evaluasi Model:
• Gunakan set pengujian untuk mengukur kinerja model secara obyektif.
• Metrik evaluasi umum meliputi akurasi, presisi, recall, F1 score, dan area di bawah
kurva ROC (AUC-ROC).
5. Oprasionalization (operasionalisasi)
Operasionalisasi (Operationalization) adalah proses mengubah konsep atau variabel
abstrak menjadi sesuatu yang dapat diukur atau diobservasi secara konkret. Dalam konteks
penelitian atau pengembangan konsep, operasionalisasi mengacu pada langkah-langkah
konkret yang diambil untuk mendefinisikan dan mengukur variabel yang diinginkan sehingga
dapat diaplikasikan dalam penelitian atau pengumpulan data.