Anda di halaman 1dari 9

NAMA : Vebrianty Grenesia Panggabean

NIM : 239008
KELAS : 3SDSN-A
MATA KULIAH : Data Sains
TUGAS :5

SOAL
1. Jelaskan kembali apa yang dimaksud dengan Siklus Hidup Data Analisis!
Jawaban:
Siklus Hidup Data Analisis merupakan serangkaian Langkah/tahapan yang ditempuh
dalam melakukan analisis data, mulai dari perencanaan hingga penyajian hasil. Berikut ini
meruakan penjelasan singkat mengenai setiap tahap dalam siklus hidup data analisis:
1) Perencanaan (Planning)
Tahap awal dalam siklus ini melibatkan penentuan tujuan analisis,
identifikasi sumber data, dan perumusan pertanyaan penelitian. Pada tahap ini juga
disusun rencana analisis dan dikumpulkan sumber daya yang diperlukan.

2) Pengumpulan Data (Data Collection)


Data yang diperlukan untuk analisis dikumpulkan dari berbagai sumber.
Pengumpulan data dapat melibatkan survei, observasi, eksperimen, atau
memanfaatkan data yang sudah ada.

3) Pemrosesan Data (Data Processing)


Data yang telah dikumpulkan kemudian diolah untuk membersihkan,
mengorganisasi, dan mengubahnya menjadi format yang sesuai untuk analisis.
Langkah ini mencakup manipulasi data, penanganan nilai yang hilang, dan
normalisasi data.

4) Analisis (Analysis)
Pada tahap ini, metode analisis yang sesuai diterapkan untuk menjawab
pertanyaan penelitian atau mencari pola dan hubungan dalam data. Analisis
statistik, analisis regresi, dan metode analisis lainnya dapat digunakan tergantung
pada sifat data dan tujuan analisis.
5) Interpretasi (Interpretation)
Hasil analisis dievaluasi dan diinterpretasikan. Temuan signifikan
diidentifikasi, dan kesimpulan ditarik berdasarkan analisis data. Interpretasi ini
membantu menjawab pertanyaan penelitian atau mencapai tujuan analisis.

6) Dokumentasi (Documentation)
Seluruh proses analisis, termasuk metode, alat, dan parameter yang
digunakan, didokumentasikan. Dokumentasi ini penting untuk memastikan
transparansi, reproducibility, dan memungkinkan orang lain memahami dan
memeriksa analisis.

7) Komunikasi (Communication)
Hasil analisis disampaikan kepada pemangku kepentingan atau pihak yang
berkepentingan. Komunikasi dapat dilakukan melalui laporan tertulis, presentasi,
atau visualisasi data, tergantung pada audiens yang dituju.

8) Pengambilan Keputusan (Decision Making)


Pada tahap terakhir, keputusan diambil berdasarkan hasil analisis.
Keputusan ini dapat berupa rekomendasi tindakan, perubahan kebijakan, atau
langkah-langkah strategis lainnya.

2. Apa perbedaan siklus hidup analisis data dan siklus hidup basis data?
Jawaban:
Antara Siklus Hidup Analisis Data dan Siklus Hidup Basis Data merupakan dua konsep
yang berbeda, akan tetapi keduanya memiliki peran penting dalam mengelola informasi.
Berikut adalah perbedaan antara Siklus Hidup Analisis Data dan Siklus Hidup Basis Data:
• Siklus Hidup Analisis Data:
1. Definisi Tujuan Analisis: Tahap awal dari siklus hidup analisis data adalah
menetapkan tujuan analisis. Ini melibatkan pemahaman masalah yang ingin
dipecahkan atau pertanyaan yang ingin dijawab melalui analisis data.
2. Pengumpulan Data: Data yang relevan dikumpulkan dari berbagai sumber. Data
ini bisa bersumber dari internal perusahaan (misalnya, basis data internal) atau
eksternal (misalnya, data pasar, data pemerintah).
3. Pembersihan dan Pemrosesan Data: Data yang dikumpulkan kemudian
dibersihkan dan diproses untuk menghilangkan ketidakakuratan, kekurangan, atau
outliers yang mungkin mempengaruhi hasil analisis.
4. Analisis Data: Proses ini melibatkan penerapan berbagai metode analisis statistik
atau teknik ilmu data untuk mendapatkan wawasan dan pola dari data. Ini mungkin
melibatkan penggunaan algoritma pembelajaran mesin atau teknik analisis
prediktif.
5. Interpretasi dan Pelaporan: Hasil analisis diinterpretasikan dan dilaporkan
kepada pemangku kepentingan yang bersangkutan. Ini bisa berupa laporan tertulis,
presentasi, atau visualisasi data.

• Siklus Hidup Basis Data:


1. Perancangan Basis Data: Tahap awal siklus hidup basis data melibatkan
perancangan struktur basis data. Ini mencakup pemodelan entitas, hubungan, dan
atribut, serta pemilihan teknologi basis data yang sesuai.
2. Pembangunan Basis Data: Setelah perancangan selesai, basis data dibangun
sesuai dengan spesifikasi yang telah ditetapkan. Ini melibatkan implementasi tabel,
indeks, dan konstrain yang diperlukan.
3. Pemeliharaan dan Pemantauan: Basis data memerlukan pemeliharaan rutin,
pemantauan kinerja, dan penanganan masalah yang mungkin muncul. Ini
mencakup backup dan pemulihan data, pemantauan kesehatan basis data, dan
peningkatan kinerja.
4. Pembaruan dan Pengembangan: Seiring berjalannya waktu, basis data mungkin
perlu diperbarui atau diperluas untuk mengakomodasi perubahan dalam kebutuhan
bisnis atau teknologi. Ini melibatkan penambahan kolom, tabel, atau perubahan
struktur lainnya.
5. Penarikan Basis Data: Pada akhir siklus hidup, ketika basis data tidak lagi
diperlukan, dapat dilakukan proses penarikan atau penghapusan basis data.

3. Tuliskan kembali fase siklus hidup analisis data minimal 1 halaman khusus fase siklus
hidup analisis data.
Jawaban:
6 Fase Siklus Hidup Analisis Data
Analisis data terutama melibatkan enam fase penting yang dilakukan dalam satu siklus.
1. Data Discovery (Penemuan data)
Data discovery adalah suatu proses untuk menemukan, mengidentifikasi, dan memahami
pola atau informasi yang tersembunyi dalam kumpulan data. Tujuan utama dari data discovery
adalah untuk menggali wawasan yang bernilai dari data yang ada, baik itu untuk mendukung
pengambilan keputusan, menemukan tren, atau mengidentifikasi peluang bisnis.
Contohnya seperti ini, pemilik bisnis, analis, CIO, serta setiap staf yang bekerja di
perusahaan membutuhkan cara untuk membaca, memahami, dan mengumpulkan nilai dari
semua informasi yang masuk dalam bentuk data.

Manfaat data discovery terhadap bisnis:


1. Pemahaman yang lebih baik tentang wawasan yang terdapat di dalam data perusahaan.

2. Memungkinkan adanya klasifikasi data otomatis berdasarkan konteks.


3. Menjadi dasar rencana untuk manajemen risiko dan kepatuhan peraturan.
4. Tampilan serta visibilitas data yang lengkap.
5. Perusahaan dapat mengidentifikasi dan melacak jenis data yang sensitif.
6. Perusahaan memiliki kemampuan untuk menerapkan kontrol perlindungan pada data
berdasarkan kebijakan yang telah ditentukan.

2. Data Preparation (Persiapan data)


Data preparation, atau persiapan data, adalah serangkaian langkah yang dilakukan untuk
membersihkan, mengorganisir, dan mengelola data agar dapat diolah dengan efektif oleh
model atau sistem analisis data. Proses ini merupakan bagian kritis dalam siklus analisis data
dan machine learning, karena kualitas data yang baik sangat penting untuk mendapatkan hasil
yang akurat dan dapat diandalkan. Berikut adalah beberapa langkah umum dalam persiapan
data:
1. Pengumpulan Data:
• Mengumpulkan data dari berbagai sumber, seperti basis data, file teks, atau API.
• Memastikan data yang dikumpulkan relevan dengan tujuan analisis atau model yang
akan dibuat.

2. Pembersihan Data:
• Mengidentifikasi dan menangani nilai yang hilang atau kosong.
• Mendeteksi dan menangani outlier atau nilai ekstrem yang mungkin mempengaruhi
analisis.
• Menangani duplikat dan menghilangkan data yang tidak relevan atau tidak valid.
3. Transformasi Data:
• Menormalisasi atau standarisasi nilai-nilai data untuk memastikan konsistensi.
• Mengonversi format data ke format yang sesuai untuk analisis atau model yang akan
dibuat.
• Menerapkan teknik encoding untuk data kategorikal menjadi bentuk yang dapat diolah
oleh algoritma.

4. Ekstraksi Fitur (Feature Engineering):


• Membuat atau mengubah fitur-fitur baru yang dapat meningkatkan kinerja model.
• Mengidentifikasi fitur-fitur yang paling relevan atau signifikan untuk tujuan analisis
atau prediksi.

5. Pemisahan Data:
• Memisahkan data menjadi set pelatihan, validasi, dan pengujian.
• Memastikan bahwa proporsi kelas atau kategori dijaga agar tidak ada
ketidakseimbangan yang signifikan.

6. Manajemen Skala dan Dimensi:


• Menangani skala yang berbeda di antara fitur-fitur numerik.
• Mengurangi dimensi data jika diperlukan untuk menghindari "curse of dimensionality".

7. Pemodelan Data:
• Mempertimbangkan pembuatan model statistik atau grafik untuk memahami distribusi
dan hubungan antar variabel.

8. Validasi Data:
• Melakukan pengujian konsistensi data.
• Memastikan bahwa data tidak mengandung kesalahan yang dapat merusak analisis atau
model.

3. Model Planing (Perencanaan model data)


Model Planing (Perencanaan model data) adalah proses merancang struktur data untuk
suatu sistem informasi agar dapat memahami, mengelola, dan mengorganisasi data dengan
efisien. Tujuan utama permodelan data adalah memberikan pemahaman yang jelas tentang
bagaimana data diorganisir dan berinteraksi dalam suatu sistem. Ini menjadi dasar untuk
pengembangan sistem database yang efektif.

Terdapat beberapa jenis permodelan data, dua jenis yang umum adalah:
1. Permodelan Konseptual:
• Fokus pada pemahaman bisnis dan kebutuhan pengguna.
• Menghasilkan diagram konsep yang mencerminkan entitas-entitas bisnis dan hubungan
antar entitas tersebut.
• Penggunaan diagram Entity-Relationship (ER) umum dalam permodelan konseptual.

2. Permodelan Fisik:
• Berfokus pada implementasi teknis dan struktur penyimpanan data di tingkat database.
• Merinci bagaimana tabel, kolom, indeks, dan kunci akan diatur dalam basis data.
• Penggunaan diagram seperti diagram tabel dan skema basis data.

Langkah-langkah Umum dalam Proses Permodelan Data:


1. Pengumpulan Persyaratan:
• Memahami kebutuhan bisnis dan keinginan pengguna terkait data.

2. Permodelan Konseptual:
• Membangun model konseptual yang mencerminkan entitas dan hubungan dalam bisnis.

3. Permodelan Logis:
• Mentransformasikan model konseptual ke dalam model logis yang lebih terkait dengan
struktur data yang dapat diimplementasikan.

4. Permodelan Fisik:
• Menyusun rincian teknis untuk implementasi basis data, termasuk skema tabel, indeks,
dan kunci.

5. Implementasi Basis Data:


• Menerapkan struktur data ke dalam sistem database yang sesuai.

3. Model Building (Pembuatan model data)


Model building, dalam konteks data atau data science, merujuk pada proses mengembangkan
model statistik atau algoritma untuk memahami atau memprediksi pola dalam data. Langkah-
langkah dalam pembuatan model dapat bervariasi tergantung pada tujuan analisis dan jenis
data yang digunakan. Berikut adalah langkah-langkah umum dalam pembuatan model data:
1. Pemahaman Bisnis dan Tujuan Analisis:
• Identifikasi tujuan analisis dan pemahaman yang dalam terhadap bisnis atau
permasalahan yang ingin dipecahkan.
• Jelaskan bagaimana model akan memberikan nilai tambah atau solusi untuk
permasalahan yang dihadapi.

2. Pemilihan Variabel dan Pengumpulan Data:


• Identifikasi variabel atau fitur yang relevan untuk tujuan analisis.
• Kumpulkan data yang diperlukan, pastikan keberlanjutan dan keakuratan data.

3. Pembersihan dan Eksplorasi Data:


• Identifikasi dan tangani nilai-nilai yang hilang atau anomali dalam data.
• Lakukan eksplorasi data untuk memahami pola, korelasi, dan karakteristik penting
lainnya.

4. Pembagian Data:
• Pisahkan data menjadi set pelatihan (training set), set validasi (validation set), dan set
pengujian (test set) untuk menguji kinerja model.

5. Pemilihan Model:
• Pilih model atau algoritma yang sesuai dengan karakteristik data dan tujuan analisis.
• Contoh model termasuk regresi linear, decision tree, neural network, dan lainnya.

6. Pelatihan Model:
• Gunakan set pelatihan untuk melatih model dengan menyesuaikan parameter dan bobot
agar sesuai dengan data.
• Evaluasi kinerja model menggunakan set validasi untuk mencegah overfitting.

7. Validasi dan Penyetelan Model:


• Gunakan set validasi untuk mengevaluasi kinerja model dan melakukan penyetelan
parameter agar model optimal.
• Lakukan validasi silang (cross-validation) jika perlu.

8. Evaluasi Model:
• Gunakan set pengujian untuk mengukur kinerja model secara obyektif.
• Metrik evaluasi umum meliputi akurasi, presisi, recall, F1 score, dan area di bawah
kurva ROC (AUC-ROC).

9. Implementasi dan Penyaringan:


• Terapkan model pada data baru atau situasi bisnis yang sesuai.
• Tentukan strategi implementasi dan tindak lanjut, termasuk langkah-langkah untuk
memonitor dan memperbarui model jika diperlukan.

10. Dokumentasi dan Komunikasi:


• Dokumentasikan langkah-langkah, metode, dan hasil model secara rinci.
• Komunikasikan temuan dan rekomendasi kepada pemangku kepentingan atau tim
terkait.
4. Communicate Results (Komunikasi Hasil)
Komunikasi hasil (Communicate Results) merujuk pada proses menyampaikan dan
mengomunikasikan hasil suatu pekerjaan atau penelitian kepada pihak yang berkepentingan.
Ini adalah langkah penting dalam siklus penelitian atau proyek, karena tujuannya adalah untuk
membuat informasi yang ditemukan lebih dapat diakses, dipahami, dan digunakan oleh orang
lain.

5. Oprasionalization (operasionalisasi)
Operasionalisasi (Operationalization) adalah proses mengubah konsep atau variabel
abstrak menjadi sesuatu yang dapat diukur atau diobservasi secara konkret. Dalam konteks
penelitian atau pengembangan konsep, operasionalisasi mengacu pada langkah-langkah
konkret yang diambil untuk mendefinisikan dan mengukur variabel yang diinginkan sehingga
dapat diaplikasikan dalam penelitian atau pengumpulan data.

Beberapa poin penting terkait dengan operasionalisasi melibatkan:


1. Pendefinisian Variabel:
• Menyusun definisi operasional yang jelas dan spesifik untuk variabel yang ingin
diukur. Misalnya, jika variabelnya adalah "tingkat kebahagiaan," bagaimana kita
mendefinisikan dan mengukurnya dengan cara yang dapat diobservasi atau diukur?

2. Pemilihan Indikator atau Pengukuran:


• Memilih indikator atau metode pengukuran yang sesuai untuk mencapai tujuan
operasionalisasi. Indikator ini harus memiliki hubungan yang kuat dengan konsep
abstrak yang ingin diukur.

3. Pengukuran Kuantitatif atau Kualitatif:


• Menentukan apakah variabel akan diukur secara kuantitatif (dengan angka atau skala
numerik) atau kualitatif (dengan deskripsi atau kategori).

4. Pemilihan Instrumen Pengukuran:


• Jika variabel diukur secara kuantitatif, memilih instrumen atau alat pengukuran yang
sesuai. Contohnya termasuk kuesioner, tes, atau alat pengukur lainnya.

5. Operasionalisasi dalam Penelitian Sosial:


• Dalam penelitian sosial, operasionalisasi seringkali melibatkan mengubah konsep
sosial atau psikologis, seperti "kepercayaan" atau "dukungan sosial," menjadi indikator
yang dapat diukur, seperti jumlah orang yang dihubungi dalam seminggu atau skala
pertanyaan yang menilai tingkat kepercayaan.
6. Uji Keandalan dan Validitas:
• Memastikan bahwa instrumen atau metode pengukuran yang digunakan dapat
diandalkan (konsisten) dan valid (mengukur apa yang seharusnya diukur).

Anda mungkin juga menyukai