Anda di halaman 1dari 5

Nama : Nadia Septiani

NPM : 2210631030194
Kelas : Akuntansi 3A

1. Jelaskan apa yang disebut Analisis Data


Analisis data adalah proses pengolahan data dengan tujuan untuk menemukan informasi
yang berguna yang dapat dijadikan dasar dalam pengambilan keputusan untuk solusi suatu
permasalahan.

2. Jelaskan apa yang dimaksud dengan

 Data adalah kumpulan informasi atau keterangan yang diperoleh dari pengamatan
berdasarkan kejadian yang nyata adanya. Informasi ini bisa dalam bentuk lambang,
angka, dan lain-lain
 Value adalah nilai mengacu pada signifikansi atau kegunaan dari data. Nilai
diberikan ketika data dianalisis atau ditempatkan dalam konteks yang relevan. Nilai
ini bergantung pada bagaimana data digunakan dan apa yang dapat diambil dari data
tersebut
 Information adalah data yang telah diolah dalam bentuk yang bernilai dan dapat
bermanfaat bagi pihak-pihak yang membutuhkan informasi.
 Knowledge adalah tingkat yang lebih tinggi dari pemahaman yang didapatkan
melalui interpretasi informasi. Ini melibatkan pemahaman yang mendalam dan
kemampuan untuk menggunakan informasi secara efektif untuk membuat keputusan
atau menyelesaikan masalah

3. Jelaskan apa yang dimaksud dengan big data


Sekumpulan dataset yang memiliki volume, kecepatan, atau variasinya sangat besar
sehingga sulit untuk menyimpan, mengelola, memproses, dan menganalisis data menggunakan
basis data tradisional dan alat pengolah data.

4. Karakteristik big data


 Volume Big data adalah bentuk data yang volumenya sangat besar sehingga tidak
muat pada satu mesin oleh karena itu alat dan kerangka kerja khusus diperlukan
untuk menyimpan proses dan menganalisis data tersebut.
 Velocity (Kecepatan) data mengacu pada seberapa cepat di akses serta memproses
data.
 Variety (Variasi) mengacu pada bentuk data, variasi tipe dan variasi sifat dari data,
apakah data tersebut bersifat terstruktur / structured, semi terstruktur ataupun tidak
terstruktur
 Veracity (Kebenaran) mengacu pada seberapa akurat data tersebut seperti apakah
data tersebut dapat dipercaya kebenarannya, dapat diandalkan, berkualitas serta
dapat dapat diakses dengan baik.
 Value pada nilai pada data, nilai pada data ini juga bergantung pada isi data dan
bergantung pada skill tim data analyst yang menganalisa data, dengan data dan
pengolah yang tepat, big data ini dapat menghasilkan informasi yang sangat
berharga untuk mengambil suatu keputusan

5. Jelaskan langkah - Langkah di bawah ini dilakukan dalam analisis data.


 Data collection adalah mengumpulkan data yang relevan dengan tujuan analisis
Anda. Data ini bisa diperoleh dari berbagai sumber, seperti survei, basis data, sensor,
atau sumber lainnya. Penting untuk memastikan bahwa data yang dikumpulkan
berkualitas, relevan, dan sesuai dengan tujuan analisis
 Data preparation adalah membersihkan dan mempersiapkan data. Ini mencakup
proses seperti penghapusan data yang hilang atau tidak valid, penggabungan data
dari berbagai sumber, normalisasi data, dan penanganan outlier.
 Analysis types adalah tahap pemilihan jenis analisis yang akan dilakukan dan
digunakan. Jenis analisis yang dipilih akan tergantung pada kondisi.
 Analysis modes merupakan cara untuk menjalankan analisis. Ini dapat berupa
analisis univariat (menganalisis satu variabel), analisis multivariat (menganalisis
beberapa variabel), atau mungkin analisis temporal (menganalisis perubahan data
seiring waktu). Mode analisis dipilih berdasarkan sifat data dan tujuan analisis.
 Visualizations merupakan langkah penting dalam analisis data. Ini melibatkan
penggunaan grafik, grafik, dan visualisasi lainnya untuk mewakili data dengan cara
yang mudah dimengerti. Visualisasi membantu dalam menyoroti pola, tren, dan
hubungan dalam data yang mungkin sulit dilihat dalam bentuk tabel atau angka.
6. Jelaskan metodologi Data Science di bawah ini.
 KDD atau Knowledge Discovery dan Data Mining ialah proses dari menggunakan
metode data mining untuk mencari informasi-informasi yang berharga, pola yang
ada di dalam data, yang melibatkan algoritma untuk mengidentifikasi pola pada data.
 SEMMA atau Sample, Emplore, Modify, Model dan Assess adalah metode yang
dapat digunakan untuk memudahkan penggguna untuk memprediksi tentang
variable-variabel yang mengacu melakukan proses sebuah proyek data mining
 CRISP-DM atau Cross-Industry Standard Process for Data Mining adalah kerangka
kerja metodologi yang digunakan dalam analisis data dan pertambangan data untuk
mengatasi permasalahan dan memecahkan masalah menggunakan pendekatan
berstruktur.
 IBM Data Science adalah sejumlah alat, platform, dan layanan yang disediakan oleh
IBM untuk mendukung praktisi data science dalam tugas analisis data, pemodelan,
dan pengambilan keputusan
 Microsoft’s Team Data Science Process adalah adalah kerangka kerja yang
dikembangkan oleh Microsoft untuk membimbing tim data science dalam mengelola
proyek data science secara sistematis sehingga memberikan solusi analisis prediktif
dan aplikasi cerdas secara efisien.

7. Jelaskan apa yang disebut Visualisasi dalam analisis data


Visualisasi dalam analisis data merujuk pada representasi grafis data yang digunakan untuk
menggambarkan informasi dengan cara yang lebih mudah dimengerti dan mudah dipahami
sehingga dapat membantu kita untuk menafsirkan dan menginterpretasi suatu data serta
memahami informasi yang telah dihasilkan, serta penyajian data menjadi lebih informatif dan
komunikatif.

8. Tujuan Visualisasi dalam analisis data


Secara garis besar, ada empat tujuan visualisasi yang disampaikan oleh Andrew Abela, yaitu
Comparison (Perbandingan), Relationship (Keterhubungan/Relasi), Composition (Komposisi),
Distribution (Distribusi). Seperti yang terlihat pada gambar berikut ini:
- Comparison (Perbandingan) Visualisasi perbandingan ini digunakan untuk
membandingkan besarnya nilai satu sama lain dan dapat digunakan untuk dengan
mudah menemukan nilai terendah dan tertinggi dalam data.
- Relationship (Keterhubungan/Relasi) Visualisasi ini digunakan untuk melihat
hubungan antara data dan dapat digunakan untuk menemukan korelasi, outlier, dan
klaster dari data
- Composition (Komposisi) Visualisasi komposisi digunakan untuk melihat bagaimana
suatu bagian dibandingkan dengan keseluruhan dan bagaimana nilai total dapat dibagi
menjadi beberapa bagian.
- Distribution (Distribusi) Visualisasi distribusi ini digunakan untuk melihat bagaimana
nilai kuantitatif didistribusikan di sepanjang sumbu dari terendah ke tertinggi.

9. Jelaskan Library Visualisasi di bawah ini.


- Matplotlib suatu library atau package yang paling populer di bahasa python untuk
melakukan visualisasi data seperti membuat plot grafik untuk satu sumbu atau lebih.
Matplotlib memberikan kontrol tinggi atas tampilan grafik, sehingga Anda dapat
menyesuaikan hampir setiap aspek visualisasi.
- Seaborn adalah library Python yang membangun di atas Matplotlib dan dirancang
khusus untuk membuat visualisasi data yang menarik dan informatif dengan cara yang
lebih sederhana. Seaborn menawarkan gaya visualisasi yang lebih estetis secara default
dan antarmuka yang lebih tinggi untuk membuat visualisasi dengan sedikit kode.

10. Jelaskan Visualisasi Variabel di bawah ini.

 Pie Chart adalah adalah grafik statistik yang berbentuk melingkar dan dibagi menjadi
beberapa irisan (wedges) untuk mengilustrasikan proporsi numerik. Setiap irisan
mewakili bagian dari keseluruhan, dan ukuran irisan sesuai dengan proporsi
numeriknya.
 Bar Charts adalah grafik yang menggunakan batang vertikal atau horizontal untuk
menunjukkan besarnya atau jumlah suatu variabel dalam kategori atau kelompok
tertentu.
 Line Graphs adalah grafik yang menggunakan garis lurus untuk menghubungkan titik
data yang berurutan.
 Scatter Plot adalah grafik yang menunjukkan sebaran data dengan menempatkan titik
data di bidang kartesian.
 Heatmap adalah representasi visual dari data dalam bentuk matriks dengan warna

Anda mungkin juga menyukai