Arta Marisa - 00696 - RMK MG Ke 2
Arta Marisa - 00696 - RMK MG Ke 2
NIM : 1219-00696
Kemudian Untuk memahami ruang lingkup revolusi data, penting untuk mempertimbangkan
empat data besar yaitu volume, kecepatan, variasi, dan kejujuran. Data besar adalah istilah yang
digunakan perusahaan untuk mendeskripsikan sejumlah besar data yang sekarang mereka ambil,
simpan, dan analisis.
Volume data mengacu pada jumlah data yang dibuat dan disimpan oleh suatu organisasi.
Kecepatan data mengacu pada kecepatan pembuatan dan penyimpanan data.
Variasi data mengacu pada berbagai bentuk data yang dapat diambil.
Kebenaran data mengacu pada kualitas atau kepercayaan data.
Selanjutnya Untuk mendefinisikan pertanyaan "benar" atau "baik" dalam konteks analitik data,
mulailah dengan menetapkan tujuan yang SMART: s pecific, m mudah diukur, Sebuah
chievable, r elevant, dan t tepat waktu. Pertanyaan analitik data yang bagus
adalah
Spesifik: perlu langsung dan fokus untuk menghasilkan jawaban yang bermakna.
Terukur: harus setuju dengan analisis data dan dengan demikian masukan untuk
menjawab pertanyaan harus dapat diukur dengan data.
Achievable: harus bisa dijawab dan jawabannya harus membuat pengambil keputusan
mengambil tindakan.
Relevan: harus berkaitan dengan tujuan organisasi atau situasi yang sedang
dipertimbangkan.
Tepat waktu: harus memiliki cakrawala waktu yang ditentukan untuk menjawab.
Mengubah Data
Pada bagian ini, ikhtisar dari proses
transformasi empat langkah disediakan. Empat langkah tersebut adalah:
1. Pahami data dan hasil yang diinginkan.
2. Standarisasi, susun, dan bersihkan data.
3. Validasi kualitas data dan verifikasi data memenuhi persyaratan data.
4. Dokumentasikan proses transformasi.
Memuat Data
Setelah data terstruktur dan dibersihkan, data siap untuk diimpor ke alat apa pun yang digunakan
untuk analisis. Jika data telah diubah dengan benar, proses ini biasanya relatif cepat dan mudah.
Namun, ada beberapa pertimbangan penting saat memuat data.
1. Data yang diubah harus disimpan dalam format dan struktur yang dapat diterima oleh
perangkat lunak penerima.
2. Program mungkin memperlakukan beberapa format data secara berbeda dari yang
diharapkan. Penting untuk memahami bagaimana program baru akan menafsirkan format
data.
MENERAPKAN TEKNIK ANALISIS DATA
Analisis data terbagi dalam empat kategori: analitik deskriptif, analitik diagnostik, analitik
prediktif, dan analitik preskriptif.
1. Analisis deskriptif adalah informasi yang dihasilkan dari pemeriksaan data untuk
memahami masa lalu. Artinya, analisis deskriptif menjawab pertanyaan, "apa yang
terjadi?" atau "apa yang terjadi?" Perhitungan rasio akuntansi, seperti laba atas investasi
atau margin kotor, adalah contoh analitik deskriptif.
2. Analisis diagnostik mengembangkan analitik deskriptif dan mencoba menjawab
pertanyaan "mengapa ini terjadi?" Jenis analitik ini mencoba untuk menentukan
hubungan sebab akibat — misalnya, apakah meningkatkan anggaran TI dalam organisasi
meningkatkan efisiensi dan efektivitas karyawan? Analisis prediktif dan preskriptif sama-
sama memandang ke depan.
3. Analisis prediktif adalah informasi yang dihasilkan dari analisis yang berfokus pada
prediksi masa depan — mereka menjawab pertanyaan "apa yang mungkin terjadi di masa
depan?" Contoh analitik prediktif meramalkan peristiwa masa depan seperti harga saham
atau nilai tukar mata uang.
4. Analisis preskriptif adalah informasi yang memberikan rekomendasi tentang apa
Sebaiknya terjadi; mereka menjawab pertanyaan "apa yang harus dilakukan?" Contoh
analisis preskriptif adalah pembuatan algoritme yang memprediksi apakah individu atau
perusahaan akan membayar kembali pinjaman mereka dan kemudian membuat
rekomendasi tentang apakah pinjaman harus diperpanjang atau tidak. Analitik preskriptif
juga dapat diprogram untuk mengambil tindakan — dalam kasus pinjaman, pinjaman
dapat diberikan tanpa perlu seorang manusia meninjau aplikasinya.
1. Menafsirkan hasil
Secara teori, interpretasi keluaran alat analitik Anda sangat mudah — gambarkan apa
yang dikatakan analitik atau visualisasi. Namun, dalam praktiknya, menafsirkan hasil
bisa jadi jauh lebih rumit. Menafsirkan hasil membutuhkan penilaian manusia. Seringkali,
manusia membuat kesalahan atau menafsirkan hasil dengan cara yang salah.
2. Berbagi hasil
Berbagi hasil analitik data dengan orang lain sering disebut data storytelling, atau
storytelling. Push data adalah proses menerjemahkan analisis data yang seringkali
kompleks menjadi istilah yang lebih mudah dipahami untuk memungkinkan pengambilan
keputusan yang lebih baik.
Untuk memahami analitik data, penting untuk mencakup dua topik tambahan yang mencakup
banyak bagian dari pola pikir analitik:
(1) mengotomatiskan langkah-langkah dalam proses analitik. adalah aplikasi mesin untuk secara
otomatis melakukan tugas yang pernah dilakukan oleh manusia.
(2) pemahaman ketika menganalisis data tidak cukup untuk menghasilkan penilaian dan
keputusan berkualitas tinggi . Data yang dapat diandalkan tidak tersedia untuk aspek dari banyak
pertanyaan. Misalnya, penilaian atau intuisi manusia mungkin dapat menjelaskan faktor sentimen
yang tidak dapat diukur dengan andal. Artinya, hanya karena analisis data (dari data yang dapat
dikoleksi) menyarankan untuk mengambil satu tindakan tidak selalu berarti bahwa ini adalah
keputusan terbaik untuk individu atau organisasi.
Artikel grup 2
1. Judul artikel
“Pertimbangan Kualitas Data untuk Big Data dan Machine Learning: Melampaui
Pembersihan Data dan Transformasi”
2. Tujuan artikel
mendeskripsikan sifat dari masalah kualitas data dan karakteristiknya dalam konteks big
data dan pembelajaran mesin.
3. Isi artikel
Tantangan Kualitas Data dalam Big Data. Faktor perancu: tidak tersedia data
meta yang memadai selain itu juga tentang data yang hilang seperti MCAR, MAR,
dan MNAR, serta menangani data duplikat dengan menggunakan bloomfilter dan
menangani heterogenitas data dengan melakukan ekstraksi informasi Integrasi
data semantic
Tantangan Kualitas Data dalam Machine Learning
Bias dan varians trade off dalam machine learning divisualisasikan menggunakan
diagram bulls eye,Validasi silang dan boostrap, Transformasi data dan
pertimbangan lainnya dengan menggunakan variabel reduksi.
Dimensi penilaian kualitas data
Dimensi kualitas data memberikan dasar untuk mengukur dan memantau kualitas
data.
Siklus kualitas data
- Tata kelola data adalah sekumpulan praktik terbaik dan kontrol yang dilakukan
oleh organisasi untuk secara aktif mengelola dan meningkatkan kualitas data.
- Standard tata kelola data meliputi: kamus data, referensi dan meta data, model
data dan aturan bisnis, serta peran dan tanggung jawab
- Analisis kualitas data meliputi: analisis deskriptif, analisis diagnostik, analisis
preskriptif, dan analisis prediktif
- Akuisisi data dan pembuatan semantic yang terdiri dari tiga proses: Filtering &
Sampling, Cleaning & Enrichment, dan Semantics & Meta Data Generation
- Proses TIA & Pembuatan Semantik
- Penyimpanan, Pengambilan & Pembersihan Data
- Pengukuran dan Penilaian Kualitas Data
- Pemantauan Kualitas Data
Alat untuk manajemen kualitas data
-Analisis deskriptif
-Analisis diaognostik
-Analisis preskriptif
4. Kesimpulan
Penelitian kualitas data terutama difokuskan pada data terstruktur yang disimpan
dalam database relasional dan sistem file
Kemunculan sistem NoSQL untuk manajemen data besar membuat banyak
penelitian kualitas data tradisional menjadi tidak memadai dan kurang relevan.
Peneliti berharap penerapan sistem yang dihasilkan pada kumpulan data skala
besar dapat mengungkapkan kekuatan dan kelemahan arsitektur yang kami
usulkan.
Artikel Grup 1
Data science
Istilah payung untuk bidang interdisipliner yang menggunakan metode ilmiah, proses,
algoritma dan sistem untuk mengekstrak pengetahuan dan wawasan dari data dalam
berbagai bentuk seperti data mining dan pembelajaran mesin (Hayashi, 1998).
Data Analytics
diklasifikasikan menjadi :Descriptive, Diagnostic, Predictive, Prespective
5. Kesimpulan
Harapan pelanggan dari layanan keuangan kemungkinan akan meningkat di masa
depan seiring dengan berkembangnya berbagai teknologi.
Secara keseluruhan, penggunaan Big Data dalam akuntansi tampaknya tertinggal,
belum ada karya empiris akademis.Pada tahap ini, keuangan tampaknya jauh di
depan akuntansi yang memanfaatkan aplikasi ilmu data dan data besar untuk
membawa nilai tambah pada proses pengambilan keputusan.