6. Big data analytics = Proses pengolahan data yang besar untuk ditemukan pola-polanya,
dari data tersebut akan dicari hubungan dan akan ditemukan banyak informasi.
7. Complex heterogenous data =
1. Kapan seorang peneliti menggunakan oservational studies seperti cross-sectional, case-
control, cohort studies?
2. Apa kelebihan dan kekurangan dari cross-sectional, case-control, cohort studies?
- Membersihkan data
merupakan suatu proses analisa mengenai kualitas dari data dengan mengubah.
Bisa juga pengelola mengoreksi ataupun menghapus data tersebut. Data yang
dibersihkan tersebut adalah data yang salah, rusak, tidak akurat, tidak lengkap
dan salah format.
- Memproses data
5. Apa saja arti/maksud dari ke-6 karakteristik big data analytics yakni value, volume,
velocity, variety, veracity and variability?
- Value = Value pada big data ini bermaksud pada nilai pada data yang
bergantung pada isi data dan bergantung pada skill tim data analyst yang
menganalisa data, dan dapat menghasilkan informasi yang sangat berharga
untuk mengambil suatu keputusan.
- Volume = diartikan sebagai kuantitas atau jumlah data yang dihasilkan dari
banyak transaksi serta volume data yang disimpan.
- Velocity = adalah kecepatan dalam men generate data, mengakses data serta
memproses data. big data platform dan big data analytics software tentu harus
dapat memproses banyak data secepat mungkin ketika ada request
- Variety = artinya variasi tipe dan variasi sifat dari data, apakah data tersebut
bersifat terstruktur / structured, semi terstruktur ataupun tidak terstruktur
a. Data terstuktur = adalah data yang mempunyai elemen-elemen yang dapat di
akses seperti keys untuk dapat dianalisis ataupun data yang disimpan pada
format tertentu
b. Semi ter struktur = Informasi yang tidak disimpan dalam relational database
tetapi mempunyai pattern atau terorganisir dengan rapi sehingga lebih
mudah untuk di analisa,
c. Tidak ter struktur = Informasi atau data yang tidak terorganisir dengan baik
karena sifat alaminya, atau tidak memiliki predefined data model atau model
yang sudah terdefinisi
- Veracity = ……
- Variability = merupakan variabel yang digunakan yang akan berdampak ke
seberapa jauh dan seberapa cepatnya perubahan yang terjadi pada struktur
data serta seberapa sering atau bentuk dari data perusahaan berubah