Anda di halaman 1dari 31

ANALISIS DATA BESAR

disampaikan pada kuliah MK. Analisis Data Besar


Prodi Diploma III Rekam Medis dan Informasi Kesehatan
Politeknik Kesehatan Bhakti Setya Indonesia
Datin yang berasal dari laman, url yang menghasilkan
Media Sosial pertukaran informasi dalam jaringan komunitas ttt. Misal :
twitter, facebook, Ig dst

Machine
Generated Datin yang berasal dari perangkat lunak maupun keras
Data

Data Source Datin yang berasal dari alat pendeteksi, alat pengukuran dan
Sensing
mengubahnya ke dalam sinyal

Datin yeng memuat data data transaksi, misalnya transaksi


Transaksi keuangan, transaksi pendaftaran pasien dan/ data kerja yang
melibatkan dimensi waktu

IoT Datin yang berisi obyek -obyek dalam inet


Data Data yang berbasis format SQL yang siap untuk digunakan
Terstruktur (diolah, disimpan)

Content
Data yang terstruktur tetapi tidak /belum berbesis format
Data Semi
Format database konvensional atau bentuk dalam bentuk standar
terstruktur
database konvensional
Data Tidak Data yang berisi tentang informasi yang tidak terkategori
terstruktur seperti musik, video, lokasi dst

Data Penyimpanan data dalam bentuk data dokumen seperti


Dokumen JSON, XML
Penyimpanan data berdasarkan kategorisasi kolom yang
Data Kolom sama. Dimana hal ini berbeda dair penyimpanan data
BigTable
Data Store
Infografis Penyimpanan data dan pengambilan data grafis yang terdiri
Database dari nodes dan edges
Alternative model database untuk menyimpan dan
Key-value mengakses data key-value dengan skala yang tidak terbatas.
Contoh : Apache Hbase, Apache Cassandra
Proses pemisahan data, antara data yang baik, lengkap
Cleansing
dengan data yang tidak baik atau tidak lengkap

Proses mempersiapkan data yang sudah di cleansing, data


Data yang ada dibentuk sedemikian rupa menggunakan apps ttt
Staging Transform sehingga data dappat dipergunakan sesuai peruntukkannya.
Misal dari Rstudi yang melakukan scrapping data twitter dan
mengubahnya kedalam bentuk .csv, .excel
Proses strukturisasi data, sehingga data terbebas dari
Normalization
kondisi redudansi
Sistem berbasis Map Reduce yang memudahkan
Batch
penskalaan klaster yang berisiribuan nodes
Data
Pemrosesan data yang kaitannya dengan waktu, dimana
Processing
Real-time dari data yang diterima diproses dengan efektif dan dapat
menghasilkan luaran yang tepat,cepat
Hashem et al., 2015:102

Anda mungkin juga menyukai