Anda di halaman 1dari 12

DATA DAN DATASET

TIM DOSEN PENGANTAR SAINS DATA


OUTLINE

- Definisi
- Jenis-Jenis Data
- Piramida DIKW
DEFINISI
Data adalah kumpulan penyusun informasi, dihasilkan dari suatu pengamatan yang bisa berupa angka,
simbol atau properti.

Dataset adalah sekumpulan data yang disusun secara terstruktur. Biasanya, dataset dipresentasikan
dalam bentuk tabel, alias baris dan kolom.

Database adalah sekumpulan dataset yang saling berhubungan menggambarkan sebuah perusahaan,
organisasi atau instansi tertentu dengan tujuan tertentu
Jenis-Jenis Data
Sifatnya
Bersifat Numerikal Bersifat Kategorikal

Data Kuantitatif/Data Numerik Data Kualitatif/Data Kategorikal

Data Kontinu Data Diskrit Data Nominal Data Ordinal

Rumah adat: rumah Destinasi tempat wisata:


Tinggi, berat, waktu, jarak,
Jumlah pengunjung dll gadang, rumah joglo, Tangkuban Perahu, Taman
suhu, dll
rumah honai Safari, Dufan
Kondisi Data
Data Terstruktur Data Semi Terstruktur Data Tidak Terstruktur

● Jenis data terstruktur dapat diproses, ● Merupakan jenis data yang ● Data dengan bentuk yang tidak
disimpan, dan diambil dalam format dimasukan ke dalam sebuah tabel, dikenal, harus disimpan dengan
tetap tetapi skemanya tidak sama dengan format khusus karena tidak memiliki
● Jenis data ini disimpan dalam bentuk tabel biasa yang hanya terdiri dari struktur yang spesifik seperti jenis
tabel, baris dan kolom yang baris dan kolom. data structured.
normalnya disimpan dalam excel ● Data semi-terstruktur mengandung ● Raw data dari jenis data ini hanya
atau spreadsheet format data terstruktur dan tidak dapat menghasilkan nilai setelah
● Informasi pada data sangat terstruktur. diproses dan dianalisa.
terorganisir dan dapat dengan mudah ● Walaupun belum diklasifikasi oleh ● Memiliki kerumitan sehingga
diakses dari database dengan repository tertentu (database), memerlukan penggunaan sistem
algoritma mesin pencari sederhana namun mengandung informasi yang penyimpanan yang memadai, seperti
penting. database NoSQL (MongoDB dan
CouchDB).
data sensor, data penjualan, data data dalam bentuk file csv, file xml, dan data teks, foto/gambar, video, atau
karyawan, data obat file json suara, keluhan pelanggan, kontrak, email
internal, dalam social media, seperti
komentar, likes, followers, dan data click
pada setiap aktivitas di akun media
sosial
Cara Memperolehnya
Data Primer Data Sekunder

Jenis dan sumber data penelitian yang di peroleh secara Sumber data suatu penelitian yang di peroleh peneliti
langsung dari sumber pertama (metode survey dan secara tidak langsung melalui media perantara. Berupa
metode observasi) bukti, catatan atau laporan historis yang telah tersusun
dalam arsip atau dokumen
● Bersifat real time, yaitu selalu berkembang setiap waktu ● Cenderung bersifat tetap dan biasanya data yang
● Proses pengumpulan data biasanya memerlukan waktu berhubungan dengan masa lalu atau kejadian yang
yang tidak sebentar dan biaya yang banyak telah lewat
● Melibatkan partisipasi aktif dari peneliti untuk ● Dapat diperoleh dari instansi pemerintah maupun
memperoleh data di lapangan swasta
● Dapat lebih spesifik sesuai dengan keinginan dan ● Proses pengumpulan data memerlukan waktu, biaya
kebutuhan dan tenaga yang tidak terlalu banyak serta cenderung
● Biasanya berupa data mentah yang belum diolah atau lebih cepat dan mudah untuk dilaksanakan
disempurnakan ● Tidak spesifik terhadap keinginan dan kebutuhan
● Cenderung lebih akurat karena dikumpulkan langsung domain kasus
dari lapangan ● Tidak memiliki kendali untuk menentukan kualitas
data
● Dapat diperoleh dari data primer yang diolah
menggunakan metode statistik
PIRAMIDA DIKW

Anda mungkin juga menyukai