Anda di halaman 1dari 19

Konsep Data dan

Representasi Data

Temu 4

Murien Nugraheni, S.T., M.Cs.


Pengertian Data
 Merupakan suatu fakta yang bisa digambarkan dengan
kode, simbol, angka dan lain-lain
 Merupakan data diartikan sebagai hasil pencatatan
peneliti, baik itu berupa fakta maupun angka
 Adalah semua hasil pengukuran atau observasi yang
sudah dicatat guna suatu keperluan tertentu
 Adalah suatu bahan yang masih mentah yang
membutuhkan pengolahan lebih lanjut sehingga
menghasilkan informasi atau keterangan, baik
kuantitatif maupun kualitatif yang menunjukkan suatu
fakta
Jenis-jenis Data

 Menurut sifatnya
 Menurut sumbernya
 Menurut cara memperolehnya
 Menurut waktu pengumpulannya
Data Menurut Sifatnya
 Data Kualitatif
 Data Kuantitatif
Data Kategorik
Data Nominal
Data Ordinal
Data Bukan Kategorik
Data Interval
Data Rasio
Data Menurut Sifatnya (2)

 Data Kualitatif
Data yang disajikan dalam bentuk kata-kata (tulisan),
gambar (audio) atau video yang memiliki makna.
Data-data tersebut diperoleh dari wawancara,
pengamatan, pemotretan, perekaman dan lain-lain.
Pada intinya data kualitatif adalah data yang bukan
merupakan bilangan angka sehinga tidak dianalisis
dengan ilmu statistik (statistika).
Data Menurut Sifatnya (3)

 Data Kuantitatif
Data yang disajikan dalam bentuk bilangan angka,
sehingga data kualitatif diolah secara statistik.
Data kualitatif terbagi lagi menjadi dua jenis yaitu
data kategorik dan data numerik.
Data Menurut Sifatnya (4)
 Data Kategorik
Data Nominal
Data yang diperoleh dengan mengelompkkan
suatu objek dengan tidak memperhatikan urutan
atau tingkatan.
Contohnya adalah jenis kelamin (laki-laki dan
perempuan), status perkawinan (belum kawin,
kawin, cerai hidup dan cerai mati).
Data Ordinal
Data ordinal adalah data yang mengelompokkan
suatu objek dengan memperhatikan urutan atau
tingkatan.
Contohnya adalah tingkat pendidikan (tidak
sekolah, SD, SMP, SMA dan Peguruan Tinggi).
Data Menurut Sifatnya (5)
Data Bukan Kategorik
Data Interval
Data interval adalah data yang tidak memiliki
nilai nol (0) mutlak, yang berarti bahwa nilai 0
tersebut memiliki arti misalnya data suhu, tahun
dll.
Data Rasio
Data rasio adalah data yang memiliki nilai nol
(0) mutlak, yang berarti bahwa nilai 0 benar-
benar tidak memiliki nilai contohnya adalah
data tingkat pengangguran, tingkat
kemiskinan, rata-rata nilai mahasiswa dll.
Data Menurut Sumbernya
 Data Internal
Data yang menggambarkan situasi dan kondisi dlam
suatu organisasi secara internal.
Contohnya adalah data mahasiswa, data pegawai,
data keuangan dan penjualan.
 Data Eksternal
Data yang menggambarkan situasi dan kondisi di luar
organisasi.
Contohnya adalah data tingkat kepuasan konsumen,
data kebahaian masyarakat dan lain-lain.
Data Menurut Cara Memperolehnya
 Data Primer
 Data yang secara langsung diambil dari objek penelitian oleh
peneliti perorangan atau organisasi.
 Pengumpulan data dapat berupa wawancara atau observasi.
 Contohnya adalah data hasil wawancara langsung tentang
kepuasan suatu produk kepada pelanggan.
 Data Sekunder
 Data yang tidak diperoleh secara langsung dari objek
penelitian.
 Data ini biasanya diperoleh dari data yang sudah jadi yang
dikumpulkan oleh pihak lain.
 Contohnya adalah data-data yang diperoleh dari buku, jurnal,
laporan, surat kabar, dan lain-lain.
Data Menurut Waktu Pengumpulannya

 Data Cross Section


Data yang menunjukkan titik waktu tertentu.
Misalnya adalah data pengangguran tahun 2020.
 Data Deret Waktu Time Series
Data yang menggambarkan sesuatu dari waktu ke
waktu.
Misalnya adalah data inflasi per bulan dari tahun
2010-2020.
Indikator Data yang Berkualitas
 ACCURACY
 Data yang tersimpan nilainya benar (name cocok dengan
alamatnya).
 DOMAIN INTEGRITY
 Nilai attributnya sesuai batasan yang diperkenankan (nilai
attribut laki & perempuan).
 DATA TYPE
 Nilai data disimpan dalam tipe data yang sesuai (data nama
disimpan dengan tipe text).
 CONSISTENCY
 Nilai sebuah field data akan sama semua dalam berbagai
berkas (field produk A dgn kode 123, akan selalu sama kodenya
di setiap berkas lain).
Indikator Data yang Berkualitas (2)
 REDUDANCY
 Tidak boleh ada data yang sama disimpan di tempat yang
berbeda dalam satu system.
 COMPLETENESS
 Tidak ada nilai atttribut salah yang diberikan dalam system.
 DATA ANOMALY
 Sebuah field hanya digunakan sesuai kegunaannya. (field
address3 digunakan untuk mencatat baris ketiga dalam
alamat bukan untuk telp atau fax).
 CLARITY
 Kejelasan arti kegunaan dan cara penulisan sebuah data
(penamaan khusus).
Indikator Data yang Berkualitas (3)

 TIMELY
Merepresentasikan waktu dari data yang dimasukkan
(jika data digunakan perhari maka data pada
warehaouse harus juga dibuat per hari).
 USEFULNESS
Setiap data harus benar digunakan oleh user.
 ADHERENCE TO DATA INTEGRITY RULES
Taat pada aturan keterhubungan data.
Data Preprocessing

 Adalah suatu proses/langkah yang dilakukan untuk


membuat data mentah menjadi data yang berkualitas
Preprocessing data dibutuhkan karena data
mentah masih memiliki :
 Incomplete, yaitu data yang kekurangan nilai atribut
atau hanya mengandung agregat data (contoh :
address = " ").
 Noisy, yaitu data yang masih mengandung error dan
outliers (contoh : salary = -10).
 Inconsistent, yaitu data yang mengandung discrepansi/
perbedaan dalam code dan nama atau singkatnya
datanya tidak konsisten (contoh : dulu rating = 1,2,3
sekarang a,b,c).
Data Preparation dibutuhkan karena :

 Jika data masukan tidak berkualitas, maka hasil data


mining juga tidak akan berkualitas.
 Keputusan yang berkualitas pasti berasal/berdasarkan
data yang berkualitas.
 Data Warehouse membutuhkan integrasi yang konsisten
dari data yang berkualitas.
 Jangan sampai terjadi Garbage In Garbage Out
(GIGO) artinya jika inputnya sampah outputnya pasti
sampah juga
Langkah-langkah dalam Data Preparation
 Data Cleaning
 Dalam data cleaning yang akan kita lakukan antara lain mengisi missing value,
mengidentifikasi outlier, menangani data noise, mengoreksi data yang tidak konsisten,
dan menyelesaikan masalah redudansi data akibat integrasi data.
 Data Integration
 Data integration adalah suatu langkah untuk menggabungkan data dari beberapa
sumber.
 Langkah yang dilakukan antara lain mengintegrasikan skema, mengidentifikasi
masalah entitas, dan mendeteksi sekaligus menyelesaikan konflik pada nilai data.

 Data Tranformation
 Data transformation yaitu mengubah suatu data supaya diperoleh data yang lebih
berkualitas.
 Langkah yang dilakukan antara lain menghilangkan noise dari data (smoothing),
meng-agregasi data, generalisasi data, normalisasi data, dan pembentukan
atribut/fitur.

 Data Reduction
 Data Reduction yaitu langkah untuk mereduksi dimensi, atribut ataupun jumlah data.
 Langkah yang dilakukan antara lain agregasi data cube, reduksi dimensi, diskretisasi,
dan kompresi data.
Teknik Pengukuran Data
 Skala Nominal
adalah skala yang hanya bisa membedakan benda,
peristiwa, ataupun objek yang diteliti antara satu
dengan yang lainnya berdasarkan nama atau
predikatnya.
 Skala Ordinal
adalah skala yang mengandung pengertian
tingkatan.
 Skala Interval
Adalah skala yang biasa digunakan dalam
pengukuran data numerik, yaitu skala interval.

Anda mungkin juga menyukai