Anda di halaman 1dari 7

Nama : Arta Marisa Listyadevi

NIM : 1219-00696

RANGKUMAN MATERI DAN REVIEW ARTIKEL SISTEM INFORMASI


AKUNTANSI

CHAPTER 6 TRANSFORMING DATA

Dalam bab ini kita akan belajar 4 tahap dalam mentransformasikan data yang akan
mempertahankan dan meningkatkan kualitas data. Namun sebelumnya kita perlu mengetahui
atribut data yang berkualitas tinggi yaitu data harus lengkap,akurat,konsisten, valid, dan tepat
waktu. Jika salah satu atribut hilang maka data perlu di perbaiki. Walaupun tidak semua
msalah data dapat diatasi dengan transformasi data namun 4 langkah yang akan diuraikan
dalam bab ini dapat meningkatkan kualitas data:
1. Data Structuring
Struktur data dapat menjelaskan cara penyimpanan data, termasuk hubungan antara berbagai
bidang, atau dapat dikatakan struktur data adalah hubungan antara organisasi dan hubungan
antara data untuk menyiapkan data untuk dianalisis. Dalam melakukan analisis data ada
beberapa hal yang di perlukan yaitu:
 Agregate Data
Yaitu penyajian data dalam bentuk ringkasan. Saat mengubah data sangat penting untuk
memahami tingkat agregasi untuk setiap sumber data karena mengabungkan data pada tingkat
yang berbeda dapat menimbulkan masalah.
 Data Joining
Yaitu menggabungkan informasi dari tabel yang berbeda kedalam satu tabel sehingga data
yang digunakan bisa di analisis. Penggabungan data atau data joining bisa juga disebut
sebagai agregasi data,bedanya adalah agregasi data adalah proses meringkas data pada tingkat
detail yang berbeda sedangkan data joining adalah penggabungan data dari berbagai sumber
data.
 Data pivoting
Sedangkan data pivoting adalah merotasi data dari baris ke kolom.
2. Data Standarization
Langkah kedua dalam transformasi data adalah standarisasi data yang merupakan proses
pembakuan struktur dan maksa setiap elemen data sehinggadapat dianalisis dan digunakan
dalam pengambilan keputusan. Standarisasi data juga sangat penting saat menggabungkan
data dari berbagai sumber. Standarisasi ini juga memastikan bahwa informasi terkandung
dalam bidang yang sesuai dan bidang tersebut bisa di atur dengan cara yang bermanfaat.
Dalam melakukan standarisasi data ada beberapa hal yang penting untuk dilakukan :
 Data Parsing and Data Concenation
Data parsing atau penguraian data yaitu pemisahan data dari satu bidang menjadi beberapa
bidang. Misalnya kode karyawan “N-0504-2002” jadi elemen yang pertama adalah kode
mnemonik yang menunjukan bahwa karywan tersebut bekerja dikantor utara “N”. elemen
yang kedua adalah kode urutan /nomor karyawan “0504”. elemen yang terakhir adalah kode
grup yang mewakili tahun kerja yaitu “2002”. kemudian data concenation adalah
menggabungkan data dari dua atau lebih field menjadi satu field.
 Cryptic Data Value
Nilai kriptik atau cryptik data value merupakan item data yang tidak memiliki arti yang jelas
tanpa memahami skema pengkodean yang mendasarinya. Misalnya ; Misalnya, perusahaan
konsultan dapat melacak posisi dalam organisasi seperti mitra, konsultan senior, dan
analis riset dengan memasukkan ke dalam database nomor 1 untuk mitra, 2 untuk
konsultan senior, dan 3 untuk analis riset. Tanpa memahami kodenya, angka-angka di
kolom jabatan karyawan tidak ada artinya.
 Misfielded Data Values
Nilai data yang salah isian adalah nilai data yang diformat dengan benar namun tidak
termasuk dalam bidang tersebut. Misalnya bidang data untuk kota diisi dengan nama negara
maka nilainya akan salah harusnya nilai untuk nama negara harus dimasukan dalam bidang
data untuk negara.
3. Data Cleaning
Dirty data dalah data yang tidak konsisten,tidak akurat atau tidak lengkap. Maka agar berguna
data tersebut harus dibersihkan atau data cleaning yaitu proses memutahirkan data agar
konsisten,akurat, dan lengkap dan biasanya memerlukan biaya yang tinggi. Ada beberapa
kesalahan yang harus dicari pada saat pembersihan data atau data cleaning:
 Data De-Duplication
Merupakan proses menganalisis data dan menghapus dua atau lebih catatan yang berisi
informasi identik. Data duplikat berarti bahwa semua informasi untuk sebuah record
sama persis dengan record lainnya tetapi pada kenyataannya, tidak ada dua kejadian
identik dari apapun yang diukur.
 Data Filtering
Yaitu proses penghapusan catatan atau informasi dari sumber data. Misalnya
Perusahaan sering kali mengumpulkan informasi tentang banyak vendor, meskipun
mereka belum membeli dari semuanya. Dalam transformasi data, seorang analis data
mungkin menyaring vendor yang tidak aktif (tidak ada pembelian dalam setahun
terakhir) untuk menganalisis vendor yang aktif.
 Data Contradiction Error
Kesalahan kontradiksi data terjadi ketika entitas yang sama dijelaskan dalam dua cara
yang saling bertentangan. Misalnya, file data berisi informasi tentang pabrik dalam
dua catatan berbeda; namun, alamat fisik pabrik pembuatan berbeda di setiap catatan
meskipun setiap catatan dimaksudkan untuk merujuk pada lokasi fisik yang sama.
 Data thereshold
Pelanggaran ambang data adalah kesalahan data yang terjadi ketika nilai data berada
di luar tingkat yang dapat direndahkan.
 Violated Atribute Dependencies
Merupakan kesahalahan yang terjadi ketika atribut sekunder tidak cocok dengan
atribut primer. Misalnya, jika sebuah catatan secara akurat menunjukkan seseorang
tinggal di Nauvoo, Illinois, tetapi secara keliru mencantumkan kode pos sebagai
26354, ada atribut yang dilanggar dari pendency karena kode pos untuk Nauvoo,
Illinois adalah 62354.
 Data Entry Errors
Yaitu kesalahan memasukan data dengan tidak benar. Kesalahan entri data sering
terjadi dalam entri data manusia, seperti kata yang salah eja, mengubah urutan angka
dalam string nu meric, dan gagal memasukkan data. Kesalahan entri data juga dapat
dilkukanoleh sistem komputer. Misalnya, suatu sistem mungkin gagal mencatat dua
digit pertama dalam satu tahun, sehingga tidak jelas apakah tanggal tersebut
dimaksudkan untuk tahun 1910 atau 2010.
4. Data Validation
Sebelum proses transformasi selesai dilakukan kita perlu menganalisis apakah data
tersebut memiliki properti data berkualitas tinggi atau disebut dengan validasi data
atau data validation. Diperusahaan ada proses data secara formal dan informal. Secara
informal validasi data dilakukan secara pararel dengan setiap informasi. Sedangkan
secara formal yaotu mengikuti proses transformasi. Selain itu memvalidasi data
setelah di bersihkan juga berguna untuk menemukan masalah pada data yang perlu
diperbaiki, jadi dapat dikatakan validasi data adalah proses berulang yang membantu
mengidentifikasi apa yang perlu diubah dalam data serta memverifikasi bahwa data
telah diubah dengan benar. Ada beberapa teknik yang diguakan untuk memvalidasi
data :
 Visual Inspection
Memeriksa data dengan pengelihatan mata manusia untuk melihat apakah ada
masalah. Inspeksi visual mudah dilakukan jika kumpulan data kecil, tetapi meskipun
besar, pemeriksaan data secara visual dapat dilakukan secara efisien. Yaitu dengan
menggunakan 2 cara :
1) urutkan data di setiap kolom dalam urutan naik lalu turun. Pengurutan data dapat
mengungkapkan nilai yang hilang dan jenis data yang salah dalam kolom.
Misalnya, jika kolom harus memiliki nilai numerik, pengurutan akan ditampilkan
jika ada juga karakter yang terdapat dalam beberapa entri di kolom tersebut.
2) salin kolom data ke lingkungan baru lalu hapus semua nilai duplikat dalam data
yang disalin. Daftar yang diperkecil, terutama digabungkan dengan penyortiran,
dapat ditinjau lebih cepat dan mungkin menunjukkan kesalahan konsistensi data
seperti masalah penamaan "Milton Armstrong" yang dibahas di atas.
 Basic Statistical Test
Beberapa uji statistik dasar dapat dilakukan untuk memvalidasi data. Jenis pengujian
yang dapat dilakukan berbeda untuk bidang numerik dan bidang teks.
1) Untuk bidang numerik, hitung statistik deskriptif dasar untuk setiap bidang
seperti mini mum, maximum, mean, median, dan sum (atau total).
2) Untuk bidang teks, perbandingan serupa dapat dibuat dengan menghitung jumlah
catatan total atau jumlah catatan berbeda yang ada sebelum dan sesudah
transformasi data.
 Audit Sampel
Salah satu teknik terbaik untuk memastikan kualitas data adalah dengan mengaudit
sampel data. Pilih sampel baris, kolom, atau keduanya dan analisis setiap nilai untuk
memastikannya valid.
 Advanced Testing Techniques
Pemahaman yang lebih dalam tentang konten data dapat memungkinkan pengujian
validasi data yang lebih canggih.Dengan pemahaman tentang data, seseorang dapat
memanfaatkan pengetahuan itu untuk memeriksa apakah data yang diubah sesuai
dengan aturan akuntansi, sehingga memberikan bukti kualitas data Anda.
Review artikel kelompok 3
1. Judul artikel
“Data Quality Measures and Data Cleansing for Research Information Systems”
2. Latar Belakang Masalah
Pengumpulan, transfer dan integrasi informasi penelitian ke dalam sistem informasi
penelitian yang berbeda bisa saja menghasilkan kesalahan data yang berbeda yang
dapat memiliki berbagai efek negatif pada kualitas data. Untuk mendeteksi kesalahan
pada tahap awal dan mengobatinya secara efisien, maka perlu ditentukan langkah-
langkah pembersihan dan teknik-teknik baru pembersihan data untuk peningkatan
kualitas di lembaga penelitian. Maka dari itu makalah ini menyajikan langkah-
langkah yang mungkin dan teknik baru pembersihan data untuk memperbaiki dan
meningkatkan kualitas data dalam sistem informasi penelitian dan bagaimana ini
diterapkan pada informasi penelitian.
Pertanyaan penelitian :
langkah-langkah apa dan teknik-teknik baru untuk meningkatkan dan meningkatkan
kualitas data yang dapat diterapkan pada informasi penelitian?
3. Tujuan Penelitian
tujuan penelitian ini adalah menyajikan tindakan dan teknik terbaik serta terbaru
pembersihan data/data cleaning yang dapat diterapkan pada informasi penelitian.
4. Isi penelitian
 Research Information and Research Information Systems/ RI dan RIS
Untuk wilayah penelitian, pengumpulan data dan informasi terutama untuk
memetakan kegiatan penelitian dan hasilnya, serta untuk mengelola proses yang
terkait dengan kegiatan penelitian. Ini mungkin termasuk informasi tentang proyek
penelitian, durasinya, peneliti yang berpartisipasi dan publikasi terkait. Informasi ini
disebut juga informasi penelitian/research information(RI) atau data penelitian
Sedangkan RIS merupakan pusat basis data yang dapat digunakan untuk
mengumpulkan, mengelola dan menyampaikan informasi tentang kegiatan penelitian
dan hasil penelitian. Dalam RIS, data dari berbagai macam sistem operasional yang
ada diintegrasikan dalam sistem informasi penelitian dan dibuat oleh alat intelijen
bisnis dalam bentuk laporan yang tersedia.
 Data Quality and its Problem in the RIS
Saat menginterpretasikan data menjadi informasi yang bermakna, kualitas data
memegang peranan penting.sedangkan Istilah kualitas data dipahami sebagai “ukuran
multidi-dimensi dari kesesuaian data untuk memenuhi tujuan perolehan /
pembuatannya. Untuk lebih memahami betapa pentingnya kualitas data, penting
untuk memahami penyebab dari data berkualitas buruk yang dapat ditemukan dalam
sistem informasi penelitian.Masalah kualitas dalam RIS harus dianalisis dan
kemudian diperbaiki dengan transformasi data dan pembersihan data.
 Data Quality Measures

Figure 5 ;
Untuk Laissez Faire yaitu Untuk data yang jarang dan jarang berubah, prinsip laissez-
faire adalah tepat. Dalam ukuran ini, kesalahan yang terjadi tanpa pengobatan dapat
diterima. Kemudian ada Reactive approcah adalah untuk data yang penting dan
jarang berubah, ukuran reaktif cocok. Mereka memulai secara langsung dengan data
dan memperbaiki cacat kualitas, tanpa, bagaimanapun, menghilangkan
penyebabnya.selanjutnya proactive approach yaitu tindakan proaktif atau
(pencegahan) tersedia untuk data yang penting dan sering berubah. Di sini, tindakan
terutama diambil untuk menghilangkan sumber kesalahan dan untuk mencegah
terjadinya kesalahan.
 Data Cleasing
Proses mengidentifikasi dan mengoreksi kesalahan dan konsisten dengan tujuan untuk
meningkatkan kualitas sumber data tertentu di RIS disebut sebagai “Pembersihan
Data” atau “Pembersihan Data”.
Pembersihan Data mencakup semua aktivitas yang diperlukan untuk membersihkan
data kotor (tidak lengkap, salah, tidak sedang, inkonsisten, mubazir, dll.).
1. Parsing :komponen penting pertama dari pembersihan data dan membantu
pengguna memahami dan mengubah atribut.
2. Koreksi dan standarisasi: Standarisasi adalah prasyarat agar pencocokan berhasil
dan tidak ada jalan lain untuk menggunakan sumber data kedua yang dapat
diandalkan. Koreksi adalah memeriksa kebenaran data.
3. Enhancement/Penyempurnaan:adalah proses yang memperluas data yang ada
dengan data dari sumber lain
4. Matching /pencocokan : Ada berbagai jenis pencocokan: untuk mengulang,
mencocokkan ke kumpulan data yang berbeda, mengkonsolidasi atau
mengelompokkan.
5. Konsolidasi : Mencocokkan item data dengan teks con dikenali dengan
menyatukannya.

hasil dan kesimpulan :

 Dalam penelitian, korelasi positif langsung antara kualitas data dan RIS
didiskusikan secara dominan. Peningkatan kualitas data mengarah pada
peningkatan basis informasi bagi pengguna RIS.
 Hasilnya, teknik baru pembersihan data menunjukkan bahwa peningkatan dan
peningkatan kualitas data dapat dilakukan pada tahap yang berbeda dari proses
pembersihan data untuk setiap RIS, dan kualitas data yang tinggi itu juga
memungkinkan universitas dan lembaga penelitian. misalnya untuk
mengoperasikan RIS dengan sukses. Dalam hal ini, peninjauan, peningkatan, dan
peningkatan kualitas data selalu bertujuan.
 terlihat jelas bahwa pendekatan proaktif adalah metode teraman untuk menjamin
kualitas data yang tinggi dalam sistem informasi penelitian. Namun, bergantung
pada sifat kegagalannya, hasil yang memuaskan dapat dicapai bahkan dengan
praktik yang lebih murah dan reaktif atau laissez-faire yang lebih murah dan
boros.

Anda mungkin juga menyukai