Anda di halaman 1dari 5

Dengan diperkenalkannya sistem informasi, universitas dan lembaga penelitian non-universitas dapat

memberikan gambaran terbaru tentang kegiatan penelitian, catatan, proses dan pengelolaan informasi
mengenai kegiatan ilmiah, proyek dan publikasi mereka, serta mengintegrasikannya ke dalam kehadiran
web mereka. Bagi para ilmuwan, mereka menawarkan kesempatan untuk mengumpulkan,
mengkategorikan dan menggunakan informasi penelitian, baik untuk daftar publikasi, untuk penyusunan
proyek, untuk pengurangan upaya yang dibutuhkan untuk menghasilkan laporan, atau untuk presentasi
eksternal dari penelitian dan keahlian ilmiah mereka. Kualitas data sangat penting. Hanya data yang
benar yang dapat memberikan hasil yang tangguh dan berguna dan memungkinkan pemahaman
mendalam tentang data penelitian dari pendirian penelitian yang selalu up-to-date. Kelengkapan,
kebenaran dan ketepatan waktu data sangat penting untuk proses operasional yang berhasil. Kesalahan
data memperluas berbagai wilayah dan melemahkan seluruh aktivitas penelitian dari sebuah pendirian

. Oleh karena itu, tujuan makalah ini adalah untuk mendefinisikan dan mengklasifikasikan masalah
kualitas data yang dapat terjadi pada sistem informasi penelitian, dan kemudian menyajikan teknik baru
yang digunakan untuk mengenali, mengukur, menyelesaikan masalah kualitas data dalam sistem
informasi penelitian, untuk meningkatkan kualitas data mereka

Oleh karena itu, tujuan makalah ini adalah untuk mendefinisikan dan mengklasifikasikan masalah
kualitas data yang dapat terjadi pada penelitian informasi sistem, dan kemudian menyajikan teknik baru
yang digunakan untuk mengidentifikasi, mengukur, menyelesaikan masalah kualitas data dalam
penelitian sistem informasi, untuk meningkatkan kualitas data menurut mereka. data sangat penting.
Hanya data yang benar-benar dapat memberikan hasil yang tangguh dan berguna serta memungkinkan
pemahaman mendalam tentang data penelitian dari kesabaran penelitian yang selalu mutakhir.

. II. Sistem Informasi Penelitian

RIS adalah database pusat yang dapat digunakan untuk mengumpulkan, mengelola dan memberikan
informasi mengenai kegiatan penelitian dan hasil penelitian. Informasi yang dianggap di sini
menyediakan metadata tentang kegiatan penelitian seperti proyek, dana pihak ketiga, paten, mitra
kerjasama, harga dan publikasi. Arsitektur RIS biasanya terdiri dari (lihat Gambar 1)

: • Lapisan akses data

• Lapisan aplikasi

• Lapisan presentasi

Gambar berikut memberikan gambaran umum tentang proses individu dan menunjukkan komponen
mana yang menjadi miliknya

Lapisan akses data berisi sumber data internal dan eksternal. Tingkat ini berisi, misalnya, database dari
administrasi atau publikasi repositori perpustakaan, pengenal seperti data orcid atau bibliografi dari
Web Science atau Scopus dll.
Lapisan aplikasi berisi sistem informasi penelitian dan aplikasinya, yang menggabungkan, mengelola dan
menganalisis data yang diadakan pada tingkat yang mendasarinya.

Dalam lapisan presentasi, persiapan dan representasi spesifik kelompok kelompok sasaran dari hasil
analisis digambarkan bagi pengguna. Selain berbagai kemungkinan pelaporan, Anda juga bisa mengisi
portal dan situs web pendirian di sini.

Orthogonal terhadap lapisan yang dijelaskan, ada layanan infrastruktur, layanan yang tumpang tindih
untuk keseluruhan sistem informasi, seperti otentikasi, otorisasi, satu tanda, dan sebagainya.
Penawaran untuk pengumpulan, penyediaan dan pertukaran informasi penelitian yang ada dalam RIS
adalah rangkaian penelitian inti (RCD) dan model data rangkaian penelitian yang lebih umum (CERIF)
data yang dikelola oleh organisasi nirlaba Eurocris version CERIF 2008 1.0 tersedia. Model data ini
menggambarkan entitas serta hubungan mereka satu sama lain.

III. Masalah dari kualitas data

Masalah data pengumpulan data data dalam sistem database adalah proses standar. Pada setiap
fasilitas, data pribadi, informasi tentang kegiatan ilmiah, proyek dan publikasi mereka masuk dan
direkam. Pengolahan dan pengelolaan data ini biasanya perlu dalam kualitas yang baik, sehingga
pengguna bisa mendapatkan hasil yang lebih baik. Kualitas data sering didefinisikan sebagai kesesuaian
data untuk digunakan pada tujuan penggunaan yang diperlukan tertentu, yang harus bebas kesalahan,
lengkap, benar, up to date dan konsisten. Persyaratan dapat ditetapkan oleh pemangku kepentingan
yang berbeda, dalam konteks RIS E.g. Terutama oleh pengguna ris, tapi juga oleh RIS Administrator. Data
berkualitas buruk meliputi kesalahan data, kesalahan tipografi, nilai yang hilang, format yang salah,
kontradiksi dan lebih jauh lagi. Isu kualitas seperti itu di RIS perlu dianalisis dan kemudian diatasi melalui
transformasi data dan pembersihan data. Berikut ini adalah masalah kualitas khas data dalam konteks
ris (lihat Gambar 2): ● Nilai yang hilang (Fitur Kelengkapan)

● Informasi yang salah disebabkan oleh kesalahan input, pengukuran atau pengolahan (kebenaran
karakteristik) ● Duplikat dalam dataset (bebas redundansi) bebas ● Data yang tidak terwakili tidak
(Firean Uniformitas) ● Nilai kontradiktif logis (karakteristik konsistensi) Gambar 2: Contoh masalah
kualitas data di RIS

IV. Peningkatan kualitas data

karena integrasi sumber data internal yang berbeda dari pendirian dan sumber eksternal dalam sistem
informasi penelitian, masalah sebagaimana tercantum dalam Bab 3 harus diatasi. Sekarang penting
untuk menentang penyebabnya dalam langkah ini dan untuk meningkatkan kualitas data. Proses
mengidentifikasi dan memperbaiki kesalahan dan ketidakkonsistenan dengan tujuan meningkatkan
kualitas sumber data yang diberikan pada RIS, disebut sebagai pembersihan data (atau "pembersihan
data") [8]. Pembersihan data mencakup semua aktivitas yang diperlukan untuk membersihkan data
kotor (tidak lengkap, salah, tidak up to date, inkonsistensi, berlebihan, dll.). Proses pembersihan data
dapat disusun secara kira-kira sebagai berikut: 1. Mendefinisikan dan menentukan masalah sebenarnya
2. Temukan dan identifikasi contoh yang salah 3. Koreksi kesalahan pembersihan data yang ditemukan
menggunakan berbagai metode dan teknologi khusus dalam proses pembersihan data. [9] Subdivides
mereka ke dalam fase berikut (lihat Gambar 3

Parsing adalah komponen kritis pertama pembersihan data, membantu pengguna untuk memahami dan
mengubah atribut lebih akurat. Elemen data individu dirujuk sesuai metadata. Proses ini menempatkan,
mengidentifikasi dan mengisolasi elemen data individual. Untuk proses ini, mis. Untuk nama, alamat,
kode pos dan kota. Parser Profiler menganalisis atribut dan menghasilkan daftar token dari mereka, dan
dengan token ini data input dapat dianalisis untuk membuat peraturan khusus aplikasi. Masalah
terbesar di sini adalah format lapangan yang berbeda yang harus dideteksi.

Koreksi & Standardisasi lebih diperlukan untuk memeriksa data yang benar-benar untuk benar, dan
kemudian perbaiki setelahnya. Standardisasi adalah prasyarat untuk pencocokan yang sukses dan tidak
ada jalan sekitar menggunakan sumber data yang dapat diandalkan kedua. Untuk data alamat, validasi
post direkomendasikan.

Peningkatan atau pengayaan data adalah proses yang memperluas data yang ada dengan data dari
sumber lain. Disini data tambahan ditambahkan untuk menutup kesenjangan informasi yang ada. Nilai
pengayaan yang khas adalah informasi demografis, geografis atau alamat.

Pencocokan: Ada berbagai jenis pencocokan: untuk reduplikasi, sesuai dengan dataset yang berbeda,
konsolidasi atau pengelompokan. Adaptasi memungkinkan pengakuan atas data yang sama. Misalnya,
redundansi dapat terdeteksi dan dikondensasi untuk informasi lebih lanjut.

Konsolidasi (Ginggang): Mencocokkan item data dengan konteks diakui dengan membawa mereka
bersama.

PData profil adalah apa data yang harus dipahami, i. E. Tangkap struktur teknis, analisis mereka untuk
tujuan mendeteksi masalah kualitas data, dan mengidentifikasi ketidakkonsistenan bisnis. Profil ibu tidak
menggambarkan aturan bisnis dan tidak membuat perubahan. Mereka hanya untuk menganalisis data.
Profil ibu sering digunakan pada awal analisis data, namun juga dapat membantu menggambarkan hasil
analisis yang lebih baik

. Semua langkah ini sangat penting untuk mencapai dan memelihara kualitas data maksimal dalam
sistem informasi penelitian. Kesalahan dalam integrasi beberapa sumber data dalam RIS dieliminasi oleh
kliring. Tabel berikut ini menggambarkan sebuah contoh untuk mengidentifikasi catatan dengan nama
yang salah dalam daftar publikasi untuk menunjukkan bagaimana proses pembersihan data
(membersihkan, standarisasi, pengayaan, pencocokan, dan penggabungan) dapat meningkatkan kualitas
sumber data. Proses pembersihan menambahkan entri yang hilang, dan lahan selesai secara otomatis
disesuaikan dengan format tertentu sesuai aturan yang ditetapkan.

Data asli sebelum membersihkan


Data setelah membersihkan pada contoh ini, kode pos yang hilang ditentukan berdasarkan alamat dan
ditambahkan sebagai bidang terpisah. Pengayaan memutar konten dengan membandingkan informasi
tersebut dengan konten eksternal, seperti faktor demografis dan geografis, dan secara berkembang
secara berkembang dan mengoptimalkannya dengan atribut.

Data setelah pengayaan contoh menunjukkan bagaimana proses rekonsiliasi dan penggabungan
berjalan. Penggabungan dan pencocokan promosi Keistimewaan karena entri terkait dalam sistem atau
di seluruh sistem dapat dikenali secara otomatis dan kemudian terkait, disetel, atau digabungkan.

Cocokkan contoh ini menemukan entri terkait untuk Alien Scott dan Olivia Svenson. Terlepas dari
kesamaan antara dataset, tidak semua informasi berlebihan. Fungsi penyesuaian mengevaluasi data
dalam catatan individu secara rinci dan menentukan mana yang berlebihan dan mana yang independen.

Konsolidasi Penggabungan membuat data rekonsiliasi set data yang komprehensif. Dalam contoh ini,
entri duplikat untuk Alien Scott digabungkan menjadi rekor lengkap yang berisi semua informasi.

Bagi frontend RISE dapat diperiksa dengan proses profuili, ketika sampai pada produksi statistik,

Laporan data penelitian. Profil membuatnya mudah untuk menilai keseluruhan kondisi data, untuk
mengidentifikasi, memprioritaskan dan memperbaiki kesalahan, dan untuk memperbaiki penyebab
masalah kualitas. Begitu profil dibuat, fasilitas dapat merespons masalah kualitas dengan terus
memantau parameter yang terkait dengan profil.

V. Diskusi

Kebersihan data kesalahan dalam RIS adalah salah satu cara yang mungkin untuk meningkatkan kualitas
data yang ada. Setelah proses pembersihan data yang ditentukan, kasus penggunaan yang
dikembangkan berikut dapat diidentifikasi dalam sistem target dan harus berfungsi sebagai model untuk
menunjukkan bagaimana mendeteksi, mengukur, memperbaiki dan memperbaikinya dalam hal
kesalahan data dalam sistem informasi penelitian di dalam pendirian. Sosok berikut memperkenalkan
kasus penggunaan yang telah disebutkan secara khusus untuk meningkatkan kualitas data di RIS.

Aliran proses meta dapat dilihat seperti yang ditunjukkan pada gambar berikut:

Teknik yang disajikan oleh pembersihan data pembantu perusahaan yang mengatasi masalah. Dengan
langkah-langkah ini setiap pendirian dapat berhasil menegakkan kualitas data mereka. Vi. Kesimpulan
dan Outlook

Dalam makalah ini, pertanyaannya ditangani, yang menurut masalah kualitasnya dalam sistem
informasi penelitian dan cara memperbaikinya dan memperbaiki dengan teknik atau metode baru,
seperti pembersihan data. Akibatnya, ditunjukkan bahwa peningkatan kualitas data dapat dilakukan
pada tahap yang berbeda dari proses pembersihan data dalam sistem informasi penelitian dan bahwa
kualitas data yang tinggi dapat diperoleh dari universitas dan lembaga penelitian untuk mengoperasikan
E.G. Sistem informasi penelitian berhasil. Dalam hal ini, review dan peningkatan kualitas data selalu
ditargetkan. Konsep yang diilustrasikan dapat digunakan sebagai dasar untuk penggunaan fasilitas. Ini
menawarkan prosedur yang sesuai dan kasus penggunaan, di satu sisi agar dapat mengevaluasi kualitas
data dengan lebih baik, untuk dapat memprioritaskan masalah lebih baik dan mencegahnya di masa
depan segera setelah terjadi. Di sisi lain, kesalahan data ini harus dikoreksi dan ditingkatkan dengan
pembersihan data. Dikatakan: "Cacat kualitas yang lebih cepat terdeteksi dan diatasi, semakin baik."
Sudah dalam tahap akuisisi, penulis dirinya sendiri atau otoritas pengendalian hilir dapat memperbaiki
kesalahan perangkat lunak, seperti kesalahan mengetik, nilai yang hilang, format yang salah, kontradiksi,
dll. Untuk mendukung universitas dan semua lembaga penelitian dalam pelaksanaan proses
pembersihan data, ada banyak alat. Dengan alat ini, semua fasilitas dapat meningkatkan kelengkapan,
kebenaran, ketepatan waktu, dan konsistensi data kunci mereka secara signifikan, dan mereka dapat
berhasil menerapkan dan memberlakukan kebijakan kualitas data formal. Alat pembersih data terutama
komersial dan tersedia untuk konteks aplikasi kecil dan suite aplikasi integrasi data yang besar. Dalam
beberapa tahun terakhir, pasar untuk pembersihan data berkembang sebagai layanan. Dalam pekerjaan
masa depan, kemungkinan wawancara ahli dan / atau survei kuantitatif direncanakan dengan fasilitas
penelitian dan universitas untuk mengetahui seberapa tinggi kualitas data dalam sistem informasi
penelitian mereka dan tindakan apa yang akan meningkatkan kualitas data diterapkan pada informasi
penelitian. R

Anda mungkin juga menyukai