Dosen Pembimbing :
Dwi Anindyani Rochmah, ST, MTI
Disusun Oleh :
Nama : 1. Abdulmuiz Kurnia P. R. (41518320001)
2. Agung Susilo (41518320013)
3. Benito Felix Markus (41518320031)
Prodi : Teknik Informatika
TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER
UNIVERSITAS MERCU BUANA
PENDAHULUAN
Sistem Informasi Kampus dapat menyimpan data mahasiswa di kampus seperti data
dalam nim, nama, kelas, jurusan dan lain-lain. Data mahasiswa ini nantinya akan
disimpan dalam suatu database. Sistem Informasi Kampus digunakan untuk mengakses
data dengan lebih mudah daripada mencari data dalam tumpukan buku. Tidak butuh
waktu lama dan praktis. Data yang disimpan tidak mudah rusak ataupun hilang daripada
menggunakan catatan – catatan yang disimpan dalam kertas.
Namun data yang tersimpan di database kampus masih kotor (dirty data). Dirty data
ini diakibatkan oleh kesalahan sistem atau kesalahan pengguna (human error) dalam
memasukkan data pada sistem atau perhitungan yang salah. Permasalahan pada Dirty data
ditunjukkan dengan adanya kesalahan ejaan selama entri data, informasi yang hilang,
duplikasi data atau data tidak valid lainnya. Permasalahan ini penting untuk diselesaikan
karena akan mempengaruhi kualitas suatu data karena menghasilkan informasi yang tidak
akurat. Maka diperlukan pembersihan data terlebih dahulu atau yang dapat disebut
dengan Data Cleansing.
Data Cleansing adalah suatu proses mendeteksi dan memperbaiki (atau menghapus)
data set, tabel, dan database yang korup atau tidak akurat. Istilah ini mengacu pada
identifikasi data yang tidak lengkap, tidak benar, tidak tepat, dan tidak relevan, yang
kemudian dirty data tersebut akan diganti, dimodifikasi atau dihapus.
Penentuan metode yang cocok dalam mengatasi permasalahan pada dirty data sangat
penting dan dibutuhkan dalam proses data cleansing. Penentuan metode data cleansing
digunakan agar mendapatkan data yang berkualitas. Maka dari itu, analisa ini bertujuan
untuk menentukan metode data cleansing yang cocok untuk data kampus agar data yang
dihasilkan dapat diolah melalui proses data mining.
1. Informasi Mengenai Data yang Digunakan
Dalam melakukan Analisa Jurusan yang Paling Diminati di Universitas Mercu
Buana Jakarta Tahun 2020 ini, kami mengambil data mahasiswa dari database website
http://baa.mercubuana.ac.id/mahasiswa-2020/ dan diperoleh 829 data mahasiswa dari
jurusan : Teknik Sipil, Arsitektur, Teknik Mesin, Teknik Elektro, Teknik Industri,
Manajemen, Akuntansi, DKV, Penyiaran, Hub. Masyarakat, Periklanan &
Komunikasi Pemasaran, Teknik Informatika, Sistem Informasi dan Psikologi yang
datanya masih dalam bentk file pdf, dari data tersebut terdapat 6 atribut antara lain :
Atribut NIM, Atribut Mahasiswa, Atribut Lulusan, Atribut Angkatan, Atribut Jenis
Kelamin, Atribut Jurusan.
2. Hasil Analisa
Selanjutnya data yang sudah didapatkan tadi di salin ke dalam bentuk Excell
dan disimpan dalam format .csv agar datanya bisa diproses di aplikasi Weka.
Selanjutnya adalah tahap Asosiasi, tahap ini adalah tahap terakhir dari Analisa
dataset data_mahasiswa.csv yang sebelumnya sudah melalui proses Pre-Processing,
Klasifikasi, dan Klustering.
Pada tahap ini merupakan hasil dari asosiasi atau hubungan antara satu
atribut/class dengan atribut/class yang lainnya
3. Kesimpulan
Dari hasil analisa yang sudah dilakukan, didapati sebuah informasi yaitu :
2) Fakultas Teknik lebih banyak diminati oleh laki-laki, sedangkan Fakultas Non
Teknik lebih banyak diminati oleh perempuan.
5) Jurusan dengan paling sedikit mahasiswa/i nya dan sangat kurang diminati
adalah jurusan Penyiaran.
PENUTUP
DAFTAR PUSTAKA
1. http://baa.mercubuana.ac.id/mahasiswa-2020/
2. Aplikasi Weka