MODUL PERTEMUAN 9 (Data Warehouse Concept Preparation For Data Mining)
Disusun Oleh:
Nama : Rendy Anwar Prasetya
Kelas : SI 5 NRP : 14621665
PROGRAM STUDI SISTEM INFORMASI
SEKOLAH TINGGI ILMU KOMPUTER (STIKOM) POLTEK CIREBON 2023 MODUL 9
DATA PREPROCESSING
A. TEORI SINGKAT
Data Preprocessing merupakan salah satu tahapan dalam melakukan
mining data. Sebelum menuju ke tahap pemprosesan. Data mentah akan diolah terlebih dahulu. Data Preprocessing atau praproses data biasanya dilakukan melalui cara eliminasi data yang tidak sesuai. Selain itu dalam proses ini data akan diubah dalam bentuk yang akan lebih dipahami oleh sistem. Pengertian lain menyebutkan bahwa data preprocessing adalah tahapan untuk menghilangkan beberapa permasalahan yang bisa mengganggu saat pemrosesan data. Hal tersebut karena banyak data yang formatnya tidak konsisten. Data preprocessing merupakan teknik paling awal sebelum melakukan data mining. Namun terdapat beberapa proses juga dalam data preprocessing seperti membersihkan, mengintegrasikan, mentransformasikan dan mereduksi data. Melalui data preprocessing, memungkinkan proses mining akan berjalan dengan lebih efektif dan efisien. Karena data yang telah melalui Pra- pemrosesan data, merupakan data yang sudah melalui beberapa tahap pembersihan.
Tahapan dalam pre-processing adalah:
DATA CLEANING: Tahap pertama yang perlu dilakukan ketika akan
preprocessing data adalah data cleaning atau membersihkan data. Artinya, data mentah yang telah diperoleh perlu diseleksi kembali. Kemudian, hapus atau hilangkan data-data yang tidak lengkap, tidak relevan, dan tidak akurat. Dengan melakukan tahap ini, Anda akan menghindari kesalahpahaman ketika menganalisis data tersebut DATA INTEGRATION: Karena data preprocessing akan menggabungkan beberapa data dalam suatu dataset, maka kita harus mengecek data- data yang datang dari berbagai sumber tersebut supaya memiliki format yang sama. TRANSFORMASI DATA: Proses berikutnya yang harus dilakukan adalah transformasi data. Seperti yang telah dijelaskan di atas, data akan diambil dari berbagai sumber yang kemungkinan memiliki perbedaan format. Kita harus menyamakan seluruh data yang terkumpul supaya dapat mempermudah proses analisis data.
B. DETAIL PROSES PRAKTIKUM Membuat Format Data ARFF (Attribut-Relation File Format)
1. Kita ambil sebuah contoh data siswa berdasarkan jurusan sma, gender, asal sekolah, rerata sks, asisten, dan lama studi seperti table berikut.
2. Penentuan relasi / nama tabel. Misalkan kita tentukan nama relasinya
adalah jurusan sma.
Laporan Praktikum DWDM Rendy Anwar Prasetya
3. Berikut adalah gambar grafik untuk jumlah data yang bertipe binomial atau polynomial.
4. Atribut yang bertipe yaitu real yaitu Rerata_SKS
Laporan Praktikum DWDM Rendy Anwar Prasetya
5. Berikut adalah grafik besarnya nilai maximum
6. Minimum, Mean, dan StdDev (Standard Deviation)
C. KESIMPULAN
Laporan Praktikum DWDM Rendy Anwar Prasetya
Data preprocessing mengubah data menjadi format yang dapat lebih mudah dan lebih efektif diproses dalam data mining. Tak hanya dalam data mining, data preprocessing juga merupakan langkah preliminary yang penting dalam tahapan pemrosesan data lainnya, seperti AI data pipeline atau machine learning workflow.
D. DAFTAR PUSTAKA
Teknik pre-processing Dan classification dalam data science. (2022,
August 26). Master of Industrial Enginering. https://mie.binus.ac.id/2022/08/26/teknik-pre-processing- dan-classification-dalam-data-science/
Alizanovic, V. (2023, July 17). Mengenal data Preprocessing: Langkah
Awal dalam data mining. Pacmann. https://pacmann.io/blog/data- preprocessing
Pendekatan sederhana untuk SEO: Bagaimana memahami dasar-dasar optimasi mesin pencari dengan cara yang sederhana dan praktis melalui jalur penemuan non-spesialis untuk semua orang