Anda di halaman 1dari 6

LAPORAN PRAKTIKUM

MATA KULIAH DATA WAREHOUSE DATA MINING


MODUL PERTEMUAN 9
(Data Warehouse Concept Preparation For Data Mining)

Disusun Oleh:

Nama : Rendy Anwar Prasetya


Kelas : SI 5
NRP : 14621665

PROGRAM STUDI SISTEM INFORMASI


SEKOLAH TINGGI ILMU KOMPUTER (STIKOM) POLTEK
CIREBON
2023
MODUL 9

DATA PREPROCESSING

A. TEORI SINGKAT

Data Preprocessing merupakan salah satu tahapan dalam melakukan


mining data. Sebelum menuju ke tahap pemprosesan. Data mentah akan
diolah terlebih dahulu. Data Preprocessing atau praproses data biasanya
dilakukan melalui cara eliminasi data yang tidak sesuai. Selain itu dalam
proses ini data akan diubah dalam bentuk yang akan lebih dipahami oleh
sistem.
Pengertian lain menyebutkan bahwa data preprocessing adalah tahapan
untuk menghilangkan beberapa permasalahan yang bisa mengganggu saat
pemrosesan data. Hal tersebut karena banyak data yang formatnya tidak
konsisten. Data preprocessing merupakan teknik paling awal sebelum
melakukan data mining. Namun terdapat beberapa proses juga dalam data
preprocessing seperti membersihkan, mengintegrasikan,
mentransformasikan dan mereduksi data.
Melalui data preprocessing, memungkinkan proses mining akan berjalan
dengan lebih efektif dan efisien. Karena data yang telah melalui Pra-
pemrosesan data, merupakan data yang sudah melalui beberapa tahap
pembersihan.

Tahapan dalam pre-processing adalah:

 DATA CLEANING: Tahap pertama yang perlu dilakukan ketika akan


preprocessing data adalah data cleaning atau membersihkan data.
Artinya, data mentah yang telah diperoleh perlu diseleksi kembali.
Kemudian, hapus atau hilangkan data-data yang tidak lengkap, tidak
relevan, dan tidak akurat. Dengan melakukan tahap ini, Anda akan
menghindari kesalahpahaman ketika menganalisis data tersebut
 DATA INTEGRATION: Karena data preprocessing akan menggabungkan
beberapa data dalam suatu dataset, maka kita harus mengecek data-
data yang datang dari berbagai sumber tersebut supaya memiliki
format yang sama.
 TRANSFORMASI DATA: Proses berikutnya yang harus dilakukan adalah
transformasi data. Seperti yang telah dijelaskan di atas, data akan
diambil dari berbagai sumber yang kemungkinan memiliki perbedaan
format. Kita harus menyamakan seluruh data yang terkumpul supaya
dapat mempermudah proses analisis data.

Laporan Praktikum DWDM Rendy Anwar Prasetya 1|Page


B. DETAIL PROSES PRAKTIKUM
Membuat Format Data ARFF (Attribut-Relation File Format)

1. Kita ambil sebuah contoh data siswa berdasarkan jurusan sma, gender,
asal sekolah, rerata sks, asisten, dan lama studi seperti table berikut.

2. Penentuan relasi / nama tabel. Misalkan kita tentukan nama relasinya


adalah jurusan sma.

Laporan Praktikum DWDM Rendy Anwar Prasetya


3. Berikut adalah gambar grafik untuk jumlah data yang bertipe binomial
atau polynomial.

4. Atribut yang bertipe yaitu real yaitu Rerata_SKS

Laporan Praktikum DWDM Rendy Anwar Prasetya


5. Berikut adalah grafik besarnya nilai maximum

6. Minimum, Mean, dan StdDev (Standard Deviation)

C. KESIMPULAN

Laporan Praktikum DWDM Rendy Anwar Prasetya


Data preprocessing mengubah data menjadi format yang dapat lebih mudah
dan lebih efektif diproses dalam data mining.
Tak hanya dalam data mining, data preprocessing juga merupakan langkah
preliminary yang penting dalam tahapan pemrosesan data lainnya, seperti AI
data pipeline atau machine learning workflow.

D. DAFTAR PUSTAKA

Teknik pre-processing Dan classification dalam data science. (2022,


August 26). Master of Industrial
Enginering. https://mie.binus.ac.id/2022/08/26/teknik-pre-processing-
dan-classification-dalam-data-science/

Alizanovic, V. (2023, July 17). Mengenal data Preprocessing: Langkah


Awal dalam data mining. Pacmann. https://pacmann.io/blog/data-
preprocessing

Laporan Praktikum DWDM Rendy Anwar Prasetya

Anda mungkin juga menyukai