Anda di halaman 1dari 11

Laporan Tugas Pelatihan Data Science Fundamental

Nama Tugas : Data Prepossesing Tanggal : 18/03/2023


Nama Lengkap : Syarif Hidayatullah
Asal Instansi : Pemerintah Kota Semarang

Penjelasan Hasil Tugas :


Hint :
Pada isi dari penjelasan ini, tampilkan gambar model dari rapidminer, kemudian jelaskan setiap operator yang
digunakan mulai dari data set, sampai operator terakhir yang digunakan dan hasilnya dari model tersebut.
A. MissingDataSet
Data Set (11 data)

Operator
1. Operator yang digunakan adalah Blending > Examples > Filter Examples dengan match all (AND)
dengan melakukan filter pada dataset menggunakan other_sosial_network yang terisi dan gender dengan
kode M (male)

Filter Gender M

Filter Other_Social_Network Is Not Missing

2. Operator yang digunakan adalah Cleansing > Missing > Replace Missing Values

Design
Result - Tampil dalam data bahwa kolom yang kosong terisi
Data pada Retireve : Menampilkan berapa kolom yang akan diproses (ada empat kolom)

Maka attribute filter type kita pilih subset dan, memilih 4 kolom atribut yang kosong (Read_News,
Other_Social_Network, Online_Shopping, dan Online_Gaming)

Memilih atribut yang kolomnya masih kosong


Setelah dilakukan penselksian atribut, maka hasilnya akan menampilkan 4 kolom (menjadi urutan
terdepan)
Data yang kosong sudah terisi dengan data/nilai rata-rata terbanyak / sering muncul
dari semua dataset yang sebelumnya
Problem/Noisy Data : Dalam Dataset masih terdapat data anomali yaitu 99 pada kolom twitter

3. Operator yang digunakan adalah Blending > Values > Replace


Operator ini mengganti sebagian nilai atribut nominal terpilih yang cocok dengan ekspresi reguler tertentu dengan
pengganti tertentu.
Menggunakan Regulatin Expresion

Aturan ini dibuat agar data anomaly 99 ini dapat tergantikan antara
N/ Y, untuk itu kita perlu menambahkan aturan [0-9] any Value
dengan diikuti .* multiple attribute character yang berguna
seberapapun angka yang tertulis 9/99/999/dst.. maka hasilnya akan
N, bukan N/NN/NNN dst..

Hasil Design operator Replace


Hasilnya, kolom twitter sudah tidak anomali

B. MissingDataSet-Noisy
Dataset (11 data)
1. Identifikasi awal

Pada gambar diatas terdapat data yang missing pada kolom Online_shop, Online_game dan
other_Social_network. Terdapat data anomaly/incosisten juga pada kolom Read_News,
Online_Shop, Online_game, dan Twitter

2. DESIGN

Operator Keterangan
Replace Missing Value Untuk Mengisi data yang kosong
Replace Untuk menggantikan data yang inkonsisten

3. RESULT
Sudah tidak ada data yang kosong dan inkonsisten

C. MissingDataSet-Noisy-Multiple
Dataset (11 data)

1. Identifikasi awal
Pada gambar diatas terdapat data yang missing pada kolom Online_shop, Online_game dan
other_Social_network. Terdapat data anomaly/incosisten juga pada kolom Read_News,
Online_Shop, Online_game, Twitter, dan inconsistensi dari kolom other_social_network
(penulisan FB/Face/Fesbuk)

2. DESIGN
Operator Keterangan
Replace Missing Value Untuk Mengisi data yang kosong
Replace Untuk menggantikan data yang inkonsisten
Map Untuk mengganti semua isian Face, FB, Fesbuk menjadi
Facebook

3. RESULT

Sudah tidak ada data yang kosong dan inkonsisten

Lampiran :
 Preprocessing-Syarif-1.rpm
 Preprocessing-Syarif-2.rpm
 Preprocessing-Syarif-3.rpm

Anda mungkin juga menyukai