Anda di halaman 1dari 10

Laporan Tugas Pelatihan Data Science Fundamental

Nama Tugas : Data Prepossesing Tanggal : 18/03/2023


Nama Lengkap : Syarif Hidayatullah
Asal Instansi : Pemerintah Kota Semarang

Penjelasan Hasil Tugas :


Hint :
Pada isi dari penjelasan ini, tampilkan gambar model dari rapidminer, kemudian jelaskan setiap operator yang
digunakan mulai dari data set, sampai operator terakhir yang digunakan dan hasilnya dari model tersebut.
A. MissingDataSet
Data Set (11 data)

Operator
1. Operator yang digunakan adalah Blending > Examples > Filter Examples dengan match all (AND)
dengan melakukan filter pada dataset menggunakan other_sosial_network yang terisi dan gender dengan
kode M (male)

Filter Gender M

Filter Other_Social_Network Is Not Missing

2. Operator yang digunakan adalah Cleansing > Missing > Replace Missing Values

Design
Result - Tampil dalam data bahwa kolom yang kosong terisi
Data pada Retireve : Menampilkan berapa kolom yang akan diproses (ada empat kolom)

Maka attribute filter type kita pilih subset dan, memilih 4 kolom atribut yang kosong (Read_News,
Other_Social_Network, Online_Shopping, dan Online_Gaming)

Memilih atribut yang kolomnya masih kosong


Setelah dilakukan penselksian atribut, maka hasilnya akan menampilkan 4 kolom (menjadi
urutan terdepan)
Data yang kosong sudah terisi dengan data/nilai rata-rata terbanyak / sering
muncul dari semua dataset yang sebelumnya
Problem/Noisy Data : Dalam Dataset masih terdapat data anomali yaitu 99 pada kolom twitter

3. Operator yang digunakan adalah Blending > Values > Replace


Operator ini mengganti sebagian nilai atribut nominal terpilih yang cocok dengan ekspresi reguler tertentu
dengan pengganti tertentu.
Menggunakan Regulatin Expresion

Aturan ini dibuat agar data anomaly 99 ini dapat tergantikan


antara N/ Y, untuk itu kita perlu menambahkan aturan [0-9] any
Value dengan diikuti .* multiple attribute character yang
berguna seberapapun angka yang tertulis 9/99/999/dst.. maka
hasilnya akan N, bukan N/NN/NNN dst..
Hasil Design operator Replace

Hasilnya, kolom twitter sudah tidak anomali


B. MissingDataSet-Noisy
Dataset (11 data)

1. Identifikasi awal

Pada gambar diatas terdapat data yang missing pada kolom Online_shop, Online_game dan
other_Social_network. Terdapat data anomaly/incosisten juga pada kolom Read_News,
Online_Shop, Online_game, dan Twitter
2. DESIGN

Operator Keterangan
Replace Missing Value Untuk Mengisi data yang kosong
Replace Untuk menggantikan data yang inkonsisten

3. RESULT

Sudah tidak ada data yang kosong dan inkonsisten


C. MissingDataSet-Noisy-Multiple
Dataset (11 data)

1. Identifikasi awal

Pada gambar diatas terdapat data yang missing pada kolom Online_shop, Online_game dan
other_Social_network. Terdapat data anomaly/incosisten juga pada kolom Read_News,
Online_Shop, Online_game, Twitter, dan inconsistensi dari kolom other_social_network
(penulisan FB/Face/Fesbuk)
2. DESIGN

Operator Keterangan
Replace Missing Value Untuk Mengisi data yang kosong
Replace Untuk menggantikan data yang inkonsisten
Map Untuk mengganti semua isian Face, FB, Fesbuk menjadi
Facebook

3. RESULT

Sudah tidak ada data yang kosong dan inkonsisten

Lampiran :
 Preprocessing-Syarif-1.rpm
 Preprocessing-Syarif-2.rpm
 Preprocessing-Syarif-3.rpm

Anda mungkin juga menyukai