Anda di halaman 1dari 29

DATA

PREPARATION

2/1/20XX 1
TOPIC

PENGENALAN WORKSHEET

EKSPLORASI DATA

IDENTIFIKASI DATA

DATA CLEANING

2/1/20XX 2
PENGENALAN WORKSHEET

Presentation Title 2/1/20XX 3


PENGENALAN WORKSHEET

Presentation Title 2/1/20XX 4


EKSPLORASI DATA

Instruksi 1 :
Untuk
membuka
data yang
telah tersedia,
klik
Repository →
sample →
Data

2/1/20XX 5
EKSPLORASI DATA
Instruksi 2 :
Pilih salah
datu data, klik
dan drag pada
lembar kerja

Misal : Data
titanic

Lalu
hubungkan
out (output)
ke res (result)
dan klik
tombol run
(biru di atas) 2/1/20XX 6
EKSPLORASI DATA
Instruksi 3 :
Hasil running
akan
menampilkan
data seperti
pada gambar

Untuk melihat
data dalam
bentuk
statistic, klik
Statistic

2/1/20XX 7
EKSPLORASI DATA

Data Statistik

Untuk melihat
lebih detail klik
Visualizations

Jika ingin
Kembali ke
menu awal,
klik tombol
DESIGN di
atas

2/1/20XX 8
EKSPLORASI DATA : IMPORT DATA
Instruksi 4 :

Untuk
mengambil
data dari luar
klik Import
Data pada
menu
repository

2/1/20XX 9
EKSPLORASI DATA : IMPORT DATA
Instruksi 4 :

Untuk
mengambil
data dari luar
klik Import
Data pada
menu
repository

Pilih
MyComputer,
dan cari
dimana data
sumber akan
ditarik. 2/1/20XX 10
EKSPLORASI DATA : IMPORT DATA
Instruksi 4 :

Arahkan pada
panel
tersebut, klik
untuk mencari
lokasi data
berada

Lalu Klik
tombol Next di
bawah

2/1/20XX 11
EKSPLORASI DATA
Instruksi 5 :

Amati hasil
import data

Apakah datanya
valid ?

Bagaimana jika
data tidak valid ?

Berikutnya, klik
tombol Next

2/1/20XX 12
IDENTIFIKASI DATA
Apakah datanya
valid ? → YA

Karena data terisi


dengan baik
tanpa tanda
tanya (indikasi
data tidak valid)

Berikutnya
adalah amati
TYPE DATA

2/1/20XX 13
IDENTIFIKASI DATA
TYPE DATA

Polynominal : jika varian


data lebih dari dua

Binominal : jika hanya dua


varian

Real : berupa angka


(pecahan)

Integer : berupa angka


(bulat)

Date_time : berupa
tanggal dan jam

Date : hanya tanggal

Time : hanya jam

DEFAULT : POLYNOMINAL
2/1/20XX 14
IDENTIFIKASI DATA
Instruksi 6 :

Amati seluruh
data dan lakukan
perubahan jenis
type data sesuai
identifikasi

2/1/20XX 15
DATA CLEANING
Instruksi 6 :

Amati seluruh
data, apakah
data VALID ?

Bagaimana cara
membersihkan
data ?

2/1/20XX 16
DATA CLEANING
Instruksi 6 :

Identifikasi data,
perbaiki lalu
tekan tombol
next

2/1/20XX 17
DATA CLEANING
Instruksi 7 :

Simpan pada
local repository
→ Data →
Tombol Finish
(bawah)

2/1/20XX 18
DATA CLEANING
Instruksi 8 :

Ambil data yang


telah disimpan
pada local
repository, Klik
dan Drag pada
lembar kerja,
hubungkan out
ke res dan Run

2/1/20XX 19
DATA CLEANING
Instruksi 9 :

Perbaiki data
yang berisi tanda
tanya (?)

Data akan diganti


dengan data SMA

2/1/20XX 20
OPERATOR : REPLACE MISSING
Instruksi 10 :

Kembali ke menu
Design →
Operator → Ketik
Replace Missing
→ Klik dan drag
pada lembar
kerja, letakkan
pada garis
penghubung

2/1/20XX 21
OPERATOR : REPLACE MISSING
Instruksi 11 :

Pilih Attribute
Single, Isi
Attribute dengan
data yang akan
diganti → Asal
sekolah, Pilih
Default Value, Isi
Data → SMA

Lalu RUN

2/1/20XX 22
OPERATOR : REPLACE MISSING
Hasil : Data asal
sekolah sudah
tidak ada tanda
tanya

Lakukan dengan
data lainnya

Seandainya kita
menghendaki
data yang kosong
di hilangkan ?
misal Status lulus

2/1/20XX 23
OPERATOR : REDUCING
Instruksi 12 :

Ketik Filter Example


pada Operator lalu
atur Parameter → Isi
condition class
dengan
No_missing_attribute

Lalu RUN

2/1/20XX 24
OPERATOR : REDUCING
Instruksi 12 :

Perhatikan semula
data yang masih
belum bersih (ada
tanda tanya) ada 7
record setelah di
reducing data tersisa
5

2/1/20XX 25
OPERATOR : SAMPLE
Instruksi 13 :

Untuk mengambil
sejumlah populasi
dari data maka
gunakan sample

Ketik Sample pada


operator → Drag
pada koneksi → Atur
jenis sample →
tentukan berapa
besar sample dari
populasi, misal 50%

Lalu RUN 2/1/20XX 26


OPERATOR : SAMPLE
Instruksi 13 :

Perhatikan data yang


muncul adalah 50%
(2) dari total popilasi
data awal (5)

2/1/20XX 27
- TUGAS -
Instruksi 1 :

Buatlah atau carilah data online dalam bentuk excel : satu data valid dan satu data tidak valid
(kosong) jumlah record minimal 25 (semakin banyak semakin baik)

Lakukan :
- Proses Identifikasi data
- Proses Cleaning data : Replace, Reducing, Sample

Bentuk tugas :
- Laporan format pdf berisi hasil running setiap proses (screenshoot)
- Data TIDAK boleh sama antar mahasiswa, jika ada SAMA maka nilai 0

2/1/20XX 28
THANK YOU

Presentation Title 29

Anda mungkin juga menyukai