UNIVERSITAS BUANA
FAKULTAS ILMU KOMPUTER PERJUANGAN KARAWANG
B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada EDA.
Langkah-langkah yang harus dilakukan adalah:
1) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.
C. DATA TABLE
Untuk dapat melihat isi dari data set Iris disini perlu menambahkan
Data Table kedalam projact yang sedang di lakukan:
Pada dataset Iris terdapat atribut spal (Klopak Bunga) dan Petal
(Daun Bunga). Sedangkan untuk jenis bunga Iris terdapat 3 jenis;
Setosa, Versicolor, dan Virginica.
D. PIVOT TABLE
Untuk dapat melihat agregasi dari data set Iris gunakan Pivot Table.
Agar kita dapat mengetahui, SUM, MEAN, MIN, MAX, VAR, MODE
dan MEDIAN. Berikut langkahnya:
3) Klik kiri 2x pada icon Rank untuk melihat nilai inputan yang
perpengaruh tinggi.
PRAKTIK :
Silakan lanjutkan utuk proses explor data dengang menggunakan :
1) Scatter Plot
2) Distribusi
3) Box Plot
TUGAS :
Silakan Cari Data Set pada :
1. UCI
2. Kaggle
Lakukan Explorasi data dengan menggunakan Orange Data Maining
menggunakan :
1. Tabel
2. Tbel Pivot
3. Rank
4. Korelasi
5. Scatter Plot
6. Distribusi
7. Box Plot
8. Featur Statistik
Buat dalam Laporan Praktikum dengan Format PDF
Contoh:
a. Penskalaandata
b. Pembersihan data
c. Penghapusan data dan
d. Transformasi data.
A. PERCOBAAN PREPOCESSING
Pda percobaan prepocessing kali ini, menggunakan data set Iris
dengan menentukan kebutuan sebagai berikut :
a. Select Columns
b. Normalize
c. Outliers
d. Edit Domain
e. Select Relevants
f. Data Sampling
g. Randomize
B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada
Preprocessing. Langkah-langkah yang harus dilakukan adalah:
3) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.
4) Pada bagian File klik kiri 2x pada icon kertas Lalu akan
muncul tampilan seperti berikut:
C. SELECT COLUMNS
Pada selest columns ini dugunakan untuk memilih fitur apa saja yang
akan di gunakan dari Target yang akan di tentukan, kali ini untuk
target yang kita gunakan adalah Iris:
4) Klik kiri 2x pada icon scater plot maka data outlier dapat terlihat
sebagai berikut.
- Iris-setosa = Setosa
- Iris-versicolor = Versicolor
- Iris-virginica = Virginica
3) Klik kiri 2x pada icon Edit Domain
PRAKTIK :
Silakan lanjutkan utuk Preprocessing data dengang menggunakan :
a. Select Relevants
b. Data Sampling
c. Randomize
TUGAS :
Silakan Lanjutkan Data Set yang sudah di dapat dari UCI/Kaggle pada tugas
sebelumnya :
Lakukan Preprocessing data dengan menggunakan Orange Data Maining
menggunakan :
1. Select Columns
2. Normalize
3. Outliers
Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik
dalam ruang dua dimensi.
C. LOAD DATA
Pada bagian load data seperti biasa kita gunakan Data file :
Pada bagian ini kita akan coba menggunakan data set bunga Iris.
Langkah-langkah yang harus dilakukan adalah:
5) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.
G. CONFUTION MATRIX
Confusion Matrix adalah pengukuran performa untuk masalah
klasifikasi machine learning dimana keluaran dapat berupa dua
kelas atau lebih. Confusion Matrix adalah tabel dengan 4 kombinasi
berbeda dari nilai prediksi dan nilai aktual.
P(A│B) = P(B│A)P(A)
P(B)
Keterangan:
P(A│B) : Probabilitas A terjadi dengan bukti bahwa B telah terjadi
(probabilitas superior)
P(B│A) : Probabilitas B terjadi dengan bukti bahwa A telah terjadi
P(A) : Peluang terjadinya A
P(B) : Peluang terjadinya B