Big Data Analytics 9

FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS BUANA
FAKULTAS ILMU KOMPUTER PERJUANGAN KARAWANG
BIG DATA DAN DATA ANALYTICS

PROGRAM STUDI AKUNTANSI
Bayu Priyatna, M.Kom.

DAFTAR ISI
DAFTAR ISI ..................................................................................................... 1

1. PENGATAR ORANGE DATA MAINING.................................................... 2
2. PENGENALAN ORANGE DATA MAINING ............................................... 6
3. PREPROCESSING ................................................................................... 14
4. KLASIFIKASI DATA DENGAN MENGGUNAKAN KNN ........................... 25
5. PEDIKSI MENGGUNAKAN NAÏVE BAYES .............................................. 36
REFERENSI .................................................................................................... 44
MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 1

1. PENGATAR ORANGE DATA MAINING
Orange data mining adalah software open source (karena ini

software yang kode sumber-nya terbuka untuk diupdate, dipelajari, diubah,
dan disebarluaskan). Untuk pengolahan Data Analytics atau Data Mining
yang akan anda perlukan menganalisis suatu data. Dengan menggunakan
software orange data mining kita dapat menganalisis suatu data penelitian,
text berita, text opini masyarakat, text program kerja dan lain sebagainya.
Jika dibandingkan dengan software Data Mining lainnya, Orange

mempunyai keunggul dalam hal visualisasi atau yang biasa anda sebut visual
programming dan dengan mudah di pergunakan karena berbasis GUI.
Di dalam software orange menyajikan banyak widget yang anda

letakkan pada canvas / drawing board, kemudian anda hubungkan dengan
widget-widget lainnya yang anda perlukan. Dengan media canvas ini maka
akan memudahkan pengguna untuk bermain dengan data dan melakukan
proses data analytics secara intuitif.
Selain widget, orange juga menyediakan beberapa add-on / modul

untuk problem pada domain domain tertentu seperti Text Mining / Text
Analytics, Bioinformatics, Network Data / Social Network, Model Maps,
Prototypes Process, dan lain lain.
A. Langkah-langkah Mendapatkan Orange Software

1) Download dan instal orange data mining pada website resminya :
https://orangedatamining.com/download/#windows.

2) Jika sudah terunduh, silahkan anda menginstalnya.
3) Jalankan software orange data mining yang sudah terinstal tadi dan
beginilah tampilan awal dari software orange, lihat pada gambar di
bawah ini :

B. Menambahkan Add-On Orange Software
Cara menambahkan add-on ya pertama adalah:
1) Klik → Option pada menu bar lalu klik → Add-ons

2) Ceklis yang add-on yang inginn di install lalu klik→OK. Tunggu
sampai proses instalasi selesai. Jika sudah selesai Orange akat
restart otomatis, kemudian muncul tampilan seperti dibawah ini :

2. PENGENALAN ORANGE DATA MAINING
Pada orange data mining yang pertama harus dilakukan adalah
menyiapkan data set. Biasanya data set dapat berupa tabel dalam
format CSV. Pada orange data maining juga disedikan sample data
set yang bisa digunakan untuk mulai mencoba proses analisa data.
Berikut langkah penggunaannya :
A. PERCOBAAN EXPLORASI DATA ANALISIS (EDA)

1) Tabel
2) Tbel Pivot
3) Rank
4) Korelasi
5) Scatter Plot
6) Distribusi
7) Box Plot
8) Featur Statistik
B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada EDA.
Langkah-langkah yang harus dilakukan adalah:
1) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.

2) Pada bagian File klik kiri 2x pada icon kertas Lalu akan
muncul tampilan seperti berikut:
Data set Iris merupakan dataset bawaan dari Orange Aplikasi

maka sample iris bisa langsung digunakan tanpa harus melakukan
normalisasi data terlebihdahulu.
C. DATA TABLE
Untuk dapat melihat isi dari data set Iris disini perlu menambahkan
Data Table kedalam projact yang sedang di lakukan:

1) Klik kiri pada Data→ Data Table
2) Kemudian trakik dan hubungkan data table dengan file
3) Kmudian untuk melihatnya Klik kanan 2x pada icon data table
Pada dataset Iris terdapat atribut spal (Klopak Bunga) dan Petal
(Daun Bunga). Sedangkan untuk jenis bunga Iris terdapat 3 jenis;
Setosa, Versicolor, dan Virginica.
D. PIVOT TABLE
Untuk dapat melihat agregasi dari data set Iris gunakan Pivot Table.
Agar kita dapat mengetahui, SUM, MEAN, MIN, MAX, VAR, MODE
dan MEDIAN. Berikut langkahnya:

1) Pilih transform kemudian kik → Pivot Table
2) Relasikan Pivot Table dengan file
3) Klik kiri 2x pada icon Pivot Table untuk menampilkan agregasinya

E. RANK
Rank ini digunakan untuk melihat relevnsi fitur. Ini untuk
menentukan atribut mana yang berpengaruh besar pada modul yang
nananti digunakan. Berikut adalah Langkah-langkahnya :
1) Pilih Data kemudian kik → Rank
2) Relasikan Rank dengan file
3) Klik kiri 2x pada icon Rank untuk melihat nilai inputan yang
perpengaruh tinggi.

F. KORELASI
Pada korelasi kita dapat mengetahui hubungan antara atribut-atribut
yang terdapat pada data set Iris. Berikut langkahnya:
1) Tarik garis relasi dari file
2) Kemudian cari correlation lalu klik.
Maka hasilnya akan muncul :

3) Klik kiri 2x untuk melihat korelasi tertinggi.
PRAKTIK :
Silakan lanjutkan utuk proses explor data dengang menggunakan :
1) Scatter Plot
2) Distribusi
3) Box Plot

4) Featur Statistik
Langkah – langkah nya dapat di lihat pada Link Video :

https://youtu.be/vWVWTaqTb5M
TUGAS :
Silakan Cari Data Set pada :
1. UCI
2. Kaggle
Lakukan Explorasi data dengan menggunakan Orange Data Maining
menggunakan :
1. Tabel
2. Tbel Pivot
3. Rank
4. Korelasi
5. Scatter Plot
6. Distribusi
7. Box Plot
8. Featur Statistik
Buat dalam Laporan Praktikum dengan Format PDF

3. PREPROCESSING
Preprocessingmerupakan proses untuk mengolah data mentah

sebelum dapat digunakan untuk melakukan mining.
Contoh:
a. Penskalaandata
b. Pembersihan data
c. Penghapusan data dan
d. Transformasi data.
A. PERCOBAAN PREPOCESSING
Pda percobaan prepocessing kali ini, menggunakan data set Iris
dengan menentukan kebutuan sebagai berikut :
a. Select Columns
b. Normalize
c. Outliers
d. Edit Domain
e. Select Relevants
f. Data Sampling
g. Randomize
B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada
Preprocessing. Langkah-langkah yang harus dilakukan adalah:

1

Data set Iris merupakan dataset bawaan dari Orange Aplikasi
maka sample iris bisa langsung digunakan tanpa harus melakukan
normalisasi data terlebihdahulu.
C. SELECT COLUMNS
Pada selest columns ini dugunakan untuk memilih fitur apa saja yang
akan di gunakan dari Target yang akan di tentukan, kali ini untuk
target yang kita gunakan adalah Iris:
4) Klik kiri pada Trasform→ Select Columns

5) Kemudian trakik dan hubungkan select columns dengan file
6) Klik kiri 2x pada icon select columns untuk menyesuikan target

dan fitur yang akan digunakan (Memililih kolom yang akan
dijadikan parameter).

7) Klik → data table lalu kita hubungkan dengan selectcolumns

D. Outler
Data Outlier disebut juga dengan data pencilan. Pengertian dari
Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim,
baik secara univariat ataupun multivariat. Yang dimaksud dengan
nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda
sama sekali dengan sebagian besar nilai lain dalam kelompoknya.
Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 40 siswa,
sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran 70 sampai
80. Kemudian ada 1 siswa yang nilainya sangat melenceng dari
lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut
memiliki nilai ekstrem sehingga disebut sebagai pencilan.
1) Berikutnya Klik → Unsupervised → Klik Outlier

2) Kemudian hubungkan Outlier dengan File
Untuk memvisualisasikannya kita hubungkan dengan Scatter Plot

3) Klik kiri 2x pada panah yang terhubung antara outline dengan
scatterplot. Nah kita ingin mengetahi outlier data iris maka kita
hubungkan antara outlier dengan data.
4) Klik kiri 2x pada icon scater plot maka data outlier dapat terlihat
sebagai berikut.

5) Jika kita ingin melihat outlier dalam bentuk tabel dapat
dihubungkan otlier denga data table.

E. EDIT DOMAIN
Widget Edit Domain dapat digunakan untuk mengedit / mengubah

domain/klas dataset.
1) Klik → Edit Domain pada Data
2) Tarik Edit domain ke File

Kita coba untuk merubah nama dari domain yang ada pada data set
Iris misalkan :
- Iris-setosa = Setosa
- Iris-versicolor = Versicolor
- Iris-virginica = Virginica
3) Klik kiri 2x pada icon Edit Domain

4) Kemudian klik → Apply
5) Klik Data Table lalu hubungkan dengan Text Domain
PRAKTIK :
Silakan lanjutkan utuk Preprocessing data dengang menggunakan :
a. Select Relevants
b. Data Sampling
c. Randomize
Langkah – langkah nya dapat di lihat pada Link Video :

https://youtu.be/e1DLUfa-Leg
TUGAS :
Silakan Lanjutkan Data Set yang sudah di dapat dari UCI/Kaggle pada tugas
sebelumnya :
Lakukan Preprocessing data dengan menggunakan Orange Data Maining
menggunakan :
1. Select Columns
2. Normalize
3. Outliers

4. Edit Domain
5. Select Relevants
6. Data Sampling
Buat dalam Laporan Praktikum dengan Format PDF

4. KLASIFIKASI DATA DENGAN MENGGUNAKAN KNN (K-NEAREST
NEIGHBOR)
K-nearest neighbors atau KNN adalah algoritma yang berfungsi untuk
melakukan klasifikasi suatu data berdasarkan data pembelajaran
(train data sets), yang diambil dari k tetangga terdekatnya (nearest
neighbors). Dengan k merupakan banyaknya tetangga terdekat.
4.1. Cara Kerja Algoritma K-Nearest Neighbors (KNN)

K-nearest neighbors melakukan klasifikasi dengan proyeksi data
pembelajaran pada ruang berdimensi banyak. Ruang ini dibagi
menjadi bagian-bagian yang merepresentasikan kriteria data
pembelajaran. Setiap data pembelajaran direpresentasikan menjadi
titik-titik c pada ruang dimensi banyak.
4.2. Klasifikasi Terdekat (Nearest Neighbor Classification)

Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang
dimensi banyak yang telah memuat titik-titik c data pembelajaran.
Proses klasifikasi dilakukan dengan mencari titik c terdekat dari c-
baru (nearest neighbor). Teknik pencarian tetangga terdekat yang
umum dilakukan dengan menggunakan formula jarak euclidean.
Berikut beberapa formula yang digunakan dalam algoritma knn.
Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik
dalam ruang dua dimensi.

Hamming Distance
Jarak Hamming adalah cara mencari jarak antar 2 titik yang dihitung
dengan panjang vektor biner yang dibentuk oleh dua titik tersebut
dalam block kode biner.
Manhattan Distance
Manhattan Distance atau Taxicab Geometri adalah formula untuk
mencari jarak d antar 2 vektor p,q pada ruang dimensi n.
Minkowski Distance
Minkowski distance adalah formula pengukuran antar 2 titik pada
ruang vektor normal yang merupakan hibridisasi yang
menjeneralisasi euclidean distance dan mahattan distance.
Teknik pencarian tetangga terdekat disesuaikan dengan dimensi
data, proyeksi, dan kemudahan implementasi oleh pengguna.
4.3. Banyaknya k Tetangga Terdekat

Untuk menggunakan algoritma k nearest neighbors, perlu ditentukan
banyaknya k tetangga terdekat yang digunakan untuk melakukan
klasifikasi data baru. Banyaknya k, sebaiknya merupakan angka
ganjil, misalnya k = 1, 2, 3, dan seterusnya. Penentuan nilai k
dipertimbangkan berdasarkan banyaknya data yang ada dan ukuran
dimensi yang dibentuk oleh data. Semakin banyak data yang ada,
angka k yang dipilih sebaiknya semakin rendah. Namun, semakin
besar ukuran dimensi data, angka k yang dipilih sebaiknya semakin
tinggi.

A. DATASET IRIS
Iris adalah keluarga dalam bunga yang mengandung beberapa
spesies seperti iris.setosa, iris.versicolor, iris.virginica, dll. Ketiga
bunga ini sering digunakan sebagai dataset dalam klasifikasi dan
mencoba algoritma Machine Learning.
Dataset Iris yang digunakan adalah berisi dataset ukuran kelopak
bunga iris. Tujuan dari dataset ini adalah membuat model yang
dapat melakukan klasifikasi spesies bunga iris berdasarkan ukuran
kelompok bunganya.
B. PROSES DTA MINING

➢ Load Data
➢ Split Data (Scale Features)
➢ KNN
➢ Prediction
➢ Confution Matrix
C. LOAD DATA
Pada bagian load data seperti biasa kita gunakan Data file :
Pada bagian ini kita akan coba menggunakan data set bunga Iris.
Langkah-langkah yang harus dilakukan adalah:

D. SPLIT DATA (SCALE FEATURES)

Pada split data kita akan coba untuk membagi dua data yaitu Data
Trening dan Data Test. Agar algoritma yang digunakan dapat belajar
dari data set yang digunakan, untuk mencari pola dari data set. Data
set yang didapat tidak semuanya digunakan untuk membuat model
atau Trening, sisakan juga dataset sedikit untuk menguji keakurasian
model yang digunakan. Contoh :

E. KNN
Berikutnya kita tambahkan Algoritma atau Model dengan
menggunakan KNN:

Sebelumnya kita gunalkan preprocessing, untuk melakukan
normalisasi data, yang bertujuan untuk menghasilkan klasifikasi data
yang baik.

Kemudian tarik dari KNN ke preprocessing.

F. PREDICTION
Tentunya pada prediction ini kita akan melihat hasil dari proses
prediksi dalam bentuk Visualisasi Table :
Hubungkan Prediction dengan KNN

Hubungkan Prediction dengan Data sampler
Ubah garis Prediction yang terhubung dengan data sample

LEBIH JELAS : LIHAT PADA LINK INI
G. CONFUTION MATRIX
Confusion Matrix adalah pengukuran performa untuk masalah
klasifikasi machine learning dimana keluaran dapat berupa dua
kelas atau lebih. Confusion Matrix adalah tabel dengan 4 kombinasi
berbeda dari nilai prediksi dan nilai aktual.

5. PEDIKSI PENDAPATAN PENDUDUK DENGAN MENGGUNAKAN
NAÏVE BAYES
Pada prediksi kali ini mengguanakan dataset Adult: merupakan
dataset yang berisi informasi sensus penduduk dan pendataannya.
Tujuan dari dataset ini adalah membuat model yang dapat
melakukan klasifikasi apakah seorang penduduk memiliki
pendapatan lebih besar atau sama dengan $50.000 USD pertahun
atau tidak.
A. Naïve Bayes Classifier
Naive Bayes adalah metode klasifikasi data berdasarkan probabilitas
yang bisa saja terjadi di masa depan. Metode ini dianggap simpel dan
efektif untuk diterapkan dalam analisis perusahaan.
Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan
multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier
ini menerapkan teknik supervised klasifikasi objek di masa depan
dengan menetapkan label kelas ke instance/catatan menggunakan
probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang
suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah
(dengan asumsi, praduga, pernyataan, atau terbukti) terjadi.
P(A│B) = P(B│A)P(A)
P(B)
Keterangan:
P(A│B) : Probabilitas A terjadi dengan bukti bahwa B telah terjadi
(probabilitas superior)
P(B│A) : Probabilitas B terjadi dengan bukti bahwa A telah terjadi
P(A) : Peluang terjadinya A
P(B) : Peluang terjadinya B

B. Type Naïve Bayes Classifier
1). Multinomial Naive Bayes
Salah satu tipe metode Naive Bayes adalah Multinomial yang
sebagian besar digunakan untuk mengklasifikasi kategori dokumen.
Sebuah dokumen dapat dikategorikan bertema olahraga, politik,
teknologi, atau lain-lain berdasarkan frekuensi kata-kata yang
muncul dalam dokumen.
2). Bernoulli Naive Bayes
Tipe ini mirip dengan tipe Multinomial, namun klasifikasinya lebih
berfokus pada hasil ya/tidak. Prediktor yang di-input adalah variabel
boolean. Misalnya, prediksi atas sebuah kata muncul dalam teks atau
tidak.
3). Gaussian Naive Bayes
Distribusi Gaussian adalah asumsi pendistribusian nilai kontinu yang
terkait dengan setiap fitur berisi nilai numerik. Ketika diplot, akan
muncul kurva berbentuk lonceng yang simetris tentang rata-rata nilai
fitur.
C. Test Method (Cross Validation)
Merupakan metode evaluasi model dengan cara membagi data
menjadi beberapa bagian untuk dilatih dan diuji, disebut juga dengan
K-fold Validation.
Nilai K menunjukan beberapa banyak iterasi dan beberapa banyak
data akan dibagi menjadi bagian-bagian kecil untuk mengevaluasi
model.

D. Proses Data Mining
Dalam proses ini kita akan lakukan tahapan sebagai berikut:
➢ Load Data
➢ Naïve Bayes
➢ Test and Score
➢ Confutin Matrix
E. Load Data
Pada proses load kita mengambil dataset Adult yang sudah ter dapat
pada Orange data mining.

F. Naïve Bayes
Kemudian Tambahkan dengan Naïve Bayes.
G. Test and Score

Tambahkan Test and Score.
Hubungkan Dataset dengan Test and Score, kemudian hubungkan

Naïve Bayes dengan Test and Score.

H. Confution Matrix
Hubungkan Convution Matrix dengan Test and Score.
Coba lihat isi datasetnya dengan menambahkan data table :

Hasil akurasi dapat di lihat sebagai berikut:
Hasil Convutin Matrix :

TUGAS :
Silakan Cari Artikel Ilmiah atau Paper Jurnal minimal 20 Artikel yang sesuai
dengan topik praktikum kali ini dan topik pembahasan dalam rencana
penelitian.
Catatan :
1. Paper yang didapat harus bersumber dari Jurnal yang terindex Sinta
6-1 atau Scopus.

2. Tahun Penerbitan minimal 2020
Buat dalam Tabel Literature Review :
No Judul Author dan Tahun Metode Kesimpulan Saran
1 .. .. .. .. ..
2 .. .. .. .. ..
20 .. .. .. .. ..

REFERENSI
1. Fahmi Noor Fiqri By Kodesiana.com

2. Budi Santosa dan Umam (Data Mining dan Big Data Analytics)
3. Orange Software https://orangedatamining.com/

Big Data Analytics 9

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Big Data Analytics 9

Diunggah oleh

Hak Cipta:

Format Tersedia

FAKULTAS EKONOMI DAN BISNIS

BIG DATA DAN DATA ANALYTICS

Bayu Priyatna, M.Kom.

DAFTAR ISI ..................................................................................................... 1

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 1

Orange data mining adalah software open source (karena ini

Jika dibandingkan dengan software Data Mining lainnya, Orange

Di dalam software orange menyajikan banyak widget yang anda

Selain widget, orange juga menyediakan beberapa add-on / modul

A. Langkah-langkah Mendapatkan Orange Software

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 2

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 3

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 4

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 5

A. PERCOBAAN EXPLORASI DATA ANALISIS (EDA)

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 6

Data set Iris merupakan dataset bawaan dari Orange Aplikasi

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 7

3) Kmudian untuk melihatnya Klik kanan 2x pada icon data table

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 8

2) Relasikan Pivot Table dengan file

3) Klik kiri 2x pada icon Pivot Table untuk menampilkan agregasinya

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 9

2) Relasikan Rank dengan file

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 10

Maka hasilnya akan muncul :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 11

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 12

Langkah – langkah nya dapat di lihat pada Link Video :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 13

Preprocessingmerupakan proses untuk mengolah data mentah

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 14

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 15

4) Klik kiri pada Trasform→ Select Columns

6) Klik kiri 2x pada icon select columns untuk menyesuikan target

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 16

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 17

1) Berikutnya Klik → Unsupervised → Klik Outlier

Untuk memvisualisasikannya kita hubungkan dengan Scatter Plot

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 18

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 19

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 20

Widget Edit Domain dapat digunakan untuk mengedit / mengubah

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 21

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 22

Langkah – langkah nya dapat di lihat pada Link Video :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 23

Buat dalam Laporan Praktikum dengan Format PDF

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 24

4.1. Cara Kerja Algoritma K-Nearest Neighbors (KNN)

4.2. Klasifikasi Terdekat (Nearest Neighbor Classification)

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 25

4.3. Banyaknya k Tetangga Terdekat

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 26

B. PROSES DTA MINING

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 27

D. SPLIT DATA (SCALE FEATURES)

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 28

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 29

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 30

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 31

Hubungkan Prediction dengan KNN

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 32

Ubah garis Prediction yang terhubung dengan data sample