Anda di halaman 1dari 45

FAKULTAS EKONOMI DAN BISNIS

UNIVERSITAS BUANA
FAKULTAS ILMU KOMPUTER PERJUANGAN KARAWANG

BIG DATA DAN DATA ANALYTICS


PROGRAM STUDI AKUNTANSI

Bayu Priyatna, M.Kom.


DAFTAR ISI

DAFTAR ISI ..................................................................................................... 1


1. PENGATAR ORANGE DATA MAINING.................................................... 2
2. PENGENALAN ORANGE DATA MAINING ............................................... 6
3. PREPROCESSING ................................................................................... 14
4. KLASIFIKASI DATA DENGAN MENGGUNAKAN KNN ........................... 25
5. PEDIKSI MENGGUNAKAN NAÏVE BAYES .............................................. 36
REFERENSI .................................................................................................... 44

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 1


1. PENGATAR ORANGE DATA MAINING

Orange data mining adalah software open source (karena ini


software yang kode sumber-nya terbuka untuk diupdate, dipelajari, diubah,
dan disebarluaskan). Untuk pengolahan Data Analytics atau Data Mining
yang akan anda perlukan menganalisis suatu data. Dengan menggunakan
software orange data mining kita dapat menganalisis suatu data penelitian,
text berita, text opini masyarakat, text program kerja dan lain sebagainya.

Jika dibandingkan dengan software Data Mining lainnya, Orange


mempunyai keunggul dalam hal visualisasi atau yang biasa anda sebut visual
programming dan dengan mudah di pergunakan karena berbasis GUI.

Di dalam software orange menyajikan banyak widget yang anda


letakkan pada canvas / drawing board, kemudian anda hubungkan dengan
widget-widget lainnya yang anda perlukan. Dengan media canvas ini maka
akan memudahkan pengguna untuk bermain dengan data dan melakukan
proses data analytics secara intuitif.

Selain widget, orange juga menyediakan beberapa add-on / modul


untuk problem pada domain domain tertentu seperti Text Mining / Text
Analytics, Bioinformatics, Network Data / Social Network, Model Maps,
Prototypes Process, dan lain lain.

A. Langkah-langkah Mendapatkan Orange Software


1) Download dan instal orange data mining pada website resminya :
https://orangedatamining.com/download/#windows.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 2


2) Jika sudah terunduh, silahkan anda menginstalnya.
3) Jalankan software orange data mining yang sudah terinstal tadi dan
beginilah tampilan awal dari software orange, lihat pada gambar di
bawah ini :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 3


B. Menambahkan Add-On Orange Software
Cara menambahkan add-on ya pertama adalah:
1) Klik → Option pada menu bar lalu klik → Add-ons

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 4


2) Ceklis yang add-on yang inginn di install lalu klik→OK. Tunggu
sampai proses instalasi selesai. Jika sudah selesai Orange akat
restart otomatis, kemudian muncul tampilan seperti dibawah ini :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 5


2. PENGENALAN ORANGE DATA MAINING
Pada orange data mining yang pertama harus dilakukan adalah
menyiapkan data set. Biasanya data set dapat berupa tabel dalam
format CSV. Pada orange data maining juga disedikan sample data
set yang bisa digunakan untuk mulai mencoba proses analisa data.
Berikut langkah penggunaannya :

A. PERCOBAAN EXPLORASI DATA ANALISIS (EDA)


1) Tabel
2) Tbel Pivot
3) Rank
4) Korelasi
5) Scatter Plot
6) Distribusi
7) Box Plot
8) Featur Statistik

B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada EDA.
Langkah-langkah yang harus dilakukan adalah:
1) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 6


2) Pada bagian File klik kiri 2x pada icon kertas Lalu akan
muncul tampilan seperti berikut:

Data set Iris merupakan dataset bawaan dari Orange Aplikasi


maka sample iris bisa langsung digunakan tanpa harus melakukan
normalisasi data terlebihdahulu.

C. DATA TABLE
Untuk dapat melihat isi dari data set Iris disini perlu menambahkan
Data Table kedalam projact yang sedang di lakukan:

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 7


1) Klik kiri pada Data→ Data Table
2) Kemudian trakik dan hubungkan data table dengan file

3) Kmudian untuk melihatnya Klik kanan 2x pada icon data table

Pada dataset Iris terdapat atribut spal (Klopak Bunga) dan Petal
(Daun Bunga). Sedangkan untuk jenis bunga Iris terdapat 3 jenis;
Setosa, Versicolor, dan Virginica.

D. PIVOT TABLE
Untuk dapat melihat agregasi dari data set Iris gunakan Pivot Table.
Agar kita dapat mengetahui, SUM, MEAN, MIN, MAX, VAR, MODE
dan MEDIAN. Berikut langkahnya:

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 8


1) Pilih transform kemudian kik → Pivot Table

2) Relasikan Pivot Table dengan file

3) Klik kiri 2x pada icon Pivot Table untuk menampilkan agregasinya

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 9


E. RANK
Rank ini digunakan untuk melihat relevnsi fitur. Ini untuk
menentukan atribut mana yang berpengaruh besar pada modul yang
nananti digunakan. Berikut adalah Langkah-langkahnya :
1) Pilih Data kemudian kik → Rank

2) Relasikan Rank dengan file

3) Klik kiri 2x pada icon Rank untuk melihat nilai inputan yang
perpengaruh tinggi.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 10


F. KORELASI
Pada korelasi kita dapat mengetahui hubungan antara atribut-atribut
yang terdapat pada data set Iris. Berikut langkahnya:
1) Tarik garis relasi dari file
2) Kemudian cari correlation lalu klik.

Maka hasilnya akan muncul :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 11


3) Klik kiri 2x untuk melihat korelasi tertinggi.

PRAKTIK :
Silakan lanjutkan utuk proses explor data dengang menggunakan :
1) Scatter Plot
2) Distribusi
3) Box Plot

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 12


4) Featur Statistik

Langkah – langkah nya dapat di lihat pada Link Video :


https://youtu.be/vWVWTaqTb5M

TUGAS :
Silakan Cari Data Set pada :
1. UCI
2. Kaggle
Lakukan Explorasi data dengan menggunakan Orange Data Maining
menggunakan :
1. Tabel
2. Tbel Pivot
3. Rank
4. Korelasi
5. Scatter Plot
6. Distribusi
7. Box Plot
8. Featur Statistik
Buat dalam Laporan Praktikum dengan Format PDF

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 13


3. PREPROCESSING

Preprocessingmerupakan proses untuk mengolah data mentah


sebelum dapat digunakan untuk melakukan mining.

Contoh:

a. Penskalaandata
b. Pembersihan data
c. Penghapusan data dan
d. Transformasi data.

A. PERCOBAAN PREPOCESSING
Pda percobaan prepocessing kali ini, menggunakan data set Iris
dengan menentukan kebutuan sebagai berikut :
a. Select Columns
b. Normalize
c. Outliers
d. Edit Domain
e. Select Relevants
f. Data Sampling
g. Randomize

B. DATA → FILE
Pada bagian ini kita akan coba menggunakan data set bunga Iris,
untuk mennampilkan semua komponen yng terdapat pada
Preprocessing. Langkah-langkah yang harus dilakukan adalah:
3) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 14


1

4) Pada bagian File klik kiri 2x pada icon kertas Lalu akan
muncul tampilan seperti berikut:

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 15


Data set Iris merupakan dataset bawaan dari Orange Aplikasi
maka sample iris bisa langsung digunakan tanpa harus melakukan
normalisasi data terlebihdahulu.

C. SELECT COLUMNS

Pada selest columns ini dugunakan untuk memilih fitur apa saja yang
akan di gunakan dari Target yang akan di tentukan, kali ini untuk
target yang kita gunakan adalah Iris:

4) Klik kiri pada Trasform→ Select Columns


5) Kemudian trakik dan hubungkan select columns dengan file

6) Klik kiri 2x pada icon select columns untuk menyesuikan target


dan fitur yang akan digunakan (Memililih kolom yang akan
dijadikan parameter).

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 16


7) Klik → data table lalu kita hubungkan dengan selectcolumns

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 17


D. Outler
Data Outlier disebut juga dengan data pencilan. Pengertian dari
Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim,
baik secara univariat ataupun multivariat. Yang dimaksud dengan
nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda
sama sekali dengan sebagian besar nilai lain dalam kelompoknya.
Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 40 siswa,
sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran 70 sampai
80. Kemudian ada 1 siswa yang nilainya sangat melenceng dari
lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut
memiliki nilai ekstrem sehingga disebut sebagai pencilan.

1) Berikutnya Klik → Unsupervised → Klik Outlier


2) Kemudian hubungkan Outlier dengan File

Untuk memvisualisasikannya kita hubungkan dengan Scatter Plot

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 18


3) Klik kiri 2x pada panah yang terhubung antara outline dengan
scatterplot. Nah kita ingin mengetahi outlier data iris maka kita
hubungkan antara outlier dengan data.

4) Klik kiri 2x pada icon scater plot maka data outlier dapat terlihat
sebagai berikut.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 19


5) Jika kita ingin melihat outlier dalam bentuk tabel dapat
dihubungkan otlier denga data table.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 20


E. EDIT DOMAIN

Widget Edit Domain dapat digunakan untuk mengedit / mengubah


domain/klas dataset.
1) Klik → Edit Domain pada Data
2) Tarik Edit domain ke File

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 21


Kita coba untuk merubah nama dari domain yang ada pada data set
Iris misalkan :

- Iris-setosa = Setosa
- Iris-versicolor = Versicolor

- Iris-virginica = Virginica
3) Klik kiri 2x pada icon Edit Domain

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 22


4) Kemudian klik → Apply
5) Klik Data Table lalu hubungkan dengan Text Domain

PRAKTIK :
Silakan lanjutkan utuk Preprocessing data dengang menggunakan :
a. Select Relevants
b. Data Sampling
c. Randomize

Langkah – langkah nya dapat di lihat pada Link Video :


https://youtu.be/e1DLUfa-Leg

TUGAS :
Silakan Lanjutkan Data Set yang sudah di dapat dari UCI/Kaggle pada tugas
sebelumnya :
Lakukan Preprocessing data dengan menggunakan Orange Data Maining
menggunakan :
1. Select Columns
2. Normalize
3. Outliers

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 23


4. Edit Domain
5. Select Relevants
6. Data Sampling

Buat dalam Laporan Praktikum dengan Format PDF

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 24


4. KLASIFIKASI DATA DENGAN MENGGUNAKAN KNN (K-NEAREST
NEIGHBOR)
K-nearest neighbors atau KNN adalah algoritma yang berfungsi untuk
melakukan klasifikasi suatu data berdasarkan data pembelajaran
(train data sets), yang diambil dari k tetangga terdekatnya (nearest
neighbors). Dengan k merupakan banyaknya tetangga terdekat.

4.1. Cara Kerja Algoritma K-Nearest Neighbors (KNN)


K-nearest neighbors melakukan klasifikasi dengan proyeksi data
pembelajaran pada ruang berdimensi banyak. Ruang ini dibagi
menjadi bagian-bagian yang merepresentasikan kriteria data
pembelajaran. Setiap data pembelajaran direpresentasikan menjadi
titik-titik c pada ruang dimensi banyak.

4.2. Klasifikasi Terdekat (Nearest Neighbor Classification)


Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang
dimensi banyak yang telah memuat titik-titik c data pembelajaran.
Proses klasifikasi dilakukan dengan mencari titik c terdekat dari c-
baru (nearest neighbor). Teknik pencarian tetangga terdekat yang
umum dilakukan dengan menggunakan formula jarak euclidean.
Berikut beberapa formula yang digunakan dalam algoritma knn.

Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik
dalam ruang dua dimensi.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 25


Hamming Distance
Jarak Hamming adalah cara mencari jarak antar 2 titik yang dihitung
dengan panjang vektor biner yang dibentuk oleh dua titik tersebut
dalam block kode biner.
Manhattan Distance
Manhattan Distance atau Taxicab Geometri adalah formula untuk
mencari jarak d antar 2 vektor p,q pada ruang dimensi n.
Minkowski Distance
Minkowski distance adalah formula pengukuran antar 2 titik pada
ruang vektor normal yang merupakan hibridisasi yang
menjeneralisasi euclidean distance dan mahattan distance.
Teknik pencarian tetangga terdekat disesuaikan dengan dimensi
data, proyeksi, dan kemudahan implementasi oleh pengguna.

4.3. Banyaknya k Tetangga Terdekat


Untuk menggunakan algoritma k nearest neighbors, perlu ditentukan
banyaknya k tetangga terdekat yang digunakan untuk melakukan
klasifikasi data baru. Banyaknya k, sebaiknya merupakan angka
ganjil, misalnya k = 1, 2, 3, dan seterusnya. Penentuan nilai k
dipertimbangkan berdasarkan banyaknya data yang ada dan ukuran
dimensi yang dibentuk oleh data. Semakin banyak data yang ada,
angka k yang dipilih sebaiknya semakin rendah. Namun, semakin
besar ukuran dimensi data, angka k yang dipilih sebaiknya semakin
tinggi.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 26


A. DATASET IRIS
Iris adalah keluarga dalam bunga yang mengandung beberapa
spesies seperti iris.setosa, iris.versicolor, iris.virginica, dll. Ketiga
bunga ini sering digunakan sebagai dataset dalam klasifikasi dan
mencoba algoritma Machine Learning.
Dataset Iris yang digunakan adalah berisi dataset ukuran kelopak
bunga iris. Tujuan dari dataset ini adalah membuat model yang
dapat melakukan klasifikasi spesies bunga iris berdasarkan ukuran
kelompok bunganya.

B. PROSES DTA MINING


➢ Load Data
➢ Split Data (Scale Features)
➢ KNN
➢ Prediction
➢ Confution Matrix

C. LOAD DATA
Pada bagian load data seperti biasa kita gunakan Data file :
Pada bagian ini kita akan coba menggunakan data set bunga Iris.
Langkah-langkah yang harus dilakukan adalah:
5) Pada sidebar Orange kita klik → Data, lalu kemudian klik → File.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 27


6) Pada bagian File klik kiri 2x pada icon kertas Lalu akan
muncul tampilan seperti berikut:

D. SPLIT DATA (SCALE FEATURES)


Pada split data kita akan coba untuk membagi dua data yaitu Data
Trening dan Data Test. Agar algoritma yang digunakan dapat belajar
dari data set yang digunakan, untuk mencari pola dari data set. Data
set yang didapat tidak semuanya digunakan untuk membuat model
atau Trening, sisakan juga dataset sedikit untuk menguji keakurasian
model yang digunakan. Contoh :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 28


E. KNN
Berikutnya kita tambahkan Algoritma atau Model dengan
menggunakan KNN:

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 29


Sebelumnya kita gunalkan preprocessing, untuk melakukan
normalisasi data, yang bertujuan untuk menghasilkan klasifikasi data
yang baik.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 30


Kemudian tarik dari KNN ke preprocessing.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 31


F. PREDICTION
Tentunya pada prediction ini kita akan melihat hasil dari proses
prediksi dalam bentuk Visualisasi Table :

Hubungkan Prediction dengan KNN

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 32


Hubungkan Prediction dengan Data sampler

Ubah garis Prediction yang terhubung dengan data sample

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 33


LEBIH JELAS : LIHAT PADA LINK INI

G. CONFUTION MATRIX
Confusion Matrix adalah pengukuran performa untuk masalah
klasifikasi machine learning dimana keluaran dapat berupa dua
kelas atau lebih. Confusion Matrix adalah tabel dengan 4 kombinasi
berbeda dari nilai prediksi dan nilai aktual.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 34


MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 35
5. PEDIKSI PENDAPATAN PENDUDUK DENGAN MENGGUNAKAN
NAÏVE BAYES
Pada prediksi kali ini mengguanakan dataset Adult: merupakan
dataset yang berisi informasi sensus penduduk dan pendataannya.
Tujuan dari dataset ini adalah membuat model yang dapat
melakukan klasifikasi apakah seorang penduduk memiliki
pendapatan lebih besar atau sama dengan $50.000 USD pertahun
atau tidak.
A. Naïve Bayes Classifier
Naive Bayes adalah metode klasifikasi data berdasarkan probabilitas
yang bisa saja terjadi di masa depan. Metode ini dianggap simpel dan
efektif untuk diterapkan dalam analisis perusahaan.
Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan
multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier
ini menerapkan teknik supervised klasifikasi objek di masa depan
dengan menetapkan label kelas ke instance/catatan menggunakan
probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang
suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah
(dengan asumsi, praduga, pernyataan, atau terbukti) terjadi.

P(A│B) = P(B│A)P(A)
P(B)
Keterangan:
P(A│B) : Probabilitas A terjadi dengan bukti bahwa B telah terjadi
(probabilitas superior)
P(B│A) : Probabilitas B terjadi dengan bukti bahwa A telah terjadi
P(A) : Peluang terjadinya A
P(B) : Peluang terjadinya B

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 36


B. Type Naïve Bayes Classifier
1). Multinomial Naive Bayes
Salah satu tipe metode Naive Bayes adalah Multinomial yang
sebagian besar digunakan untuk mengklasifikasi kategori dokumen.
Sebuah dokumen dapat dikategorikan bertema olahraga, politik,
teknologi, atau lain-lain berdasarkan frekuensi kata-kata yang
muncul dalam dokumen.
2). Bernoulli Naive Bayes
Tipe ini mirip dengan tipe Multinomial, namun klasifikasinya lebih
berfokus pada hasil ya/tidak. Prediktor yang di-input adalah variabel
boolean. Misalnya, prediksi atas sebuah kata muncul dalam teks atau
tidak.
3). Gaussian Naive Bayes
Distribusi Gaussian adalah asumsi pendistribusian nilai kontinu yang
terkait dengan setiap fitur berisi nilai numerik. Ketika diplot, akan
muncul kurva berbentuk lonceng yang simetris tentang rata-rata nilai
fitur.
C. Test Method (Cross Validation)
Merupakan metode evaluasi model dengan cara membagi data
menjadi beberapa bagian untuk dilatih dan diuji, disebut juga dengan
K-fold Validation.
Nilai K menunjukan beberapa banyak iterasi dan beberapa banyak
data akan dibagi menjadi bagian-bagian kecil untuk mengevaluasi
model.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 37


D. Proses Data Mining
Dalam proses ini kita akan lakukan tahapan sebagai berikut:
➢ Load Data
➢ Naïve Bayes
➢ Test and Score
➢ Confutin Matrix
E. Load Data
Pada proses load kita mengambil dataset Adult yang sudah ter dapat
pada Orange data mining.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 38


F. Naïve Bayes
Kemudian Tambahkan dengan Naïve Bayes.

G. Test and Score


Tambahkan Test and Score.

Hubungkan Dataset dengan Test and Score, kemudian hubungkan


Naïve Bayes dengan Test and Score.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 39


H. Confution Matrix
Hubungkan Convution Matrix dengan Test and Score.

Coba lihat isi datasetnya dengan menambahkan data table :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 40


Hasil akurasi dapat di lihat sebagai berikut:

Hasil Convutin Matrix :

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 41


TUGAS :
Silakan Cari Artikel Ilmiah atau Paper Jurnal minimal 20 Artikel yang sesuai
dengan topik praktikum kali ini dan topik pembahasan dalam rencana
penelitian.
Catatan :
1. Paper yang didapat harus bersumber dari Jurnal yang terindex Sinta
6-1 atau Scopus.

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 42


2. Tahun Penerbitan minimal 2020
Buat dalam Tabel Literature Review :
No Judul Author dan Tahun Metode Kesimpulan Saran
1 .. .. .. .. ..
2 .. .. .. .. ..
20 .. .. .. .. ..

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 43


REFERENSI

1. Fahmi Noor Fiqri By Kodesiana.com


2. Budi Santosa dan Umam (Data Mining dan Big Data Analytics)
3. Orange Software https://orangedatamining.com/

MODUL PRAKTIKUM ANALISIS BIG DATA DAN BUSINESS INTELLIGENCE 44

Anda mungkin juga menyukai