Laporan Kerja Praktek

BAB I
PENDAHULUAN
1.1 Latar Belakang
Magang dan Studi Independen Bersertifikat (MSIB) adalah salah satu
program dari Kampus Merdeka yang bertujuan untuk memberikan kesempatan
kepada mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas
di luar kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan.
Program ini diperuntukan bagi mahasiswa yang ingin memperlengkapi dirinya
dengan menguasai kompetensi spesifik dan praktis yang juga dicari oleh dunia
usaha di dunia industri.
Study independen pada BISA AI dengan tema project capstone Big
Data Enggineer dan BISA AI merupakan start up yang mengembangkan
layanan dan produk seputar Artificial Intelligence yang didirikan pada tahun
2019. Dan pada penerapan data engineering ini saya melakukan prediksi
alokasi dana pengguna belanja online marketplace.
Model yang buat pada project akhir ini bukan hanya mampu untuk
prediksi alokasi dana pengeluaran dari pelanggan, namun model ini juga
mampu menyajikan visualisai pengelompokan data pelanggan berdasarkan
pengeluaran, umur, lokasi maupun data-data yang berkorelasi dengan
1
2
pengalokasian dana pengeluaran. Hal ini mampu mempermudah suatu
marketplace maupun perusahaan untuk mengenalisa data dari pelanggan.
Layanan-layanan yang pertama kali kembangkan oleh BISA Al
diantaranya: Image Recognition Service, Video Analytics Service Language
Service, Data Analysis Service, Lab as a Service, e-learning, dan loT Service.
Sukses bekerja sama dengan banyak perusahaan dalam menyelesaikan masalah
melalui Artificial Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.
Pada tahun 2020, BISA AI dapat fokus mengembangkan dua produk
utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya
sederhana, dengan BISA Tampil sebagai platform video conference dan BISA
AI Academy sebagai platform pembelajaran daring.
Data engineering merupakan software engineer yang tugas utamanya
adalah menyiapkan data yang dikoleksi dari berbagai sumber informasi dengan
membangun sistem data atau infrastruktur agar data tersebut dapat mudah untuk
dianalisa dan mendukung kebutuhan perusahaan dengan metode prediksi dan
klasterisasi.
Disini menawarkan model prediksi alokasi pengeluaran dari pelanggan
untuk suatu marketplace maupun perusahaan berdasarkan status, penghasilan,
lokasi, maupun kebiasan atau data-data lain dari user tersebut.
Model ini sangat cocok untuk diimplementasikan pada marketplace atau
perusahaan beskala menengah hingga besar. Sehingga sebuah marketplace atau

3
perusahaan mampu untuk menentukan kebijakan yang sesuai pada situasi
tertentu dengan adanya bantuan prediksi dan analisa dari produk model .
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, maka rumusan masalah adalah
Kampus Merdeka yang bertujuan untuk memberikan kesempatan kepada
mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas di luar
kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan . Dengan
adanya kegiatan seperti MSIB ini diharapkan penulis atau mahasiswa lain dapat
mengasah baik hard skill maupun soft skill dan dapat memahami konsep
Artificial Intelligence (AI).
1.3 Batasan Masalah
Dari permasalahan yang ada, penulis membatasi masalah yang dibahas sebagai
berikut :
1. Penelitian ini dilakukan dengan meyelesaikan proyek yang di lakukan
selama mengikuti MSIB.
2. Penelitian ini menggunakan platform kampus merdeka untuk melakukan
akses kegiatan MSIB.
3. Penelitian ini menggunakan data survei yang didapat dari riset dana
pelanggan belanja online melalui survei BISA AI Academy.

4
4. Penelitian menggunakan penerapan Data Engineering dengan metode
klasterisasi dan prediksi.
5. Penelitian ini menggunakan tahapan segmentasi Big Data Engineering.
6. Tools yang digunakan adalah Google Colaboratory.
1.4 Tujuan Penelitian
1. Meningkatkan pengetahuan, keterampilan, dan sikap Mahasiswa sehingga
meningkatkan kesiapan dan keterserapan di dunia kerja dan dunia usaha.
2. Menghasilkan terobosan dalam penyelesaian persoalan praktis di industri
ataupun organisasi dari inovasi yang dilakukan dalam program ini.
3. Mendorong dan memacu pembangunan nasional dengan menumbuhkan
motivasi masyarakat untuk berpartisipasi dalam pembangunan.
4. Meningkatkan peran dan kontribusi nyata Perguruan Tinggi dan Mahasiswa
dalam pembangunan nasional.
1.5 Manfaat Penelitian
1. Mahasiswa dapat terlibat langsung dalam aktivitas internal institusi tempat
magang
2. Mendapatkan ilmu yang relevan dari institusi tempat magang
3. Dalam menyelesaikan proyek diberikan pengetahuan melalui modul
pembelajaran yang relevan dengan persoalan proyek dengan pendampingan
mentor profesional
5
4. Mahasiswa mendapatkan peluang untuk menjadi FTE (Full Time
Employee) setelah perfomanya dinilai selama periode magang, selain itu
sertfikiasi keterampilan dari industri juga akan memberikan nilai yang
tinggi bagi Mahasiswa.
1.6 Metodologi Penelitian
Dalam membuat suatu laporan yang baik maka sebuah laporan
memerlukan data-data yang bersifat jelas dan akurat sesuai dengan
permasalahan yang dibahas. Untuk mendapatkan data-data yang sesuai dengan
permasalahan ini maka penulis mendapatkan data-data yang jelas dan akurat
sesuai dengan permasalahan dengan menggunakan beberapa metode penelitian
antara lain yaitu :
1. Metode Wawancara (Interview)
Wawancara merupakan komunikasi dua arah untuk
mendapatkan data dari responden (Jogiyanto, 2008:89). Penulis
akan melakukan wawancara pada PT BISA ARTIFISIAL
INDONESIA untuk mendapatkan informasi yang diinginkan.
2. Metode Observasi (Pengamatan)
Metode observasi adalah Teknik atau pendekatan untuk
mendapatkan data primer dengan cara mengamati langsung
objek datanya. (Jogiyanto, 2008:111). Penulis melakukan
pengamatan terhadap permasalahan yang diteliti untuk

6
3. Metode Studi Pustaka
Hasil Penelitian juga akan semakin kredibel apabila didukung
foto-foto atau karya tulis akademik dan seni yang telah ada
(Sugiyono, 2005:83). Penulis mengambil data-data yang ada
dari buku jurnal karya tulis ilmiah serta sumber referensi yang
mendukung penelitian dilaksanakan.
1.7 Sistematika Penulisan
Untuk memperoleh hasil gambaran yang jelas dari semua isi laporan kerja
praktek ini, maka garis besar pembahasaan dibagi menjadi 5 bab yaitu:
BAB 1 PENDAHULUAN
Bab ini meliputi latar belakang penelitian, rumusan masalah yang
menjadi acuan penelitian, batasan masalah penelitian, tujuan dan manfaat yang
akan diperoleh dari penelitian yang didapatkan, metodologi penelitian yaitu
metode yang digunakan dalam penelitian dan sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini berisi landasan- landasan teori yang digunakan dalam
menganalisi dan meneliti masalah dimana hal tersebut berhubungan dengan
MSIB, Machine Learning, Data Engineering, Prediction, Clusering, Python,
Prepocessing, Regresi linear, K-means dan Tools Google Colaboratory yang
digunakan dalam penelitian.
BAB III GAMBARAN UMUM

7
Dalam ini akan memuat mengenai Gambaran umum objek penelitian
pada PT BISA ARTIFISIAL INDONESIA yang akan dijelaskan dan dijabarkan
dalam bab ini. Meliputi sejarah berdirinya BISA ARTIFISIAL INDONESIA ,
visi dan misi, tujuan Universitas BISA ARTIFISIAL INDONESIA, struktur
organisasi, tugas serta tanggung jawab , BISA ARTIFISIAL INDONESIA.
BAB IV PEMBAHASAN
Berisi tentang study independen bersertifikat pada BISA ARTIFISIAL
INDONESIA dengan hasil project akhir penerapan Big Data Engineering
Segmentasi Alokasi Dana pelanggan dengan Google Colaboratory pada
program kampus merdeka magang dan study independen bersertifikat.
Meliputianalisis permasalahan, metode penelitian, pembahasan, hasil aplikasi,
hasil analisis.
BAB V PENUTUP
Bab ini berisi Kesimpulan dari hasil pembahasan yang diperoleh dari
hasil Penelitian dari MSIB pada BISA AI dan saran yang diberikan dalam
penelitian.
BAB II
LANDASAN TEORI
2.1 MSIB ( Magang Dan Studi Independen Bersertifikat )
Magang dan Studi Independen Bersertifikat atau MSIB adalah salah satu
program Kampus Merdeka yang dirancang untuk memastikan mahasiswa
mendapatkan keterampilan dan kompetensi utama, terbaik, dan terkini untuk
menghadapi dunia masa depan. Mahasiswa mendapat pengalaman belajar diluar
kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi SKS mata kuliah
yang diambil.
MSIB adalah salah satu program Kampus Merdeka yang dirancang untuk
memastikan mahasiswa mendapatkan keterampilan dan kompetensi utama, terbaik,
dan terkini untuk menghadapi dunia masa depan. Mahasiswa mendapat pengalaman
belajar diluar kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi
SKS mata kuliah yang diambil.
Dengan mengikuti program MSIB Kampus Merdeka, mahasiswa bisa belajar
dan mendapat pengalaman nyata di dunia profesional. Jadi, jangan lewatkan
kesempatan ini. Sebelum mendaftar pada program MSIB mahasiswa membuat akun
Kampus Merdeka.
Program MSIB ini terdiri dari 2 program, yakni Magang dan Studi Independen.
Di program magang, mahasiswa akan bekerja di organisasi mitra sebagai trainee.
8
9
Tolok ukur kegiatan magang di program MSIB adalah sebagai berikut:
 Peserta magang diberikan real project atau proyek riil yang mempunyai
nilai strategis untuk pihak industri
 Peserta magang diberi modul pembelajaran yang berkaitan dengan
persoalan proyek
 Proyek dikerjakan secara berkelompok dengan peserta lain yang lintas
disiplin ilmu
 Peserta magang mendapatkan pendampingan oleh mentor profesional
 Adanya peluang menjadi Full Time Employee bagi peserta magang
setelah performa dinilai
 Sertifikasi keterampilan dari industri akan memberikan nilai tinggi
untuk mahasiswa
2.2 Machine Learning
Machine learning adalah ilmu pengembangan algoritma dan model secara
statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi
eksplisit, mengandalkan pola serta inferensi sebagai gantinya. Sistem komputer
menggunakan algoritme machine learning untuk memproses data historis berjumlah
besar dan mengidentifikasi pola data (LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel,
A. (2014).
10
Adapun tujuan dari digunakannya aplikasi machine learning adalah untuk
membuat suatu keputusan atau prediksi yang dibuat berdasarkan data-data tersebut. Di
mana semakin bagus algoritma dari machine learning tersebut maka akurasi keputusan
dan prediksi sistemnya akan semakin baik. Ibaratnya, seperti otak manusia di mana jika
ia semakin pintar maka harus banyak belajar. Di sini pun, mesin yang mengolah
banyak data maka akan menghasilkan output yang semakin akurat. Maka dari itu, kini
machine learning adalah satu bagian yang wajib ada karena berperan penting bagi
seluruh aktivitas sehari-hari di sebuah perusahaan atau organisasi.
Hal ini memungkinkannya untuk memprediksi hasil yang lebih akurat dari set
data input yang diberikan. Misalnya, ilmuwan data dapat melatih aplikasi medis untuk
mendiagnosis kanker dari gambar sinar-x dengan cara menyimpan jutaan gambar yang
dipindai dan diagnosis yang sesuai (Board, F. S. 2017).
2.2.1 Tools Machine Learning
Dalam penggunaan machine learning diperlukan beberapa tool dalam tahapan
ini ada Beberapa tools yang digunakan untuk tahapan machine learning antara lain :
1. Google Collaboratory
Google Colab, kependekan dari Google Colaboratory, adalah salah satu
produk dari Google Internal Research. Dilansir dari e-book Logika Matematika
untuk Analisis Algoritma karya Dr. Putu Harry Gunawan, tools satu ini
merupakan compiler dan editor bahasa pemrograman Python secara online.

11
Selama menggunakan tools ini, kamu tidak perlu menginstal software
tambahan lagi. Untuk bisa menggunakan Google Colab, kamu hanya perlu akun
Google untuk login dan menyimpan file Python ke Google Drive milikmu.
Menurut e-book Informatika untuk SMP/MTs Kelas VII karya Gunawan Trieko
Wicaksono, dengan menggunakan Google Colab, siapa pun dapat belajar
coding tanpa perlu sarana komputasi yang canggih dan mahal.
Colaboratory, atau “Colab” merupakan produk dari Google Research.
Colab memungkinkan siapa saja menulis dan mengeksekusi kode python
arbitrer melalui browser, dan sangat cocok untuk machine learning, analisis
data, serta pendidikan. Secara lebih teknis, Colab merupakan layanan notebook
Jupyter yang dihosting dan dapat digunakan tanpa penyiapan, serta
menyediakan akses gratis ke resource komputasi termasuk GPU Resource
Colab tidak dijamin dan sifatnya terbatas, serta batas penggunaannya terkadang
berfluktuasi (‘Gabriel Irfon Elrohi Soen ,Marlina,Renny,2022 ’).
a. Syntax Google Colab
Beberapa syntax yang digunakan sebagai berkut :
1. Scikit-learn adalah library paling berguna untuk pembelajaran
mesin dengan Python. Library sklearn berisi banyak alat yang
efisien untuk pembelajaran mesin dan pemodelan statistik
termasuk klasifikasi, regresi, pengelompokan, dan pengurangan
dimensi.
12
Adapun scikit-learn lebih berfokus pada algoritma machine
learning.
a) Regresi: Memasang model linier dan non-linier
b) Classification : Klasifikasi tanpa pengawasan
c) Decision Tree : Induksi dan pemangkasan pohon untuk
tugas klasifikasi dan regresi
d) Neural Networks : Pelatihan ujung ke ujung untuk
klasifikasi dan regresi. Lapisan dapat dengan mudah
ditentukan dalam tupel
e) SVM: untuk mempelajari batasan keputusan
f) Naive Bayes: Pemodelan probabilistik langsung
2. Algoritma Tingkat Lanjut di Scikit Learn
a) Metode Ensemble: Boosting, Bagging, Random Forest,
Model voting dan averaging
b) Manipulasi Fitur: Pengurangan dimensi, pemilihan fitur,
analisis fitur
c) Deteksi Outlier: Untuk mendeteksi outlier dan menolak
noise
d) Pemilihan dan validasi model: Validasi silang,
penyesuaian Hyperparameter, dan metrik
3. Library dari scikit learn antara lain :
 NumPy adalah
13
Library untuk Python yang menambahkan dukungan untuk
array dan matriks multidimensi yang besar, bersama dengan
koleksi fungsi matematika tingkat tinggi untuk beroperasi pada
array. Dan NumPy (Numerical Python) adalah library Python
yang fokus pada scientific computing. Simpelnya: Numpy
menyediakan fungsi yang siap pakai untuk memudahkan kita
melakukan perhitungan saintifik seperti matriks, aljabar,
statistik, dan sebagainya. (‘Joseph Dedy Irawan , Emmalia
Adriantantri ,Teknik Informatika, Institut Teknologi Nasional
Malang,2019’).
Keterangan :
Array / np array = variable yang mempunyai indeks numpy
Import = perintah untuk memasukan library
Np = singakatan dari numpy untuk mempersingakat nama untuk
data frame
Contoh source code NumPy :
Input :
import numpy as np
variable :
a= np.array([1,2,3,4,5])
b=np.array([1.2,1.5,5,6,7])
output 1:
14
print(b)
output 2:
[1.2 1.5 5.6.7.]
 Pandas
Perpustakaan penting bagi para data scientist. Library untuk
machine learning yang bersifat open source ini menyediakan
struktur data tingkat tinggi yang fleksibel serta berbagai alat
analisis. Penggunaannya memudahkan analisis data, manipulasi
data, dan pembersihan data. Pandas mendukung berbagai jenis
operasi seperti penyortiran, pengindeksan ulang, iterasi,
penggabungan, konversi data, visualisasi, agregasi, dan lain
sebagainya(‘Andri Wahyu Ahmad Ruslam, 2020’).
Import = perintah untuk memasukan library
Pd dan np = singakatan dari pandas dan numpy untuk
mempersingakat nama untuk data frame
Df = singkatan dari data frame (table data tabular array 2
dimensi)
Dict = untuk membentuk dictionary yang merupakan tipe data
Contoh source code Pandas :
input :
import pandas as pd
import numpy as np
15
variable:
dict = {"Negara": ["Indonesia", "Jepang",
"India", "China", "Amerika Serikat"],
"Ibu Kota": ["Jakarta", "Tokyo", "New
Delhi", "Beijing", "Washington, D.C."],
"Luas": [1905, 377972, 3287, 9597,
9834],
"Populasi": [264, 143, 1252, 1357,
5298] }
df = pd.DataFrame(dict)
print(df)
Output :
Negara Ibu Kota Luas
Populasi
0 Indonesia Jakarta 1905 264
1 Jepang Tokyo 377972 143
2 India New Delhi 3287 1252
3 China Beijing 9597 1357
4 Amerika Serikat Washington, D.C. 9834
5298
16
 Matplotlib
bertanggung jawab untuk merencanakan data numerik. Itulah
alasan Matplotlib digunakan dalam analisis data. Library python
yang bersifat open source ini dapat memplot angka-angka
berdefinisi tinggi seperti diagram lingkaran, histogram,
scatterplot, grafik, dan lain-lain (‘Herlawati,Rahmadya Trias
Handayanto,FakultasTeknik, Universitas Bhayangkara, 2019’).
Ada 5 jenis visualisasi data di Python menggunakan Matplotlib
yang sering digunakan untuk menampilkan berbagai informasi
dari suatu dataset. Dan dalam diagram/grafik yang akan dibuat
yang perlu diperhatikan adalah beberapa syntax sebagai beikut :
1. Line Plot
2. Scatter Plot
3. Box Plot
4. Bar Plot
5. Hostogram
Keterangan :
 bar_labels: untuk menuliskan nama label pada bar plot
 axis: untuk mengatur sumbu pada plot
 barh :untuk membuat bar plot dalam posisi horizontal
 axes: untuk menambahkan sumbu dan menetapkannya
pada plot
17
 figtext: untuk menambahkan tulisan pada plot
 subplots: untuk membuat dan mengatur plot
 plt : untuk memanggil library matplotlib.pyplot, lalu
memanggil method plot()
 Figure: adalah objek matplotlib yang mengandung
semua elemen dari sebuah grafik
1) Line Plot
Line plot atau biasa dikenal dengan line chart adalah
jenis plot yang menampilkan informasi berupa rangkaian
titik data yang terhubung dengan segmen garis lurus.
Line plot dikenal sebagai jenis plot dasar dalam
visualisasi data. Plot yang satu ini dapat digunakan pada
dataset yang memiliki nilai kontinu untuk melihat
pergerakan data.
Gambar 2. 1 Line Plot (https://ilmudatapy.com/ )
2) Scatter Plot
18
Scatter plot merupakan jenis visualisasi data untuk
menunjukkan hubungan antara dua variabel. Dengan
menggunakan scatter plot, Anda dapat melihat distribusi
data dan bagaimana trennya. Anda juga bisa
menggunakan scatter plot untuk melihat hubungan dari
beberapa kelompok data dengan memberikan warna
yang berbeda untuk membedakan masing-masing
kelompok data.
Gambar 2. 2 Scatter Plot (https://ilmudatapy.com/ )
3) Box Plot
Box plot merupakan salah satu jenis visualisasi data
yang secara statistik merepresentasikan pendistribusian
data melalui lima dimensi utama, yaitu nilai minimum,
kuartil 1, kuartil 2 (median), kuartil 3, serta nilai

19
maksimum. Umumnya, box plot digunakan untuk
memeriksa keberadaan outlier dalam dataset.
Gambar 2. 3 Box Plot

4) Bar Plot
Bar plot atau bisa disebut juga dengan bar chart adalah
jenis plot yang direpresentasikan dengan bar, dimana
panjang bar adalah representasi dari ukuran sebuah fitur
atau variabel. Bar plot umumnya merepresentasikan
variabel numerik dan kategori yang dikelompokkan
dalam interval.
20
Gambar 2. 4 Bar Plot

5) Histogram
Jenis visualisasi data untuk merepresentasikan distribusi
frekuensi dari dataset numerik. Sumbu X
menggambarkan bin dari data point, sedangkan sumbu
Y merepresentasikan frekuensi atau banyaknya data
point pada setiap bin. Ukuran bin dapat disesuaikan
dengan tujuan agar distribusinya terlihat bagus. Namun,
default-nya Python akan membagi bin menjadi 10
bagian.
21
Gambar 2. 5 Histogram
2. Seaborn
Seaborn adalah library visualisasi data Python berdasarkan matplotlib.
Seaborn menyediakan antarmuka/ user interface tingkat tinggi untuk
menggambar grafik statistik yang menarik dan informative (‘Sandy Hardian
Susanto Herho, 2019’).
1) Heatmap plot
Heatmap adalah visualisasi atau pemetaan dengan
menampilkan data dengan representasi warna yang berbeda-
beda. Biasanya, semakin tinggi angka suatu kelompok data,
warnanya akan semakin gelap, umumnya disimbolkan
dengan warna merah. Meskipun dapat bermanfaat di
berbagai bidang seperti statistika, geografi, dan lain-lain,
saat ini, heatmap banyak digunakan untuk melacak aktivitas

22
pengguna sebuah situs. Heatmapping dilakukan berdasarkan
gerakan mouse yang dilakukan, seperti mengklik pada link,
tombol, hovering, maupun scrolling.
Ada beberepa perintah dasar dalam heatmap antara lain :
 import seaborn as sns : untuk memamasukan library
seaborn
 plt.figure: adalah objek yang mengandung semua
elemen dari sebuah grafik
 corr = df.corr(): digunakan untuk kondisi elemen dari
heatmap
 sns.heatmap: merupakan dictionary dari heatmap dari
library seaborn
2. Tenserflow
Tensorflow adalah sebuah framework machine learning yang
mungkin akan menjadi sahabatmu ketika kamu bermain dengan data
dan apabila kamu fans dari salah satu area di AI (artificial intelligence)
yaitu deep learning. Google meluncurkan TensorFlow untuk
memperkenalkan ekosistem yang menyediakan kumpulan alur kerja
untuk mengembangkan dan melatih model, untuk
mengimplementasikan Machine Learning di hampir semua aplikasi.
Sebenarnya, kita semua menggunakan TensorFlow begitu
sering tanpa menyadari bahwa penggunaannya: Google Foto atau

23
Google voice, kamu menggunakan model TensorFlow secara tidak
langsung, model tersebut bekerja pada kelompok besar perangkat keras
Google dan sangat kuat dalam tugas perseptual.
Machine Learning memiliki manfaat yang sangat besar bagi
banyak perusahaan. Sehingga, berbagai perusahaan dari berbagai
industri membutuhkan alat dan sumber daya untuk menerapkan ML dan
memecahkan masalah terbesar mereka. Dari bidang Healthcare hingga
social network dan e-commerce, TensorFlow digunakan oleh semua
orang dan untuk banyak hal! Berikut adalah beberapa contoh siapa yang
menggunakan Tensorflow:
1) Airbnb: Mengkategorikan Foto Tempat di Airbnb
2) Lenovo: Pengoptimalan TensorFlow untuk Prosesor Intel Xeon
yang Dapat Diskalakan
3) Coca-Cola: Machine Learning dengan TensorFlow yang
mendukung Bukti Pembelian seluler di Coca-Cola
4) Lenovo: Lenovo Intelligent Computing Orchestration
menggunakan TensorFlow untuk membantu mempercepat
revolusi cerdas
5) PayPal: Menggunakan TensorFlow untuk terus memantau
Deteksi Penipuan
6) GE: General Electric melatih jaringan saraf menggunakan
TensorFlow untuk mengidentifikasi anatomi pada MRI di otak

24
7) Twitter: Memberi Peringkat Tweet di timeline beranda dengan
TensorFlow
3. Python
Python adalah bahasa pemrograman interpretatif multiguna.
Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python
lebih menekankan pada keterbacaan kode agar lebih mudah untuk
memahami sintaks. Hal ini membuat Python sangat mudah dipelajari
baik untuk pemula maupun untuk yang sudah menguasai bahasa
pemrograman lain.
Dan python merupakan salah satu bahasa pemrograman yang
banyak digunakan oleh perusahaaan besar maupunpara developer
untuk mengembangkan berbagai macam aplikasi berbasis desktop,
web dan mobile.
Python diciptakan oleh Guido van Rossum di Belanda pada
tahun 1990 dan namanya diambildari acara televisikesukaanGuido
Monty Python’s Flying Circus. Van Rossum mengembangkan
Python sebagaihobi, kemudian Python menjadi bahasa pemrograman
yang dipakai secara luas dalam industri dan pendidikan karena
sederhana, ringkas, sintak sintuitif dan memiliki pustaka yang luas
(Schuerer & Maufrais 2010).
 Fremwork Python antara lain :

25
1) Aplikasi Web: Flask, Pyramid, Django, CherryPy
2) Aplikasi Mobile: Python for Android, pyqtdeploy, Kivy,
BeeWare
3) Aplikasi Desktop: PyGUI, PyQt5, Tkinter, wxPython
 Beberapa Fungsi Python antara lain :
1. Fungsi type
- object : objek yang hendak dicari tahu tipenya
- name : nama kelas, sebagai atribut name
- bases : tuple base class, sebagai atribut bases
- dict : dictionary dari body class, sebagai atribut dict
2. Fungsi Staticmethod
- function – fungsi yang akan diubah menjadi static method.
3. Fungsi Split
- separator – Bertindak untuk menentukan pembatas atau
pemisah
- maxsplit – Bertindak untuk menentukan jumlah maksimum
split. Nilai defaultnya -1
4. Fungsi Enumerate
- iterable: data iterable seperti list, string, tuple, dan lain – lain
- start :awal dari indeks
5. Fungsi Evav
26
- expression : string yang akan dievaluasi (diparsing) sebagai
ekspresi Python
- globals (opsional) : dictionary
- locals (opsional): dictionary
2.2.2 Tipe Machine Learning
Ada beberapa teknik yang dimiliki oleh machine learning, namun secara luas
memiliki dua teknik dasar belajar, yaitu supervised dan unsupervised dan beberapa
tehknik lainnya antara lain :
1. Suvervised Learning
Teknik supervised learning merupakan teknik yang bisa kamu terapkan
pada pembelajaran mesin yang bisa menerima informasi yang sudah ada
pada data dengan memberikan label tertentu. Diharapkan teknik ini bisa
memberikan target terhadap output yang dilakukan dengan
membandingkan pengalaman belajar di masa lalu.
Gambar 2. 6 Supervised Learning

(https://tinyurl.com/39rsjdyr)
27
Gambar diatas merupakan proses memulai penerapan dari suvervised
learning dimana ada tahapan proses data mentah atau raw data hingga
menjadi sebuah output. Dan digunakan dalam memprediksi pola dimana
pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk
adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita
memasukan data baru, setelah kita melakukan ETL (Extract Transform
Load) maka kita mendapat info feature dari sample baru tersebut.
1) Prediction
Prediction dianggap sebagai tindakan yang menjelaskan mengenai
masa mendatang. Prediction tentunya berbeda dengan menebak
secara sederhana, mempertimbangkan pengalaman, opini, dan
informasi lainnya dalam melakukan peramalan. Istilah yang
umumnya dikaitkan dengan ‘prediction’ adalah ‘forecasting’.
Meskipun banyak orang yang percaya bahwa kedua istilah itu
adalah sinonim, tetapi ada perbedaan tipis namun sangat penting
diantara keduanya. ’Prediction’ pada umumnya berbasis opini dan
pengalaman, ‘forecasting’ berbasis data dan model. Dalam
terminology data mining, ‘prediction’ dan ‘forecasting’ digunakan
secara sinonim, dan istilah prediksi digunakan sebagai penyajian
yang umum ‘( Victor Saputra Ginting, Kusrini Kusrini, Emha
Taufiq , yogyakarta )’ .
2) Regresi Linear
28
Regresi Linear merupakan solusi yang cocok untuk digunakan oleh
perusahaanmultiproduk karena dengan memperkirakan berbagai
kombinasi produk, perusahaan dapat memaksimalkan keuntungan
serta memperkirakan jumlah produksi yang tepat. Namun dalam
menerapkan regresi linear diperlukan pengetahuan mengenai
kombinasi produk yang tepat, target pasar, serta jumlah permintaan
terhadap produk itu sendiri (“Statistika Terapan untuk Ilmu-Ilmu
Sosial dan Ekonomi, By Zulkarnain Lubi, 2015,05”).
 Nilai data matematis linear
Regresi linear harus memodifikasi atau mengubah nilai data
secara matematis untuk memenuhi empat asumsi berikut:
a. Hubungan linier
Hubungan linier harus ada antara variabel independen dan
dependen. Untuk menentukan hubungan ini, ilmuwan data
membuat plot sebar—kumpulan acak nilai x dan y—untuk
melihat apakah nilai tersebut berada di sepanjang garis lurus.
Jika tidak, Anda dapat menerapkan fungsi nonlinier seperti akar
kuadrat atau log untuk membuat hubungan linier antara dua
variabel secara matematis.
b. Independensi residual
Ilmuwan data menggunakan residual untuk mengukur
akurasi prediksi. Residual adalah selisih antara data yang

29
diamati dengan nilai prediksi. Residual tidak boleh memiliki
pola yang dapat diidentifikasi. Misalnya, Anda tidak ingin
residual tumbuh semakin besar seiring berjalannya waktu. Anda
dapat menggunakan uji matematika yang berbeda, seperti uji
Durbin-Watson, untuk menentukan independensi residual. Anda
dapat menggunakan data dummy untuk mengganti variasi data
apa pun, seperti data musiman.
c. Normalitas
Teknik pembuatan grafik seperti plot Q-Q menentukan
apakah residual terdistribusi secara normal. Residual harus
berada di sepanjang garis diagonal di tengah grafik. Jika residual
tidak dinormalisasi, Anda dapat menguji data untuk pencilan
acak atau nilai yang tidak umum. Menghapus pencilan atau
melakukan transformasi nonlinier dapat mengatasi masalah
tersebut.
d. Homoskedastisitas
Homoskedastisitas mengasumsikan bahwa residual
memiliki varians atau standar deviasi yang konstan dari rata-rata
untuk setiap nilai x. Jika tidak, hasil analisis mungkin tidak
akurat. Jika asumsi ini tidak terpenuhi, Anda mungkin harus
mengubah variabel dependen. Karena varians terjadi secara
alami dalam set data yang besar, masuk akal untuk mengubah
30
skala variabel dependen. Misalnya, alih-alih menggunakan
ukuran populasi untuk memprediksi jumlah stasiun pemadam
kebakaran di sebuah kota, ukuran populasi mungkin dapat
digunakan untuk memprediksi jumlah stasiun pemadam
kebakaran per orang.
 Jenis Regresi linear
Beberapa jenis analisis regresi lebih cocok untuk menangani set
data yang kompleks daripada yang lain. Berikut adalah beberapa
contohnya.
a. Regresi linier sederhana
Regresi linier sederhana didefinisikan oleh fungsi linear:
β0 and β1 adalah dua konstanta yang tidak diketahui dan
mewakili kemiringan regresi, sedangkan ε (epsilon) adalah
istilah kesalahannya.
Yi = merupakan nilai variabel independen observasi ke – i.
β0 = merupakan parameter koefisien regresi.
X1 = merupakan nilai variabel independen ke-k, observasi
ke-i
∈1 =merupakan nilai random error
b. Regresi linier berganda

31
Dalam analisis regresi linier berganda, set data berisi
satu variabel dependen dan beberapa variabel independen.
Fungsi garis regresi linier berubah untuk memasukkan lebih
banyak faktor sebagai berikut:
Ketika jumlah variabel prediktor meningkat, konstanta β
juga meningkat.
Regresi linier berganda mencontoh beberapa variabel dan
dampaknya terhadap hasil.
c. Regresi logistik
Ilmuwan data menggunakan regresi logistik untuk
mengukur probabilitas suatu peristiwa terjadi. Prediksi
adalah nilai antara 0 dan 1. Angka 0 menunjukkan suatu
peristiwa yang tidak mungkin terjadi dan angka 1
menunjukkan kemungkinan maksimum bahwa peristiwa itu
akan terjadi. Persamaan logistik menggunakan fungsi
logaritma untuk menghitung garis regresi.
Di bawah ini adalah beberapa contoh:
1) Probabilitas menang atau kalah dalam pertandingan
olahraga
2) Probabilitas lulus atau gagal dalam ujian
3) Probabilitas sebuah gambar berupa buah atau hewan
2. Unsupervised Learning
32
Teknik unsupervised learning merupakan teknik yang bisa kamu
terapkan pada machine learning yang digunakan pada data yang tidak
memiliki informasi yang bisa diterapkan secara langsung. Diharapkan
teknik ini dapat membantu menemukan struktur atau pola tersembunyi pada
data yang tidak memiliki label.
Berikut adalah contoh aplikasi dari unsupervised learning:
1) Clustering
Clustering yaitu teknik machine learning untuk melakukan
pengelompokkan data tidak berlabel berdasarkan persamaan atau
perbedaannya. Contoh machine learning untuk analisis Clustering
adalah K-Means Clustering yang sering digunakan dalam
melakukan klasifikasi tingkat kerentanan, analisis kelompok
konsumen dan lain-lain. Algoritma K-Means merupakan salah satu
algoritma pengelompokkan (clustering) berbasiskan metode non-
hierarchy yang mempartisi data dan membentuk satu atau lebih
kelompok yang memiliki kesamaan (‘Hasanah, Ugiarto, &
Puspitasari, 2017; Purnawansyah, Haviluddin, Gafar, & Tahyudin,
2017; Putra, Santosa, & Kusumawardani, 2015’).
K-Means Clustering merupakan salah satu algoritma Machine
Learning khususnya Unsupervised Learning yang populer
digunakan. Dalam algoritma ini, kita akan akrab dengan nilai k yang
merupakan jumlah cluster yang akan dibentuk. Sebelum mulai

33
menggunakan k-Means, kita harus mendefinisikan nilai k terlebih
dahulu. Pada dasarnya, nilai k ini akan merujuk kepada jumlah
centroid (titik pusat dari setiap cluster) yang kita butuhkan di
dataset. Gambar di atas merupakan contoh penyebaran data sebelum
dan sesudah menggunakan algoritma K-Means dengan nilai k = 3.
Untuk melakukan clustering K- Means, kita memerlukan beberapa
tahapan, diantaranya adalah:
 Penentuan nilai k atau cluster yang akan dibuat
 Inisialisasi nilai centroid secara random
 Centroid merupakan nilai pusat (center) dari sebuah cluster.
Misalkan kita mengatur k = 3, maka akan terbentuk centroid C1,
C2, dan C3 secara random.
 Menetapkan setiap data point ke centroid terdekat
Tahapan ini akan melakukan perhitungan jarak pada setiap data
terhadap centroid yang telah dibuat menggunakan Euclidean distance.
 Menghitung ulang nilai centroid dari cluster yang baru terbentuk.
 Proses ini dilakukan dengan menghitung nilai mean dari setiap data
points di dalam cluster tersebut.
 Melakukan optimasi agar kriteria terpenuhi dengan mengulang step
3 dan 4.
34
Diagram di bawah ini adalah ilustrasi cara kerja Algoritma Clustering K-means:
Gambar 2. 7 Ilustrasi K-Means
Cara kerja algoritma K-Means dijelaskan dalam langkah-langkah di bawah
ini:
Langkah-1: Pilih angka K untuk menentukan jumlah cluster.
Langkah-2: Pilih titik K atau centroid secara acak.
Langkah-3: Tetapkan setiap titik data ke centroid terdekat, yang akan
membentuk cluster K yang telah ditentukan.
Langkah-4: Hitung varians dan tempatkan centroid baru dari setiap
cluster.
Langkah-5: Ulangi langkah ketiga, yang berarti menetapkan kembali
setiap titik data ke centroid terdekat baru dari setiap cluster.

35
Langkah-6: Jika ada penugasan ulang, lanjutkan ke langkah-4 jika
tidak, lanjutkan ke FINISH.
Langkah-7: Model sudah siap.
2) Asosiasi
Asosiasi yaitu salah satu jenis unsupervised learning yang
dilakukan untuk menemukan hubungan antar variabel dalam sebuah
dataset. Dalam data science, asosiasi sering dipakai untuk
merancang mesin penelusuran dan rekomendasi suatu barang.
3) Dimensionality Reduction
Adalah teknik yang digunakan untuk mengurangi jumlah
variabel atau feature data. Proses ini dilakukan karena kita data
dengan variabel yang sangat besar atau sering disebut dengan high
dimensional data. Data seperti ini lebih menantang jika dilakukan
pemodelan, sering disebut kutukan dimensionalitas (dimensionality
curse).
36
Gambar 2. 8 Unsupervised Learning (https://tinyurl.com/39rsjdyr )
Gambar diatas merupakan proses tahapan untuk melakukan
unsupervised learning dan dimana Algoritma ini menemukan pola
tersembunyi dalam data tanpa adanya perlakuan tangan manusia.
3. Semi-Supervised Learning
Jenis algoritma yang kedua adalah semi-supervised learning. Semi-
supervised learning pada dasarnya mirip dengan supervised learning.
Namun perbedaannya ada pada data yang berlabel dan tidak berlabel untuk
training data. Biasanya sejumlah kecil data yang berlabel dengan jumlah
besar data yang tidak berlabel. Adapun sistem yang berhasil menggunakan
metode ini mampu meningkatkan akurasi pembelajaran secara signifikan.

37
Gambar 2. 9 Semi-Supervised Learning (https://tinyurl.com/39rsjdyr )
Gambar tersebut merupakan algoritma semi-supervised learning dipilih
ketika data berlabel yang diperoleh membutuhkan sumber daya yang
terampil dan relevan untuk melatihnya atau belajar darinya. Semi-
supervised learning berguna apabila biaya pelabelan data dinilai terlalu
tinggi untuk melakukan labelling secara penuh. Contoh dari penggunaan
semi-supervised learning adalah adanya identifikasi wajah seseorang yang
ada di webcam.
4. Reinforcement Learning
Reinforcement learning adalah tipe algoritma machine learning yang
bisa membuat agent software dan mesin bekerja secara otomatis untuk
menentukan perilaku yang ideal sehingga dapat memaksimalkan kinerja
algoritmanya. Dalam beberapa tahun terakhir, penggunaan reinforcement
learning terus meningkat, contohnya DeepMind and the Deep Q learning
pada tahun 2014, AlphaGo di tahun 2016, dan OpenAI dan PPO di tahun
2017. Algoritma reinforcement learning didefinisikan sebagai metode
machine learning yang berkaitan dengan cara software agent mengambil

38
tindakan di environmentnya. Algoritma ini merupakan bagian dari metode
deep learning yang akan memaksimalkan sebagian reward kumulatif.
Gambar 2. 10Reinforcement learning ( https://tinyurl.com/39rsjdyr )
Gambar ini merupakan proses Pada metode machine learning jenis
Reinforcement learning , agen akan belajar mendapatkan reward sebesar-
besarnya (long term reward). Reward diperoleh berdasarkan aksi yang
dilakukan pada suatu kondisi (state). Setia aksi yang dilakukan nantinya
akan menciptakan perubahan state yang akan mempengaruhi reward
selanjutnya. Tujuan akhir dari reinforcement learning dalam permainan
game adalah menang
5. Self-Supervised Learning
Self-Supervised Learning merupakan salah satu teknik algoritma
machine learning. Model algoritma tersebut dilatih untuk mempelajari satu
bagian input dengan bagian input lainnya. Self-supervised learning juga

39
dikenal dengan sebutan predictive learning. Dalam prosesnya,
permasalahan yang tidak diawasi akan dilakukan transformasi menjadi
permasalahan yang diawasi dengan membuat label secara otomatis. Untuk
memanfaatkan data yang tidak berlabel sangat penting untuk menetapkan
tujuan dari data tersebut. Adapun tujuan dari self-supervised learning yaitu
untuk melakukan identifikasi dari bagian input yang tidak tersembunyi.
6. Multi-Instance Learning
Multi-instance learning menjadi jenis algoritma terakhir dalam machine
learning. Jenis yang satu ini mirip pula dengan konsep supervised learning
namun dengan problem tidak lengkapnya wawasan terhadap label contoh
pelatihan. Dalam supervised learning, setiap instance pelatihan diberi label
diskrit. Sebagai contoh di Multi-Instance Learning misalnya sebuah tas
diberi label positif jika setidaknya satu instans di tas itu positif, dan tas
diberi label negatif jika semua instans di dalamnya negatif. Tidak ada label
pada masing-masing instance. Tujuan MIL adalah untuk
mengklasifikasikan tas atau instance yang tidak terlihat berdasarkan tas
berlabel sebagai data pelatihan.
3.2.2 Metode Machine Learning
1. Segmentasi Data
Segmentasi merupakan pengelompokan konsumen menurut
aspek lokasi seperti tempat tinggalnya. Segmentasi satu ini tentu tidak
40
kalah penting dari lainnya mengingat kebutuhan maupun kegunaan
suatu produk dan jasa selalu akan berbeda-beda tergantung pada lokasi,
keadaan, maupun cuaca. Segmentasi data dapat melakukan tahapan
metode pada data engineering (“Pengenalan Pembelajaran Mesin dan
Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro, U”).
Dan data engineering merupakan salah satu sub bidang dari
Software Engineering yang berfokus pada praktik membangun dan
mendesain sistem guna mengumpulkan, menyimpan, dan menganalisis
data dengan jumlah yang besar. Dan data engineering adalah bidang
yang sangat luas dan bisa diterapkan dalam berbagai jenis industri.
Dengan adanya data engineer perusahaan akan bisa mengumpulkan data
dalam jumlah yang sangat besar dan memastikan data tersebut siap
digunakan oleh data scientist dan data analyst (“Pengenalan Data
Engineering,05,2018, Widya Accarya”).
2. Market Basket Analysis
Market basket analysis atau MBA adalah teknik penambangan
data yang digunakan oleh pengecer untuk meningkatkan penjualan
dengan lebih memahami pola pembelian pelanggan. Ini melibatkan
analisis kumpulan data besar, seperti riwayat pembelian, untuk
mengungkapkan pengelompokan produk, serta produk yang
kemungkinan akan dibeli bersama (“Pengenalan Pembelajaran

41
Mesin dan Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro,
U.”).
Penerapan market basket analysis atau MBA dibantu oleh
munculnya sistem point-of-sale (POS) elektronik. Dibandingkan
dengan catatan tulisan tangan yang disimpan oleh pemilik toko,
catatan digital yang dihasilkan oleh sistem POS memudahkan
aplikasi untuk memproses dan menganalisis data pembelian dalam
jumlah besar.
Implementasi market basket analysis atau MBA memerlukan
latar belakang statistik dan ilmu data, serta beberapa keterampilan
pemrograman komputer algoritmik. Bagi mereka yang tidak
memiliki keterampilan teknis yang dibutuhkan, ada alat komersial
yang tersedia.
3. Q-Learning
Q-Learning merupakan salah satu algoritma yang berada pada
kategori Reinforcement Learning alias Reinforced Learning. Model
yang digunakan untuk mengidentifikasi kebijakan pemilihan
tindakan untuk mengontrol domain Markovian secara optimal, atau
kumpulan data grafis tak terarah dari bidang acak. Algoritma secara
iteratif mendekati utilitas yang diharapkan dari tindakan saat ini dan
mengembangkan kebijakan dengan imbalan tertinggi (akurasi nilai
yang diharapkan) untuk status fungsi Q di masa mendatang.

42
Teknik ini banyak digunakan dalam perencanaan gerak dan
aplikasi berbasis navigasi di robotika, mobil dan video game.
Kelayakan setiap algoritma tergantung pada beberapa
pertimbangan, termasuk akurasi dan linieritas klasifikasi yang
diperlukan, waktu pelatihan dan jumlah parameter yang digunakan
untuk menghasilkan hasil yang sesuai (“Pengenalan Pembelajaran
Mesin dan Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro,
U.”).
Setiap model juga dapat membuat asumsi khusus untuk
mempercepat kinerja atau memberikan hasil yang bermanfaat.
Pengorbanannya paling baik dikembangkan setelah pemahaman
yang mendetail dan menyeluruh tentang cara kerja setiap model dan
persyaratan pembelajaran mesin dari kumpulan data
2.3 Prepocessing Data
Preprocessing merupakan proses awal yang akan mentransformasikan data
masukan menjadi data dengan format yang sesuai dan siap untuk diproses. Beberapa
contoh hal yang dilakukan dalam preprocessing meliputi berbagai proses yang
diperlukan. Penggabungan, pengubahan bentuk, ataupun pentransformasian data
sebagai cara untuk membersihkan, mengintegrasikan, mereduksi dan mendiskritisasi.
Lebih lanjut proses yang ada alam preprosesing dapat terdiri dari salah satu
kegiatan proses ataupun gabungan dari beberapa proses diatas. Proses yang ada
43
tergantung dari tujuan yang akan dicapai dalam preprocessing tersebut (Karthick &
Malathi, 2015). Pemilihan proses yang tepat perlu dilakukan mengingat karena proses
yang sesuai dalam tahapan preprocessing data akan meningkatkan performansi
klasifikasi (Raviya & Gajjar, 2019).
Data preprocessing biasanya digunakan pada aplikasi rule-based dan yang
berbasis database. Dalam machine learning, kegiatan ini sangat penting untuk
memastikan bahwa big data sudah diformat dan informasi yang dikandungnya dapat
ditafsirkan dan algoritma perusahaan.
Ada 3 tahapan utama Data Preprocessing sebagai berikut :
1. Data Cleaning
Dalam langkah data cleaning, data mentah akan dibersihkan melalui
beberapa proses seperti mengisi nilai yang hilang, menghaluskan noisy data,
dan menyelesaikan inkonsestensi yang ditemukan. Data juga bisa dibersihkan
dan dirapikan menggunakan segmen-segmen yang memiliki ukuran serupa lalu
dihaluskan (binning), dengan fungsi regresi linear atau berganda (regression),
atau dengan mengelompokkannya ke dalam kelompok data yang serupa
(grouping).
2. Data Integration
Data integration adalah tahap yang menggabungkan data dari berbagai
sumber menjadi satu kesatuan data (dataset). Dalam proses penggabungan

44
tersebut, data dengan format yang berbeda harus diubah terlebih dahulu ke
format yang sama. Secara keseluruhan, proses integrasi data ini ditujukan untuk
menyatukan dan membuat data menjadi lebih halus melalui upaya-upaya
sebagai berikut.
 Memastikan data memiliki format dan atribut yang sama
 Menghapus atribut yang tidak dibutuhkan dari semua sumber data
 Mendeteksi nilai data yang konflik
3. Data Transformation
Pada tahap ini, data akan dinormalisasi dan digeneralisasi. Normalisasi
data dilakukan untuk memastikan bahwa tidak ada data yang berlebihan,
sementara generalisasi data dilakukan untuk menyeragamkan data.
Data transformation memungkinkan Anda untuk mengubah struktur data,
format data, dan nilai data menjadi sebuah dataset yang sesuai untuk proses
mining ataupun algoritma yang sudah dirancang.
Terdapat setidaknya lima langkah yang dapat dilakukan dalam proses data
transformation, yaitu:
1) Agregation: Langkah untuk menggabungkan semua data dalam format
yang seragam.
2) Normalization: Langkah untuk mengubah data ke dalam skala yang
teratur sehingga dapat dibandingkan dengan lebih akurat.

45
3) Feature Selection: Langkah untuk menentukan variabel apa saja yang
paling penting untuk analisis, di mana variabel ini juga akan digunakan
untuk melatih model machine learning atau kecerdasan buatan.
4) Discreditization: Langkah untuk mengumpulkan data ke dalam interval
yang lebih kecil. Misalnya, saat menghitung latihan harian rata-rata,
Anda bisa mengelompokkannya menjadi 0-15 menit, 15-30 menit, dan
seterusnya, daripada menggunakan menit dan detik secara rinci.
5) Concept Hierarchy Generation: Langkah untuk menambahkan hirarki
baru di dalam dataset.

BAB III
GAMBARAN UMUM
BISA AI ACADEMY PT BISA ARTIFISIAL INDONESIA
Logo BISA AI (https://bisa.ai/ )
3.1 Sejarah Perusahaan
BISA AI merupakan start up yang mengembangkan layanan dan produk
seputar Artificial Intelligence yang didirikan pada tahun 2019. Layanan-
layanan yang pertama kali kembangkan oleh BISA Al diantaranya: Image
Recognition Service, Video Analytics Service Language Service, Data Analysis
Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama
46
47
dengan banyak perusahaan dalam menyelesaikan masalah melalui Artificial
Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.
Pada tahun 2020, BISA AI dapat fokus mengembangkan dua produk
utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya
sederhana, dengan BISA Tampil sebagai platform video conference dan BISA
AI Academy sebagai platform pembelajaran daring.
Namun akhirnya BISA AI berkembang dan memanfaatkan kesempatan
yang ada, ini menghasilkan diantaranya: BISA Tampil yang menjadi platform
kolaborasi dan penyelenggaraan webinar, bootcamp dan event online dan BISA
AI Academy yang selain menjadi platform pembelajaran daring, dapat menjadi
platform pencarian kerja, freelance, diskusi dan masih banyak lagi yang
lainnya.
Perkembangan BISA AI ini menandakan bahwa dari setiap langkah dan
kesempatan yang BISA Al raih dapat bermanfaat dan membantu masyarakat
dalam mencari ilmu, menyelesaikan masalah hingga meraih kesuksesan di
masa depan.
3.2 VISI MISI Bisa IA
Visi :
Menjadi startup terdepan di Indonesia di bidang pembelajaran AI.
Misi :
48
Mencerdaskan kehidupan bangsa dengan AI melalui pelatihan dan
webinar. Kami adalah start up yang mengembangkan layanan seperti
custom project di bidang Kecerdasan Artifisial guna memenuhi
kebutuhan masyarakat, industri dan pemerintah dan 2 produk seputar
Artificial Intelligence yang didirikan pada tahun 2019, seperti:
 Tampil yang menjadi platform kolaborasi dan penyelenggaraan
webinar,
 BISA AI Academy platform aplikasi pembelajaran daring yang
berisi pembelajaran Kecerdasan Artifisial dan subset-nya yang
dapat diakses melalui aplikasi Android dan iOS, juga.
3.3 Struktur Organiasi BISA AI Pada Tahun 2022
M. Octaviano
Pratama, S.Kom.,
M.Kom.
President Director
Pamela Kareen,
Ir. Wira Satywan,
S.T., M.Kom.
CISA., CISSP.
Operasional
Komisaris
Director
( Sumber : https://bisa.ai/ )
49
3.4 Lokasi BISA AI 2022
Denah lokasi BISA AI EduPlex Coworking Space Jl. Ir. H. Juanda
No.84, Lebakgede, Kecamatan Coblong, Kota Bandung, Jawa Barat
40132 .
Gambar 3. 1 Gambar Kantor BISA AI (https://bisa.ai/ )

BAB IV
PEMBAHASAN
Studi Independen Bersertifikat adalah bagian dari program Kampus Merdeka
yang bertujuan untuk memberikan kesempatan kepada mahasiswa untuk belajar dan
mengembangkan diri melalui aktivitas di luar kelas perkuliahan, namun tetap diakui
sebagai bagian dari perkuliahan. Program ini diperuntukkan bagi mahasiswa yang ingin
memperlengkapi dirinya dengan menguasai kompetensi spesifik dan praktis yang juga
dicari oleh dunia usaha dunia industri.
4.1 Kegiatan MSIB
Kegiatan MSIB ini terdiri dari beberapa kegiatan wajib yang
dilaksanakan pada PT BISA ARTFISIAL INDONESIA dan kegetian ini dibagi
menjadi 6 kegiatan antara lain ialah :
4.1.1 Pembelajaran Terjadwal
Mengikuti course wajib atau pilihan terkait masing - masing program
melalui pembelajaran tatap muka secara daring dengan instruktur.
Pelaksanaan selama 3 bulan pertama program melalui platform
TAMPIL ID (https://tampil.id) untuk pembelajaran tatap muka dan E-
Learning Bisa (https://elearning.bisaai.id) untuk bahan materi ajar.
Peserta diwajibkan mengambil minimal 2 Kelas Wajib, 1 Kelas Project
Capstone dan minimal 2 kelas Pilihan. maksimal kelas yang dapat
50
51
diambil mahasiswa adalah 10 kelas. Untuk mengambil pembelajaran
terjadwal, anda harus harus mengambil pembelajaran terjadwal melalui
https://msib.bisa.ai pada jadwal yang telah ditentukan (Rencana
Pengambilan Pembelajaran Terjadwal / RPPT). Anda dapat mencoba
kelas yang berjalan selama 1 minggu untuk kemudian dapat melakukan
add/drop RPPT. Pada minggu ke-2 kelas berjalan, anda tidak
diperkenankan mengganti kelas. Jumlah kelas yang anda ambil minimal
5 kelas dan maksimal 10 kelas pembelajaran terjadwal. Pada kelas :
 Kehadiran Pembelajaran terjadwal
 Studi Independen pada kelas
 Quiz, Pre-test, Post-test dan Tugas
 UAS / UTS / Project
Pembelajaran terjadwal yang telah di ikuti setiap masing masing
mahasiswa adalah 8 maksimal dan 6 minimal matakuliah dan yang telah
di ikuti ada 7 matakuliah ikuti antara lain :
1. Data Science
2. Project Capstone
3. Fullstack Development
4. Bisnis Startup
5. Image Procesing
6. Cyber Security
52
7. Cloud computing
4.1.2 Pembelajaran Mandiri
Mengikuti pembelajaran mandiri melalui MOOC (Massive Online Open
Courses) BISA AI Academy. Pelaksanaan selama 5 bulan SIB. Peserta akan
diarahkan untuk enroll course Gratis dan Premium dari Bisa AI Academy
(https://bisa.ai ), Bisa Design Academy (https://bisa.design ), Bisa Network
Academy (https://academy.bisa.network) dan Bisa Business Academy
(https://bisa.business ). Saat ini terdapat lebih dari +120 Learning Course
dan +20 Course Premium yang terdapat di seluruh platform digital Bisa AI
Academy yang dapat diikuti mahasiswa.
Dalam 1 periode SIB, anda diwajibkan mengambil minimum 10 Course
selama 1 semester. Komponen penilaian sebagai berikut:
 Jumlah Course mandiri yang diambil
 Nilai Quiz dan Tugas setiap course mandiri
Dalam pembelajaran , mandiri ini cukup sulit dalam pengisian silabus yang ada
karna sering terjadi perbedaan materi yang berbeda dengan soal yang di
terapkan dan kurang lengkap materi untuk pengisian dan adanya kurang jelas
pertanyaan soal yang ada. Dan beberapa lampiran sertifikat yang telah
didapatkan selama pembelajaran mandiri pada BISA AI.
Ada 10 course mandiri yang telah diikuti antara lain :
1. Manajamen Startup
53
2. Cloud Computing
3. Cyber Security Kali Linux
4. Data Science
5. Dasar – Dasar NodeJS
6. Image Processing
7. Pemrograman GO
8. Pengenalan Sistem Operasi Linux
9. Image Processing With OpenCV
10. Bisnis Startup Digital
Jadwal kegiatan yang telah dilaksanakan antara lain :
Tabel 4. 1Jadwal Kegiatan

Minggu/Tgl Kegiatan Hasil
Minggu ke 1 Kegiatan pada 15 Agustus 2022 hingga 19
15 - 19 Agustus 2022 para peserta MSIB BISA IA
Agustus 2022 melakukan pengisian KRS pada hari pertama
serta para mahasiswa mengambil mengambil
matakuiah yang diminati pada siakad masing
dan diberikan akses oleh para mentor yang
bertugas pada mitra BISA AI dan pada hari
kedua para peserta melakukan pembelajaran
mandiri dari course BISA AI seperti dasar
dasar python seperti pembelajaran dasar

54

seperti bilangan rekursif dan sebagainya, pada
hari Rabu merupakan libuar nasional
mempringati hari kemerdekaan republik Terlaksana
Indonesia . Pada hari, Kamis peserta MSIB
angkatan 2 dan 3 mengikuti acara kegiatan
pisah sambut MSIB angkatan 2 dan 3 , dan
peserta mengisi absen dan testimoni dari link
form kampus merdeka , dan pada hari, jumat
para peserta MSIB dari BISA AI melakukan
course secara mandiri seperti dasar-dasar
Python mengerjakan suatu project pada course
mandiri yang ada pada website Bisa IA dan
belajar materi yang akan diselenggarakan dan
melihat E- learning pada mitra BISA IA dan
melihat pembelajaran apa saja yang akan
dilakukan dan melihat materinya
Minggu ke-2 22 Pada hari Senin, 22 Agustus 2022 hingga
-26 Agustus jumat tanggal 26 agustus 2022 para peserta
2022 MSIB Bisa AI melakukan course terjadawal
dan course mandiri, dan pada hari Senin, 22

55

Agustus para peserta mengikuti kegiatan
onboarding MSIB batch 3 pada pagi dan
setelah kegiatan tersebut saya dan peserta
lainya mengikuti 2 kegiatan terjadwal yakni
fullstack programming dan memahami dasar
dari fullstack dengan materi dasar python dan
bisnis startup dengan materi dasar bisnis Terlaksana
startup, pada hari kedua tanggal , 23
Agustus 2022 para peserta mengikuti jadwal
materi Data Science dan mempelajari tentang
data science data analyst dan data engineer dan
mengisi soal pretest dan post test tentang
pemahaman materi masing masing data
science seperti apa itu data science. Pada hari
ketiga 24 Agustus 2022, saya mengikuti mata
kuliah Cloud Computing dari Cloud Huawei
dan mempelajari cara akses sebuah Cloud pada
huawei dan mengenal apa itu Cloud
Computing. Hari keempat 25 Agustus 2022
para peserta mempelajari matkul IOT dan

56

mengerti dasar, pengertian, alat, dan
konektivitas dari ioT agar bisa memahami apa
itu IOT para peserta juga mengikuti matkul
Project IA-Hacker dan mengambil tema dari
masing - masing kelompok memiliki tema
masing masing yang di minati sebanyak 3
orang dalam kelompok. Dan pada Jumat
tanggal 26 Agustus 2022 peserta MSIB BISA
IA mengikuti pembelajran tamu dengan tema
Design Engineering In Manufacture dan
mepelajari dasar dan struktur dari Manufacture
dari mentor dan pemahaman tentang industri
dari sebuah manufaktur dan ilmu design
engineering dari sebuah industri manufaktur.
Minggu ke-3 Laporan Senin, 29 Agustus hingga 03
29 September 2022 ialah pada senin saya
Agustus - 02 mengikuti pembelajaran Fullstack
September 2022 Development dan bisnis startup yaitu
mempelajari dari materi Fullstack
Development adalah tentang databse key

57

seperti MYSQL RDBMS struktur database Terlaksana
dengan DDL dan belajar membuat databse.
Dan yang kedua ialah bisnis startup yaitu para
peserta mempresentasikan sebuah pengertian
contohnya tentang metaverse edutech dan lain
lain . Pada hari Selasa, 30 Agustus saya
mengikuti course terdawal yaitu Data Science
dan mempelajari tentang python .dasar dan
juga memahami apa itu python . dan juga
saya dan peserta lainya mengerjakan
latihan sebanyak 10 soal deng google colab
contohnya membuata data diri dengan python
colab dan materi lainnya. Dan pada Rabu, 31
Agustus aya belajar tentang materi Cloud
Computing dengan menggunakan sistem
operasi linux secara basic dan memahami
apaitu linux dan cara penggunaanya
bagaimana dan cara mengisntal sebuah sistem
cloud pada linux dengan metode CMD
kedalam sebuh cloud. Dan selanjutnya pada

58

Kamis, 01 September saya mengikuti
pembelajaran project AI-Hacker yaitu setiap
kelompok mempresentasikan tema dari setiap
kelompok yang ada dan program apa yang
ingin dibuat untuk project akhir, dan pada
pertemuan kedua saya mengikuti pembelajaran
image processing memperlajari tentang
operasi dasar citra digital dan mempelajari
berbagai level pada dasar citra digital dan
mengenal berbagai level citra digital seperti
pembelajran tentang pixel dan mempelajari
berbagai operasi yang ada pada image
processing contohnya operasi aritmatika. Dan
pada Jumat, 02 September saya melakukan
pembelajaran mandiri yaitu course mandiri
dengan pembelajaram materi machine learning
yang pada pada course academy BISA AI
.dengan pembelajaran dasar dasar machine
learning dan decision tree dan cara
pemahaman tentang machine learning. Dan

59

pada Sabtu, 03 September saya mengikuti
pembelajaran Cyber Security dan memelajari
tentang dasar dari system oprasi linux dan cara
penggunaanya.
Minggu ke-4 05 Laporan minggu ke 4, pada Senin, 05
- 09 September September saya mengikuti pembelajaran
2022 Fullstack Development dan mempelajari
tentang pembuatan database dengan
phpmyadmin dengan membuat database
CRUD dan di buat menggunakan dengan
python PYSQL dengan JSON, dan pada
pembelajaran kedua saya mengikuti Terlaksana
pembelajaran bisnis startup yaitu sertai
kelompok mempresentasikan hasil dikusi
tentang startup GoTo dan BMC nya
mengetahui apa iru GoTo dan pada Selasa, 06
September 2022 saya mengikuti pembelajaran
data science dan saya mempelajari tentang
python dengan tema Exploratory Data
Analysis dan para peserta dapat bisa

60

memmahami apa itu EDA (Exploratory Data
Analysis) dalam python dan mempraktekan
dara penggunaan dari EDA itu sendiri. Hari
ketiga saya mengikuti pembelajaran Cloud
Computing dan mempelajari cara mengakses
sebuah database dan membuat sebuah database
pada phpmyadmin setelah itu membuat akses
dengan code data python degan akses cmd dan
membuat sebuah API pada postman dengan
quary yang ada pada databse phpmyadmin dan
pada Kamis, 08 September 2022 saya
mengikuti pembelajaran IOT pada pertemuan
pertama dan mempelajari tentang kontrol
urdino, dan pada pertemuan kedua saya
megikuti pembelajaran project AI-Hacker dan
masing masing kelompok menjelaskan tentang
prototype program kelompok masing masing
dan pertemuan trakhir adalah mempelajari
tentang Image Processing mempelajari citra
warna sebuah digital . dan pada Jumat, 09

61

September 2022 saya melakukan pembelajaran
mandiri yaitu mengerjakan course secara
mandiri yang saya kerjakan Ialah Image
Processing dan Data Science dan saya
mengerjakan silabus yang ada dan
mempelajari kuis dan tugas akhir yang akan
dikerjakan selanjutnya.
4.1.3 Pembelajaran Tamu
Peserta diarahkan untuk mengikuti webinar dengan narasumber industri,
dan dilaksanakan setiap hari mengikuti minat peserta akademisi dan pelaku
bisnis serta mitra BISA AI Academy melalui https://tampil.id. Pelaksanaan
program selama 5 bulan SIB dan komponen penilaian sebagai berikut:
 Jumlah webinar yang diambil / diikuti

62
 Durasi mengikuti webinar / keaktifan mengikuti webinar
Gambar 4. 1 Pembelajaran Tamu (https://bisa.ai/ )
4.1.4 Project Capstone
Proyek Capstone, yaitu mengerjakan proyek pada masing - masing
program. Proyek Industri yang diberikan adalah proyek Riil/case study
terkait dengan 8 Aktivitas yang diikuti oleh mahasiswa. proyek ini
diberikan dengan tujuan mahasiswa memiliki gambaran dan pengalaman
proyek pada startup digital. Pelaksanaan selama 3 bulan SIB dan project
capstone ini dilaksanakan pada hari kamis pada pukul 15:30 – 17:30 .
Project Capstone akan diampu oleh 2 mentor untuk setiap aktivitas. Peserta
dapat secara aktif diskusi / share progress setiap minggu-nya. Komponen
penilain secara umum:
• Weekly meeting / cek progress rutin
• Proses dan Luaran project capstone
• Keaktifan peserta
63
Ada 8 Aktifitas yang dilakukan oleh proyek ini antara lain :
1. Pertemuan mingguan
2. Progress yang akan dipilih dengan tema yang akan dipilih
3. Diskusi project yang akan dibuat bersama kelompok
4. Pelaporan project yang dipilih
5. Membuat dataset melalui riset dan survei
6. Proses bimbingan progress dengan mentor
7. Pelaporan hasil project yang telah dibuat
8. Mengumpulkan project akhir dalam bentuk laporan hasil project
4.1.5 Membangun Digital Startup
Dimana mahasiswa didorong untuk membuat bisnis plan hingga
membuat startup digital terkait dengan 8 aktivitas program. Startup digital
yang dibangun nantinya akan diberikan fasilitas pembuatan startup seperti
Cloud, fasilitas legal, dan pendanaan. Pelaksanaan selama 2 bulan SIB
kegiatan ini di lakukan pada senin pukul 19;00 – 21:00 wib .
Program yang kelompok kami kembangkan untuk digitak startup ialah NFT
Gaming program yang berbentuk uang kripto dengan bermain game atau
disebut dengan play-to-earn. Untuk mendapatkan uang dengan bermain
game, sangat bervariasi tergantung dari jenis permainan yang kamu pilih.
Pitching deck NFT(Non Fungible Token ) Gaming antara lain :

64
a. NFT dalam game dapat memperkaya tingkat engagement para
gamer, terutama seseorang yang sudah lama memainkan game
tersebut.
b. Game NFT dapat memberi pemain prospek pendapatan yang
substansial. Artinya peluang untuk menghasilkan pendapatan yang
luar biasa akan menarik banyak gamer ke dunia game NFT.
c. Nilai token kepemilikan dalam game dapat meningkat seiring
dengan peningkatan minat
Mockup & Prototype sebagai berikut :
Gambar 4. 2 Tampilan Mockup & Prototype menu 1

65
Gambar 4. 3 Tampilan Mockup & Prototype menu 2
4.1.6 Rangkaian Pembelajaran Terjadwal Pada AI Hacker
Pada pembelajaran terjadwal ini mengikuti pembelajaran yang telah
memilih dalam sesi pemilihan mata kuliah yang diambil pada siakad Bisa AI
da nada beberapa pembelajaran wajib yaitu data science dan fulstack
development dan 1 project capstone pembelajaran project .
Dan pembelajaran pilihan merupakan pembelajaran yang dipiliah oleh
mahasiswa masing masing yang diminati. Peninalaian yangmengenai pengajar
cukup baik dan beberapa yang menurut kurang baik antara lain mentor dari
bisnis start up digital. Dan ada beberapa pilihan jurusan pada BISA
ARTIFISIAL INDONESIA antara lain sebagai berikut :
1. AI-Hacker
Pada bidang Hacker merupakan bidang yang bergerak dibidang
teknologi informasi dimana teknologi kecerdasan keamanan jarring
dan big data.

66
2. AI-Game
Bidang ini bergerak di bidang teknologi kecerdasan dalam bentuk
game dan perngkat lunak dalam pembuatan game.
3. AI-Hipster
Hipster memastikan praktik pemasaran, branding¸ dan tampilan
produk dapat memberikan kepuasan terbaik bagi pengguna. Hipster
lebih fokus dalam melahirkan inovasi baru dari setiap produk yang
dimiliki.
4. AI-Hustler
Hustler merupakan orang yang berperan dalam memastikan
keuntungan perusahaan. Hustler harus memiliki visi jangka pendek
dan jangka panjang dan jeli dalam melihat peluang. Hustler
berperan dalam membangun tim, mengelola seluruh pekerjaan,
membentuk model bisnis, dan memimpin tim. Biasanya, peran
hustler disebut juga sebagai CEO.
5. AI-Manufacture
Bidang Proses manufaktur sendiri merupakan sebuah kegiatan atau
proses produksi mengubah bentuk bahan baku menjadi bahan jadi.
Adapun proses manufaktur berawal dari mendesain produk,
menentukan spesifikasi bahan dari mana produk tersebut dibuat.

67
6. AI- BLOCKCHAIN
Pada bidang Blockchain seperti Blockchain Development,
Blockchain Data Analytics dan Blockchain Bisnis. Selama proses
Studi Independen Bersertifikat, para peserta akan mengikuti
berbagai kegiatan seperti pembelajaran terjadwal, pembelajaran
mandiri, pembelajaran tamu industri mitra BISA AI Academy,
proyek industri.
7. AI- Infra
Bidang Infrastruktur jaringan merupakan sebuah kumpulan sistem
komputer yang saling berhubungan, dihubungkan oleh berbagai
macam bagian dari sebuah arsitektur telekomunikasi. Secara
khusus, infrastruktur ini mengacu pada organisasi dan berbagai
bagian konfigurasi dari jaringan komputer individu sampai pada
router, kabel, wireless access point, switch, backbone, network
protocol, dan network access methodologies.
4.2 Lingkup Pekerjaan
Seorang mentoring akan mendampingi kurang lebih 18 - 40 peserta
MSIB (mahasiswa) dalam satu kelas. Terdapat dua jenis fasilitator,
yakni:
a) Homeroom Mentoring
68
Homeroom mentoring bertugas menyampaikan materi tentang
dasar-dasar AI, memberikan penilaian pada peserta dan
membimbing peserta saat pengerjaan Proyek Akhir (PA).
b) Domain Mentoring
Domain mentoring bertugas menyampaikan materi tentang
domain AI dan memberikan penilaian pada peserta. Lingkup
pekerjaan peserta adalah mengikuti kelas bersama homeroom
mentoring atau domain coach dan mengerjakan semua
assessment yang diberikan sesuai agenda kelas hingga program
selesai.
c) Deskripsi pekerjaan
 Kehadiran pembelajaran terjadwal
 Study independen pada kelas
 Quiz,pre-test,post-test,dan Tugas
 UAS/UTS dan project
 Pembelajaran tamu
 Pembelajaran mandiri
 Project capstone
 Membangun startup digital

69
4.3 Rincian Program
BISA AI merupakan start up yang mengembangkan layanan dan produk
seputar Artificial Intelligence yang didirikan pada tahun 2019. Layanan-
layanan yang pertama kali kembangkan oleh BISA Al diantaranya: Image
Recognition Service, Video Analytics Service Language Service, Data Analysis
Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama
dengan banyak perusahaan dalam menyelesaikan masalah melalui Artificial
Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.
4.4 Tujuan Program
Tujuan yang diharapkan setelah peserta mengikuti program ini adalah:
1. Memiliki wawasan tentang AI dan perkembangannya.
2. Mampu merancang dan mengimplementasikan AI Project
Cycle.
3. Mampu menggunakan bahasa pemrograman Python untuk
mengembangkan aplikasi AI.
4. Mampu mengembangkan salah satu dari 4 domain AI (DS, NLP,
CV, RL) hingga tahap deployment.
5. Mampu menggunakan soft skills dan hard skills dalam dunia
industri dan lingkungan perusahaan.
6. Mampu mengaplikasikan kiat-kiat yang dibutuhkan seorang
wirausahawan yang bergerak di bidang start-up dalam

70
mentransformasikan ide ke dalam bentuk produk/jasa sehingga
dapat menciptakan peluang bisnis yang terus berinovasi,
berevolusi, dan berkelanjutan.
4.5 Uraian Tugas Peserta
Dalam hal ini ada beberapa tugas yang di lakukan oleh peserta MSIB
antara lain :
1. Kehadiran pembelajaran terjadwal
2. Study independen pada kelas
3. Quiz,pre-test,post-test,dan Tugas
4. UAS/UTS dan project
5. Mengikuti program dari awal hingga selesai.
6. Mematuhi aturan program.
7. Mematuhi aturan kelas yang dibuat bersama oleh peserta dengan
homeroom mentoring atau domain mentoring.
8. Mengikuti kelas daring secara aktif dengan presensi minimal
85%.
4.6 Membuat Project Akhir Segmentasi Alokasi Dana Pelanggan
Segmentasi pelanggan adalah suatu cara untuk mengelompokkan
pelanggan ke dalam beberapa kelompok (cluster) dan setiap kelompok
memiliki beberapa anggota dengan karakteristik. yang sama. Usaha untuk

71
mengklasifkasikan objek-objek dengan suatu kesamaan ke dalam satu grup
tersebut juga dapat dikatakan sebagai clustering. Analisis cluster akan
membangun suatu cluster yang baik ketika setiap anggota dari clustermemiliki
derajat kesamaan yang tinggi dalam proses membuat segmentasi ini adalah
sebagai berikut:
4.6.1 Mempersiapkan Library Yang Dibutuhkan
Persiapkan berbagai library yang akan digunakan seperti Pandas, NumPy,
Scikit-learn, dan Matplotlib
Source Code :
import numpy as np
from google.colab import drive
import tensorflow as tf
import tensorflow.keras
import pandas as pd
4.6.2 Set Hyperparameter dan Mempersiapkan Dataset
Disini mempersiapkan beberapa variabel hyperparameter dan dataset yang telah
kami dapatkan dengan cara mengunggahnya pada platform Google Colab. Dataset
yang berupa csv, harus diubah dulu kedalam bentuk DataFrame menggunakan
library Pandas.
Source Code :
72
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Family Income and
Expenditure.csv')df
Gambar 4. 4 Tampilan Dataset
Keterangan :
df = pd.read_csv : perintah untuk menampilkan dataset csv kedalam bentuk data
tabular atau dataframe.
4.6.3 Preprocessing Data
Preprocessing Data ini adalah proses dimana data yang berupa objek akan
mengalami proses encoding menjadi atribut baru dengan nilai 0 atau 1. Lalu,
data akan dipetakan dan dicari korelasi antar atriburnya. Data yang kosong dan
berelasi rendah akan dibersihkan.
Source code :
73
df = pd.DataFrame({'Total Household Income':[int(x) for x i
n df[['Total Household Income']].values],
'Communication Expenditure':[int(x) for
x in df[['Communication Expenditure']].values],
'Housing and water Expenditure':[int(x)
for x in df[['Housing and water Expenditure']].values],
'Miscellaneous Goods and Services Expend
iture':[int(x) for x in df[['Miscellaneous Goods and Servi
ces Expenditure']].values],
'Clothing, Footwear and Other Wear Expen
diture':[int(x) for x in df[['Clothing, Footwear and Other
Wear Expenditure']].values],
Gambar 4. 5 Prepocessing Data

74
Keteragan :
df = pd.DataFrame : perintah untuk menampilakn tabular data
[int(x) for x in : Perulangan for akan dijalankan sebanyak jumlah elemen yang
ada di dalam variable dan int merupakan tipe data integer yang merupakan bilanagan
bulat.
4.6.4 Otomatisasi Mencari Korelasi Tertinggi dengan Atribut Dependent
Algoritma akan mencari dan menyimpan n (jumlah atribut) atribut dengan korelasi
tertinggi dari antara atribut dengan atribut dependent yang dipilih. Dengan
menggunakan saborn HeatMap :
Source Code :
import seaborn as sns
plt.figure(figsize=(20,20))
corr = df.corr()
75
sns.heatmap(corr, annot=True)
Gambar 4. 6 Tampilan Korelasi Heatmap
Index data frame HeatMap object diatas antara lain :
Total Household Income', 'Region', 'Total Food Expenditure',
'Main Source of Income', 'Agricultural Household indicator',
'Bread and Cereals Expenditure', 'Total Rice Expenditure',
'Meat Expenditure', 'Total Fish and marine products
Expenditure', 'Fruit Expenditure', 'Vegetables Expenditure',
'Restaurant and hotels Expenditure', 'Alcoholic Beverages
Expenditure', 'Tobacco Expenditure', 'Clothing, Footwear and
Other Wear Expenditure', 'Housing and water Expenditure',

76
'Imputed House Rental Value', 'Medical Care Expenditure',
'Transportation Expenditure', 'Communication Expenditure',
'Education Expenditure', 'Miscellaneous Goods and Services
Expenditure', 'Special Occasions Expenditure', 'Crop Farming
and Gardening expenses', 'Total Income from Entrepreneurial
Acitivites', 'Household Head Sex', 'Household Head Age',
'Household Head Marital Status', 'Household Head Highest Grade
Completed', 'Household Head Job or Business Indicator',
'Household Head Occupation', 'Household Head Class of Worker',
'Type of Household', 'Total Number of Family members',
'Members with age less than 5 year old', 'Members with age 5 -
17 years old', 'Total number of family members employed',
'Type of Building/House', 'Type of Roof', 'Type of Walls',
'House Floor Area', 'House Age', 'Number of bedrooms', 'Tenure
Status', 'Toilet Facilities', 'Electricity', 'Main Source of
Water Supply', 'Number of Television', 'Number of CD/VCD/DVD',
'Number of Component/Stereo set', 'Number of
Refrigerator/Freezer', 'Number of Washing Machine', 'Number of
Airconditioner', 'Number of Car, Jeep, Van', 'Number of
Landline/wireless telephones', 'Number of Cellular phone',
'Number of Personal Computer', 'Number of Stove with Oven/Gas
Range', 'Number of Motorized Banca', 'Number of
Motorcycle/Tricycle'], dtype='object'))
Data yang diambil sebagai data frame utama antara lain :

77
1. Total Household Income Communication Expenditure
Tabel 4. 2 Household Income

No Income Expenditire
0 480332 2880
1 198235 5700
2 82785 420
3 107589 660
4 189322 2100
... ... ...
41539 119773 600
41540 137320 1560
41541 133171 1080
41542 129500 1020
41543 128598 960
2. Housing and water Expenditure
Tabel 4. 3 Housing
No Expenditure
0 63636
1 41370
2 14340
78
3 16638
4 31122
... ...
41539 18372
41540 17640
41541 9240
41542 12438
41543 11316
3. Miscellaneous Goods and Services Expenditure
Tabel 4. 4 Miscellaneous
No Expenditure
0 34056
1 9150
2 6450
3 3762
4 8472
... ...
41539 3978
41540 6090
41541 3570
79
41542 5760
41543 6060
4. Clothing, Footwear and Other Wear Expenditure
Tabel 4. 5 Clothing, Footwear

No Expenditure
0 4607
1 8230
2 2735
3 1390
4 4620
... ...
41539 1395
41540 3136
41541 2460
41542 3755
41543 2320
80
Keterangan :
Expenditure atau biasa disebut dengan pembayaran yang dilakukan pada saat
ini untuk digunakan kewajiban pada masa yang akan dating dimana total
pemasukan dari pelanggan.
4.6.5 Menentukan Jumlah Segmentasi secara Otomatis dengan Metode
Elbow dan K-Means
Algoritma akan mencari dan menyimpan jumlah segmentasi yang
optimal berdasarkan signifikasi jarak antara jumlah segmentasi yang di
inputkan oleh secara otomatis. Dan untuk menampilkan diagram Inertia.
Metode Elbow merupakan salah satu metode untuk menentukan jumlah
cluster yang tepat melalui persentase hasil perbandingan antara jumlah cluster
yang akan membentuk siku pada suatu titik . Jika nilai cluster pertama dengan
nilai cluster kedua memberikan sudut dalam grafik atau nilainya
Source Code :
from sklearn.cluster import KMeans
wcss = []
for i in range(1,11):
kmeans = KMeans(n_clusters=i, init='k-
means++', random_state=42)
kmeans.fit(df)
wcss.append(kmeans.inertia_)
print(wcss)
81
plt.plot(range(1,11),wcss)
plt.title('Inertia')
plt.xlabel('n_clusters')
plt.ylabel('inertia')
plt.show()
Gambar 4. 7 Tampilan Diagram Inertia
4.6.6 Menampilkan Total Income Pada Segmentasi Dari Data Diagram
Heatmap
Tampilan ini untuk digunakan sebagai segmentasi ke dalam bentuk label
scatter menjadi bentuk 6 warna yang berbeda menjadi 3 Total Household
income . dan menggunakan diagram scatter plot dari data yang telah dipilih
sebagai clustering dan di prediksi ke dalam bentuk diagram .

82
Source code :
for i in [x for x in df.columns if (x!='Total Household Inc
ome' and x!='label')]:
for x in pd.unique(df['label']):
plt.title('Total Household Income with '+i)
plt.xlabel('Total Household Income')
plt.ylabel(i)
plt.scatter(df['Total Household Income'][df.label == x
], df[i][df.label == x])
plt.legend([1,2,3,4,5], loc = 'center right')
plt.show()
Gambar 4. 8 Tampilan Scatter Plot Total Household 1

83

84
4.6.7 Clustering Data
Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih
akan dipasangkan dan mengalami klusterisai atau segmentsai dengan algoritma
K-Means. Visual dari data yang telah mengalami segmentasi akan ditampilkan.
Souce code :
data_needed = {y : [float(x) for x in df[[y]].values] for
x,y in tmp}
data_needed[benchmark] = [float(x) for x in df[[benchmark]
].values]
data_needed
df = pd.DataFrame(data_needed )
df
Gambar 4. 11 Hasil Clustering

85
4.6.8 Prediksi Linear Data
Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih
akan dipasangkan dan akan dicari regresi linearnya dengan algoritma Linear
Regression-Means. Visual dari data dan regresi linearnya beserta dengan
MSE (Mean Square Error) akan ditampilkan. Dan 4 tampilan dari diagram
scatter plot. Dari total household income dari data yang telah di regresi dari
metriks dan linear data .
Souce code :
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import MinMaxScaler
divider = int(len(df)*0.8)
for x in [y for y in df.columns if y != 'label' and y
!='Total Household Income']:
mms = MinMaxScaler()
df_x_train = df[['Total Household
Income']].iloc[:divider]
df_y_train = df[[x]].iloc[:divider]
df_x_test = df[['Total Household
Income']].iloc[divider:]
df_y_test = df[[x]].iloc[divider:]
lr = LinearRegression()
86
lr.fit(df_x_train,df_test)
mms = mms.fit(df_y_test)
df_y_test = mms.transform(df_y_test)
df_y_pred = mms.transform(lr.predict(df_x_test))
mse = mean_squared_error(df_y_test, df_y_pred)
plt.scatter(df[['Total Household
Income']].iloc[divider:], df[[x]].iloc[divider:])
plt.plot(df_x_test,lr.predict(df_x_test), color =
'red')
plt.xlabel('Total Household Income')
plt.ylabel(x)
plt.show()
print(f'MSE : {mse}')
lr.predict(df[[x]].iloc[divider:])
Gambar 4. 12 Linear Total Household Income Communication Expenditure

87
Gambar 4. 13 Linear Housing and water Expenditure
Gambar 4. 14 Linear Miscellaneous Goods and Services Expenditure

88
Gambar 4. 15 Linear Clothing, Footwear And Other Wear Expenditure
4.6.9 Data HeatMap Seaborn Uraian
Data heatmap yang telah di uraikan menjadi 4 bagian disesuaikan dengan
data pilihan yang telh dipilih sebagai data frame utama antara lain adaalah
Source code :
import seaborn as sns
corr = df.corr()
sns.heatmap(corr, annot=True)
p = []
for y in range(len(df.corr()[benchmark])):
89
tmp.append((abs(df.corr()[benchmark][y]),df.corr().c
olumns[y])) if df.corr().columns[y]!=benchmark else No
ne
tmp = list(filter(lambda x : not np.isnan(x[0]) ,tmp))
tmp.sort(key = lambda x : x[0], reverse=True)
tmp = tmp[:top_feature]
tmp
Gambar 4. 16 Hetamp 00 hingga 1.00 warna terang

90
Gambar 4. 17 Heatmap 00 hingga 1.00 warna gelap
Keterangan warna gelap dan terang pada heatmap :
Heatmap disebut juga visualisasi atau pemetaan dengan menampilkan data
dengan cara representasi warna yang berbeda-beda. Biasanya pada heatmap
semakin tinggi angka suatu kelompok data maka warnanya akan semakin
gelap dan umumnya disimbolkan dengan warna berwarna merah.

BAB V
PENUTUP
1. Kesimpulan
Dari hasil penelitian segmentasi prediksi dan klasterisasi data
engginerring ini di manfaatkan untuk pengetahuan tentang segmentasi dengan
metode prediksi dan klasterisasi data engineering alokasi dana pelanggan pada
study independen bersertifikat yang dilaksanakan pada PT BISA ARTIFISIAL
INDONESIA yang di gunakan sebagai projek akhir kelulusan study
independen.
Berdasarkan hasil penulisan diatas maka didapatkan hasil sebagai berikut:
1. Program MSIB ini adalah salah satu terobosan yang bagus untuk
memajukan pendidikan di Indonesia terutama bagi kalangan
mahasiswa. Dengan adanya kegiatan ini dapat mempermudah
mahasiswa untuk menyalurkan minatnya di bidang yang dituju.
2. BISA AI Academy (PT BISA ARTIFISIAL INDONESIA) merupakan
startup digital berbasis education technology (edutech) yang fokus pada
pembelajaran terkait Kecerdasan Artifisial (AI), Ilmu Data (Data
Science) dan subset lainnya. Selamat Datang di BISA AI Academy E-
Learning, E-learning ini akan menjadi penunjang Pembelajaran
Terjadwal di kegiatan program Magang Bersertifikat dan Studi
Independen Bersertifikat.
91
92
3. Sebagaimana hasil penelitian ini berhasil membuat sebuah project yaitu
segmentasi data engineering alokasi dana pelanggan dengan metode
prediksi dan klasterisasi.
2. Saran
Secara keseluruhan program sudah berjalan dengan baik dan para mentor juga
memiliki kapabilitas sesuai dengan keahlian masing-masing. Namun ada
beberapa masukan yang bisa dipertimbangkan diantaranya:
1) Untuk recording kadang lambat dalam pengaupload .
2) Ketika ada kelas yang setiap harinya 2-4 jam terlalu lama sehingga bisa
menyebabkan mahasiswa menjadi bosan dan tidak fokus lagi
memperhatikan materi yang disampaikan.
3) Untuk BISA AI diutamakan untuk lebih memperhatikan course yang di
berikan agar lebih di perbaiki lagi untuk soalnya.
4) Bagi kampus Universitas Aki Untuk lebih memperhatikan dalam
pemilihan bagi mahasiswa yang masuk dalam MSIB melaui mitra.

93
DAFTAR PUSTAKA
ActiveState. (2021). What Is Scikit-Learn In Python? Activestate.Com.

https://www.activestate.com/resources/quick-reads/what-is-scikit-
learn-in-python/
Afifah, L. (2020a). 3 Metode Normalisasi Data (Feature Scaling) di Python.

Imudatapy.Com. https://ilmudatapy.com/metode-normalisasi-data/
Afifah, L. (2020b). 5 Jenis Visualisasi Data Populer di Python dengan Matplotlib.

Https://Ilmudatapy.Com/. https://ilmudatapy.com/visualisasi-data-di-
python-dengan-matplotlib/
Aminuddin, J., Sehah, F.P. Zen, and H. Latief, 2008, Numerical Solution of Basic
Korteweg de Vries, Conference on Computational, Computing and Non Linear
Science, LIPI, Jakarta, Indonesia.
Aulia, P. U. F., & Saepudin, S. (2021). Penerapan Data Mining K-Means Clustering
Untuk Mengelompokkan Berbagai Jenis Merk Laptop. Sismatik
(Seminar Nasional Sistem Informasidan Manajemen Informatika), 209–
2017.
Barus, S.P. (2021). Implementation of Naïve Bayes Classifier-based Machine Learning
to Predict and Classify New Students at Matana University. Journal of Physics:
Conference Series 1842 (1), 012008
Edwardo, T. O. (2018). Penggunaan Python untuk Data Mining. Binus University

School of Computer Science.
Gartner. (2018). Gartner Says Global Artificial Intelligence Business Value to Reach
$1.2 Trillion in 2018. https://www.gartner.com/en/new sroom/press-
releases/2018-04-25-gartner-says-global-artificialintelligence-business-value-
toreach-1-point-2-trillion-in-2018.
Gustientiedina, Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma K-Means

Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru. Jurnal
Nasional Teknologi Dan Sistem Informasi, 05(01), 17–24. Hall
International, Inc
94
Harahap, B. (2019). Penerapan Algoritma K-Means Untuk Menentukan Bahan

Bangunan Laris (Studi Kasus Pada UD. Toko Bangunan YD Indarung).
READY-STAR (Regional Development Industry & Health Science,
Technology and Art of Life ), 2(1), 394–403.
Hosmer. D. W., Lemeshow. S. 1989. Applied Logistic Regression. John Wiley &
Sons, Inc Johnson. R. A., Wichern. D. W. 2007. Applied Multivariate
Statistical Analysis. Sixth Edition. New Jersey: Prentice
Jurnal Ilmiah Wahana Pendidikan, Agustus 2022, 8 (12), 198-210 Algoritma K-Means
Untuk Pengelompokan Bantuan Langsung Tunai (BLT) Muhamad Khandava
Mulyadien1 , Ultach Enri
Khalid, I. A. (2020). Customer Segmentation in Python. Towards Data Science.

Manalu, D. A., & Gunadi, G. (2022). Impelentasi Metode Data Mining K-Means
Clustering Terhadap Data Pembayaran Transaksi Menggunakan Bahasa
Pemrograman Python Pada Cv Digital Dimensi. Sekolah Tinggi
Manajemen Informatika dan Komputer (STMIK) Widuri Jakarta.
Miyamoto, S., Ichihashi, H., & Honda, K. (2008). Algorithms for Fuzzy Clustering –
Methods cMeans Clustering with Application. Springer- Verlag Berlin
Heidelberg.
Nishom, M. (2019). Perbandingan Akurasi Euclidean Distance, Minkowski Distance,

dan Manhattan Distance pada Algoritma K-Means Clustering berbasis
Chi-Square. JPIT (Jurnal Informatika: Jurnal Pengembangan IT), 4(1),
20–24.
LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel, A. (2014). Implementation of
machine learning for classifying hemiplegic gait disparity through use of a force
plate. 2014 13th International Conference on Machine Learning and
Applications, 379– 382.
LAMPIRAN
Biodata Diri
A. Data Pribadi
Nama : Fadli Deri Pranda
Tempat, Tanggal Lahir : Temula, 05 Maret 2001
Alamat : Kampung Linggang Melape, kecamatan
Linggang Bigung
No. Telepon : 082353273707
Jenis Kelamin : Laki – Laki
E- email : Fadlideri08@gmail.com
B. Riwayat Pendidikan
 SDK WR.Soepratman Linggang Melapeh
 SMPN 35 Sendawar,Linggang Melapeh Kabupaten Kutai Barat
 SMKN 1 Sendawar, Melak Kabupaten Kutai Barat
 Universitas AKI, Semarang, Fakultas Teknik Dan Informatika
Surat Penerimaan MSIB
Sertifikat dan Transkip Nilai MSIB Pada BISA ARTIFISIAL INDONESIA
Dataset
card reports age income share expenditure Owner selfemp dependents Months majorcards active
0 yes 0 37.66667 4.5200 0.033270 124.983300 yes No 3 54 1
12
1 yes 0 33.25000 2.4200 0.005217 9.854167 no No 3 34 1
13
2 yes 0 33.66667 4.5000 0.004156 15.000000 yes No 4 58 1
5
3 yes 0 30.50000 2.5400 0.065214 137.869200 no No 0 25 1
7
4 yes 0 32.16667 9.7867 0.067051 546.503300 yes No 2 64 1
5
... ... ... ... ... ... ... ... ... ... ... ...
...
1314 yes 0 33.58333 4.5660 0.002146 7.333333 yes no 0 94 1
19
1315 no 5 23.91667 3.1920 0.000376 0.000000 no no 3 12 1
5
1316 yes 0 40.58333 4.6000 0.026513 101.298300 yes no 2 1 1
2
1317 yes 0 32.83333 3.7000 0.008999 26.996670 no yes 0 60 1
7
1318 yes 0 48.25000 3.7000 0.111619 344.157500 yes no 2 2 1
0
Foto Kegiatan
Buku Bimbingan

Laporan Kerja Praktek

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laporan Kerja Praktek

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I

1.1 Latar Belakang

Magang dan Studi Independen Bersertifikat (MSIB) adalah salah satu

program dari Kampus Merdeka yang bertujuan untuk memberikan kesempatan

Program ini diperuntukan bagi mahasiswa yang ingin memperlengkapi dirinya

usaha di dunia industri.

Study independen pada BISA AI dengan tema project capstone Big

Data Enggineer dan BISA AI merupakan start up yang mengembangkan

alokasi dana pengguna belanja online marketplace.

mampu menyajikan visualisai pengelompokan data pelanggan berdasarkan

pengeluaran, umur, lokasi maupun data-data yang berkorelasi dengan

pengalokasian dana pengeluaran. Hal ini mampu mempermudah suatu

marketplace maupun perusahaan untuk mengenalisa data dari pelanggan.

Layanan-layanan yang pertama kali kembangkan oleh BISA Al

diantaranya: Image Recognition Service, Video Analytics Service Language

Sukses bekerja sama dengan banyak perusahaan dalam menyelesaikan masalah

Pada tahun 2020, BISA AI dapat fokus mengembangkan dua produk

AI Academy sebagai platform pembelajaran daring.

Data engineering merupakan software engineer yang tugas utamanya

dianalisa dan mendukung kebutuhan perusahaan dengan metode prediksi dan

Disini menawarkan model prediksi alokasi pengeluaran dari pelanggan

untuk suatu marketplace maupun perusahaan berdasarkan status, penghasilan,

lokasi, maupun kebiasan atau data-data lain dari user tersebut.

Model ini sangat cocok untuk diimplementasikan pada marketplace atau

perusahaan beskala menengah hingga besar. Sehingga sebuah marketplace atau

perusahaan mampu untuk menentukan kebijakan yang sesuai pada situasi

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka rumusan masalah adalah

Kampus Merdeka yang bertujuan untuk memberikan kesempatan kepada

Artificial Intelligence (AI).

1.3 Batasan Masalah

1. Penelitian ini dilakukan dengan meyelesaikan proyek yang di lakukan

selama mengikuti MSIB.

2. Penelitian ini menggunakan platform kampus merdeka untuk melakukan

akses kegiatan MSIB.

pelanggan belanja online melalui survei BISA AI Academy.

4. Penelitian menggunakan penerapan Data Engineering dengan metode

klasterisasi dan prediksi.

5. Penelitian ini menggunakan tahapan segmentasi Big Data Engineering.

6. Tools yang digunakan adalah Google Colaboratory.

1.4 Tujuan Penelitian

1. Meningkatkan pengetahuan, keterampilan, dan sikap Mahasiswa sehingga

meningkatkan kesiapan dan keterserapan di dunia kerja dan dunia usaha.

2. Menghasilkan terobosan dalam penyelesaian persoalan praktis di industri

ataupun organisasi dari inovasi yang dilakukan dalam program ini.

3. Mendorong dan memacu pembangunan nasional dengan menumbuhkan

motivasi masyarakat untuk berpartisipasi dalam pembangunan.

4. Meningkatkan peran dan kontribusi nyata Perguruan Tinggi dan Mahasiswa

dalam pembangunan nasional.

1.5 Manfaat Penelitian

1. Mahasiswa dapat terlibat langsung dalam aktivitas internal institusi tempat

2. Mendapatkan ilmu yang relevan dari institusi tempat magang

3. Dalam menyelesaikan proyek diberikan pengetahuan melalui modul

pembelajaran yang relevan dengan persoalan proyek dengan pendampingan

4. Mahasiswa mendapatkan peluang untuk menjadi FTE (Full Time

Employee) setelah perfomanya dinilai selama periode magang, selain itu

sertfikiasi keterampilan dari industri juga akan memberikan nilai yang

tinggi bagi Mahasiswa.

1.6 Metodologi Penelitian

Dalam membuat suatu laporan yang baik maka sebuah laporan

memerlukan data-data yang bersifat jelas dan akurat sesuai dengan

permasalahan yang dibahas. Untuk mendapatkan data-data yang sesuai dengan

sesuai dengan permasalahan dengan menggunakan beberapa metode penelitian