Anda di halaman 1dari 110

BAB I

PENDAHULUAN

1.1 Latar Belakang

Magang dan Studi Independen Bersertifikat (MSIB) adalah salah satu

program dari Kampus Merdeka yang bertujuan untuk memberikan kesempatan

kepada mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas

di luar kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan.

Program ini diperuntukan bagi mahasiswa yang ingin memperlengkapi dirinya

dengan menguasai kompetensi spesifik dan praktis yang juga dicari oleh dunia

usaha di dunia industri.

Study independen pada BISA AI dengan tema project capstone Big

Data Enggineer dan BISA AI merupakan start up yang mengembangkan

layanan dan produk seputar Artificial Intelligence yang didirikan pada tahun

2019. Dan pada penerapan data engineering ini saya melakukan prediksi

alokasi dana pengguna belanja online marketplace.

Model yang buat pada project akhir ini bukan hanya mampu untuk

prediksi alokasi dana pengeluaran dari pelanggan, namun model ini juga

mampu menyajikan visualisai pengelompokan data pelanggan berdasarkan

pengeluaran, umur, lokasi maupun data-data yang berkorelasi dengan

1
2

pengalokasian dana pengeluaran. Hal ini mampu mempermudah suatu

marketplace maupun perusahaan untuk mengenalisa data dari pelanggan.

Layanan-layanan yang pertama kali kembangkan oleh BISA Al

diantaranya: Image Recognition Service, Video Analytics Service Language

Service, Data Analysis Service, Lab as a Service, e-learning, dan loT Service.

Sukses bekerja sama dengan banyak perusahaan dalam menyelesaikan masalah

melalui Artificial Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.

Pada tahun 2020, BISA AI dapat fokus mengembangkan dua produk

utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya

sederhana, dengan BISA Tampil sebagai platform video conference dan BISA

AI Academy sebagai platform pembelajaran daring.

Data engineering merupakan software engineer yang tugas utamanya

adalah menyiapkan data yang dikoleksi dari berbagai sumber informasi dengan

membangun sistem data atau infrastruktur agar data tersebut dapat mudah untuk

dianalisa dan mendukung kebutuhan perusahaan dengan metode prediksi dan

klasterisasi.

Disini menawarkan model prediksi alokasi pengeluaran dari pelanggan

untuk suatu marketplace maupun perusahaan berdasarkan status, penghasilan,

lokasi, maupun kebiasan atau data-data lain dari user tersebut.

Model ini sangat cocok untuk diimplementasikan pada marketplace atau

perusahaan beskala menengah hingga besar. Sehingga sebuah marketplace atau


3

perusahaan mampu untuk menentukan kebijakan yang sesuai pada situasi

tertentu dengan adanya bantuan prediksi dan analisa dari produk model .

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka rumusan masalah adalah

Kampus Merdeka yang bertujuan untuk memberikan kesempatan kepada

mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas di luar

kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan . Dengan

adanya kegiatan seperti MSIB ini diharapkan penulis atau mahasiswa lain dapat

mengasah baik hard skill maupun soft skill dan dapat memahami konsep

Artificial Intelligence (AI).

1.3 Batasan Masalah

Dari permasalahan yang ada, penulis membatasi masalah yang dibahas sebagai

berikut :

1. Penelitian ini dilakukan dengan meyelesaikan proyek yang di lakukan

selama mengikuti MSIB.

2. Penelitian ini menggunakan platform kampus merdeka untuk melakukan

akses kegiatan MSIB.

3. Penelitian ini menggunakan data survei yang didapat dari riset dana

pelanggan belanja online melalui survei BISA AI Academy.


4

4. Penelitian menggunakan penerapan Data Engineering dengan metode

klasterisasi dan prediksi.

5. Penelitian ini menggunakan tahapan segmentasi Big Data Engineering.

6. Tools yang digunakan adalah Google Colaboratory.

1.4 Tujuan Penelitian

1. Meningkatkan pengetahuan, keterampilan, dan sikap Mahasiswa sehingga

meningkatkan kesiapan dan keterserapan di dunia kerja dan dunia usaha.

2. Menghasilkan terobosan dalam penyelesaian persoalan praktis di industri

ataupun organisasi dari inovasi yang dilakukan dalam program ini.

3. Mendorong dan memacu pembangunan nasional dengan menumbuhkan

motivasi masyarakat untuk berpartisipasi dalam pembangunan.

4. Meningkatkan peran dan kontribusi nyata Perguruan Tinggi dan Mahasiswa

dalam pembangunan nasional.

1.5 Manfaat Penelitian

1. Mahasiswa dapat terlibat langsung dalam aktivitas internal institusi tempat

magang

2. Mendapatkan ilmu yang relevan dari institusi tempat magang

3. Dalam menyelesaikan proyek diberikan pengetahuan melalui modul

pembelajaran yang relevan dengan persoalan proyek dengan pendampingan

mentor profesional
5

4. Mahasiswa mendapatkan peluang untuk menjadi FTE (Full Time

Employee) setelah perfomanya dinilai selama periode magang, selain itu

sertfikiasi keterampilan dari industri juga akan memberikan nilai yang

tinggi bagi Mahasiswa.

1.6 Metodologi Penelitian

Dalam membuat suatu laporan yang baik maka sebuah laporan

memerlukan data-data yang bersifat jelas dan akurat sesuai dengan

permasalahan yang dibahas. Untuk mendapatkan data-data yang sesuai dengan

permasalahan ini maka penulis mendapatkan data-data yang jelas dan akurat

sesuai dengan permasalahan dengan menggunakan beberapa metode penelitian

antara lain yaitu :

1. Metode Wawancara (Interview)

Wawancara merupakan komunikasi dua arah untuk

mendapatkan data dari responden (Jogiyanto, 2008:89). Penulis

akan melakukan wawancara pada PT BISA ARTIFISIAL

INDONESIA untuk mendapatkan informasi yang diinginkan.

2. Metode Observasi (Pengamatan)

Metode observasi adalah Teknik atau pendekatan untuk

mendapatkan data primer dengan cara mengamati langsung

objek datanya. (Jogiyanto, 2008:111). Penulis melakukan

pengamatan terhadap permasalahan yang diteliti untuk


6

3. Metode Studi Pustaka

Hasil Penelitian juga akan semakin kredibel apabila didukung

foto-foto atau karya tulis akademik dan seni yang telah ada

(Sugiyono, 2005:83). Penulis mengambil data-data yang ada

dari buku jurnal karya tulis ilmiah serta sumber referensi yang

mendukung penelitian dilaksanakan.

1.7 Sistematika Penulisan

Untuk memperoleh hasil gambaran yang jelas dari semua isi laporan kerja

praktek ini, maka garis besar pembahasaan dibagi menjadi 5 bab yaitu:

BAB 1 PENDAHULUAN

Bab ini meliputi latar belakang penelitian, rumusan masalah yang

menjadi acuan penelitian, batasan masalah penelitian, tujuan dan manfaat yang

akan diperoleh dari penelitian yang didapatkan, metodologi penelitian yaitu

metode yang digunakan dalam penelitian dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini berisi landasan- landasan teori yang digunakan dalam

menganalisi dan meneliti masalah dimana hal tersebut berhubungan dengan

MSIB, Machine Learning, Data Engineering, Prediction, Clusering, Python,

Prepocessing, Regresi linear, K-means dan Tools Google Colaboratory yang

digunakan dalam penelitian.

BAB III GAMBARAN UMUM


7

Dalam ini akan memuat mengenai Gambaran umum objek penelitian

pada PT BISA ARTIFISIAL INDONESIA yang akan dijelaskan dan dijabarkan

dalam bab ini. Meliputi sejarah berdirinya BISA ARTIFISIAL INDONESIA ,

visi dan misi, tujuan Universitas BISA ARTIFISIAL INDONESIA, struktur

organisasi, tugas serta tanggung jawab , BISA ARTIFISIAL INDONESIA.

BAB IV PEMBAHASAN

Berisi tentang study independen bersertifikat pada BISA ARTIFISIAL

INDONESIA dengan hasil project akhir penerapan Big Data Engineering

Segmentasi Alokasi Dana pelanggan dengan Google Colaboratory pada

program kampus merdeka magang dan study independen bersertifikat.

Meliputianalisis permasalahan, metode penelitian, pembahasan, hasil aplikasi,

hasil analisis.

BAB V PENUTUP

Bab ini berisi Kesimpulan dari hasil pembahasan yang diperoleh dari

hasil Penelitian dari MSIB pada BISA AI dan saran yang diberikan dalam

penelitian.
BAB II

LANDASAN TEORI

2.1 MSIB ( Magang Dan Studi Independen Bersertifikat )

Magang dan Studi Independen Bersertifikat atau MSIB adalah salah satu

program Kampus Merdeka yang dirancang untuk memastikan mahasiswa

mendapatkan keterampilan dan kompetensi utama, terbaik, dan terkini untuk

menghadapi dunia masa depan. Mahasiswa mendapat pengalaman belajar diluar

kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi SKS mata kuliah

yang diambil.

MSIB adalah salah satu program Kampus Merdeka yang dirancang untuk

memastikan mahasiswa mendapatkan keterampilan dan kompetensi utama, terbaik,

dan terkini untuk menghadapi dunia masa depan. Mahasiswa mendapat pengalaman

belajar diluar kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi

SKS mata kuliah yang diambil.

Dengan mengikuti program MSIB Kampus Merdeka, mahasiswa bisa belajar

dan mendapat pengalaman nyata di dunia profesional. Jadi, jangan lewatkan

kesempatan ini. Sebelum mendaftar pada program MSIB mahasiswa membuat akun

Kampus Merdeka.

Program MSIB ini terdiri dari 2 program, yakni Magang dan Studi Independen.

Di program magang, mahasiswa akan bekerja di organisasi mitra sebagai trainee.

8
9

Tolok ukur kegiatan magang di program MSIB adalah sebagai berikut:

 Peserta magang diberikan real project atau proyek riil yang mempunyai

nilai strategis untuk pihak industri

 Peserta magang diberi modul pembelajaran yang berkaitan dengan

persoalan proyek

 Proyek dikerjakan secara berkelompok dengan peserta lain yang lintas

disiplin ilmu

 Peserta magang mendapatkan pendampingan oleh mentor profesional

 Adanya peluang menjadi Full Time Employee bagi peserta magang

setelah performa dinilai

 Sertifikasi keterampilan dari industri akan memberikan nilai tinggi

untuk mahasiswa

2.2 Machine Learning

Machine learning adalah ilmu pengembangan algoritma dan model secara

statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi

eksplisit, mengandalkan pola serta inferensi sebagai gantinya. Sistem komputer

menggunakan algoritme machine learning untuk memproses data historis berjumlah

besar dan mengidentifikasi pola data (LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel,

A. (2014).
10

Adapun tujuan dari digunakannya aplikasi machine learning adalah untuk

membuat suatu keputusan atau prediksi yang dibuat berdasarkan data-data tersebut. Di

mana semakin bagus algoritma dari machine learning tersebut maka akurasi keputusan

dan prediksi sistemnya akan semakin baik. Ibaratnya, seperti otak manusia di mana jika

ia semakin pintar maka harus banyak belajar. Di sini pun, mesin yang mengolah

banyak data maka akan menghasilkan output yang semakin akurat. Maka dari itu, kini

machine learning adalah satu bagian yang wajib ada karena berperan penting bagi

seluruh aktivitas sehari-hari di sebuah perusahaan atau organisasi.

Hal ini memungkinkannya untuk memprediksi hasil yang lebih akurat dari set

data input yang diberikan. Misalnya, ilmuwan data dapat melatih aplikasi medis untuk

mendiagnosis kanker dari gambar sinar-x dengan cara menyimpan jutaan gambar yang

dipindai dan diagnosis yang sesuai (Board, F. S. 2017).

2.2.1 Tools Machine Learning

Dalam penggunaan machine learning diperlukan beberapa tool dalam tahapan

ini ada Beberapa tools yang digunakan untuk tahapan machine learning antara lain :

1. Google Collaboratory

Google Colab, kependekan dari Google Colaboratory, adalah salah satu

produk dari Google Internal Research. Dilansir dari e-book Logika Matematika

untuk Analisis Algoritma karya Dr. Putu Harry Gunawan, tools satu ini

merupakan compiler dan editor bahasa pemrograman Python secara online.


11

Selama menggunakan tools ini, kamu tidak perlu menginstal software

tambahan lagi. Untuk bisa menggunakan Google Colab, kamu hanya perlu akun

Google untuk login dan menyimpan file Python ke Google Drive milikmu.

Menurut e-book Informatika untuk SMP/MTs Kelas VII karya Gunawan Trieko

Wicaksono, dengan menggunakan Google Colab, siapa pun dapat belajar

coding tanpa perlu sarana komputasi yang canggih dan mahal.

Colaboratory, atau “Colab” merupakan produk dari Google Research.

Colab memungkinkan siapa saja menulis dan mengeksekusi kode python

arbitrer melalui browser, dan sangat cocok untuk machine learning, analisis

data, serta pendidikan. Secara lebih teknis, Colab merupakan layanan notebook

Jupyter yang dihosting dan dapat digunakan tanpa penyiapan, serta

menyediakan akses gratis ke resource komputasi termasuk GPU Resource

Colab tidak dijamin dan sifatnya terbatas, serta batas penggunaannya terkadang

berfluktuasi (‘Gabriel Irfon Elrohi Soen ,Marlina,Renny,2022 ’).

a. Syntax Google Colab

Beberapa syntax yang digunakan sebagai berkut :

1. Scikit-learn adalah library paling berguna untuk pembelajaran

mesin dengan Python. Library sklearn berisi banyak alat yang

efisien untuk pembelajaran mesin dan pemodelan statistik

termasuk klasifikasi, regresi, pengelompokan, dan pengurangan

dimensi.
12

Adapun scikit-learn lebih berfokus pada algoritma machine

learning.

a) Regresi: Memasang model linier dan non-linier

b) Classification : Klasifikasi tanpa pengawasan

c) Decision Tree : Induksi dan pemangkasan pohon untuk

tugas klasifikasi dan regresi

d) Neural Networks : Pelatihan ujung ke ujung untuk

klasifikasi dan regresi. Lapisan dapat dengan mudah

ditentukan dalam tupel

e) SVM: untuk mempelajari batasan keputusan

f) Naive Bayes: Pemodelan probabilistik langsung

2. Algoritma Tingkat Lanjut di Scikit Learn

a) Metode Ensemble: Boosting, Bagging, Random Forest,

Model voting dan averaging

b) Manipulasi Fitur: Pengurangan dimensi, pemilihan fitur,

analisis fitur

c) Deteksi Outlier: Untuk mendeteksi outlier dan menolak

noise

d) Pemilihan dan validasi model: Validasi silang,

penyesuaian Hyperparameter, dan metrik

3. Library dari scikit learn antara lain :

 NumPy adalah
13

Library untuk Python yang menambahkan dukungan untuk

array dan matriks multidimensi yang besar, bersama dengan

koleksi fungsi matematika tingkat tinggi untuk beroperasi pada

array. Dan NumPy (Numerical Python) adalah library Python

yang fokus pada scientific computing. Simpelnya: Numpy

menyediakan fungsi yang siap pakai untuk memudahkan kita

melakukan perhitungan saintifik seperti matriks, aljabar,

statistik, dan sebagainya. (‘Joseph Dedy Irawan , Emmalia

Adriantantri ,Teknik Informatika, Institut Teknologi Nasional

Malang,2019’).

Keterangan :

Array / np array = variable yang mempunyai indeks numpy

Import = perintah untuk memasukan library

Np = singakatan dari numpy untuk mempersingakat nama untuk

data frame

Contoh source code NumPy :

Input :

import numpy as np

variable :

a= np.array([1,2,3,4,5])

b=np.array([1.2,1.5,5,6,7])

output 1:
14

print(b)

output 2:

[1.2 1.5 5.6.7.]

 Pandas

Perpustakaan penting bagi para data scientist. Library untuk

machine learning yang bersifat open source ini menyediakan

struktur data tingkat tinggi yang fleksibel serta berbagai alat

analisis. Penggunaannya memudahkan analisis data, manipulasi

data, dan pembersihan data. Pandas mendukung berbagai jenis

operasi seperti penyortiran, pengindeksan ulang, iterasi,

penggabungan, konversi data, visualisasi, agregasi, dan lain

sebagainya(‘Andri Wahyu Ahmad Ruslam, 2020’).

Import = perintah untuk memasukan library

Pd dan np = singakatan dari pandas dan numpy untuk

mempersingakat nama untuk data frame

Df = singkatan dari data frame (table data tabular array 2

dimensi)

Dict = untuk membentuk dictionary yang merupakan tipe data

Contoh source code Pandas :

input :

import pandas as pd

import numpy as np
15

variable:

dict = {"Negara": ["Indonesia", "Jepang",

"India", "China", "Amerika Serikat"],

"Ibu Kota": ["Jakarta", "Tokyo", "New

Delhi", "Beijing", "Washington, D.C."],

"Luas": [1905, 377972, 3287, 9597,

9834],

"Populasi": [264, 143, 1252, 1357,

5298] }

df = pd.DataFrame(dict)

print(df)

Output :

Negara Ibu Kota Luas

Populasi

0 Indonesia Jakarta 1905 264

1 Jepang Tokyo 377972 143

2 India New Delhi 3287 1252

3 China Beijing 9597 1357

4 Amerika Serikat Washington, D.C. 9834

5298
16

 Matplotlib

bertanggung jawab untuk merencanakan data numerik. Itulah

alasan Matplotlib digunakan dalam analisis data. Library python

yang bersifat open source ini dapat memplot angka-angka

berdefinisi tinggi seperti diagram lingkaran, histogram,

scatterplot, grafik, dan lain-lain (‘Herlawati,Rahmadya Trias

Handayanto,FakultasTeknik, Universitas Bhayangkara, 2019’).

Ada 5 jenis visualisasi data di Python menggunakan Matplotlib

yang sering digunakan untuk menampilkan berbagai informasi

dari suatu dataset. Dan dalam diagram/grafik yang akan dibuat

yang perlu diperhatikan adalah beberapa syntax sebagai beikut :

1. Line Plot

2. Scatter Plot

3. Box Plot

4. Bar Plot

5. Hostogram

Keterangan :

 bar_labels: untuk menuliskan nama label pada bar plot

 axis: untuk mengatur sumbu pada plot

 barh :untuk membuat bar plot dalam posisi horizontal

 axes: untuk menambahkan sumbu dan menetapkannya

pada plot
17

 figtext: untuk menambahkan tulisan pada plot

 subplots: untuk membuat dan mengatur plot

 plt : untuk memanggil library matplotlib.pyplot, lalu

memanggil method plot()

 Figure: adalah objek matplotlib yang mengandung

semua elemen dari sebuah grafik

1) Line Plot

Line plot atau biasa dikenal dengan line chart adalah

jenis plot yang menampilkan informasi berupa rangkaian

titik data yang terhubung dengan segmen garis lurus.

Line plot dikenal sebagai jenis plot dasar dalam

visualisasi data. Plot yang satu ini dapat digunakan pada

dataset yang memiliki nilai kontinu untuk melihat

pergerakan data.

Gambar 2. 1 Line Plot (https://ilmudatapy.com/ )

2) Scatter Plot
18

Scatter plot merupakan jenis visualisasi data untuk

menunjukkan hubungan antara dua variabel. Dengan

menggunakan scatter plot, Anda dapat melihat distribusi

data dan bagaimana trennya. Anda juga bisa

menggunakan scatter plot untuk melihat hubungan dari

beberapa kelompok data dengan memberikan warna

yang berbeda untuk membedakan masing-masing

kelompok data.

Gambar 2. 2 Scatter Plot (https://ilmudatapy.com/ )

3) Box Plot

Box plot merupakan salah satu jenis visualisasi data

yang secara statistik merepresentasikan pendistribusian

data melalui lima dimensi utama, yaitu nilai minimum,

kuartil 1, kuartil 2 (median), kuartil 3, serta nilai


19

maksimum. Umumnya, box plot digunakan untuk

memeriksa keberadaan outlier dalam dataset.

Gambar 2. 3 Box Plot


4) Bar Plot

Bar plot atau bisa disebut juga dengan bar chart adalah

jenis plot yang direpresentasikan dengan bar, dimana

panjang bar adalah representasi dari ukuran sebuah fitur

atau variabel. Bar plot umumnya merepresentasikan

variabel numerik dan kategori yang dikelompokkan

dalam interval.
20

Gambar 2. 4 Bar Plot


5) Histogram

Jenis visualisasi data untuk merepresentasikan distribusi

frekuensi dari dataset numerik. Sumbu X

menggambarkan bin dari data point, sedangkan sumbu

Y merepresentasikan frekuensi atau banyaknya data

point pada setiap bin. Ukuran bin dapat disesuaikan

dengan tujuan agar distribusinya terlihat bagus. Namun,

default-nya Python akan membagi bin menjadi 10

bagian.
21

Gambar 2. 5 Histogram
2. Seaborn

Seaborn adalah library visualisasi data Python berdasarkan matplotlib.

Seaborn menyediakan antarmuka/ user interface tingkat tinggi untuk

menggambar grafik statistik yang menarik dan informative (‘Sandy Hardian

Susanto Herho, 2019’).

1) Heatmap plot

Heatmap adalah visualisasi atau pemetaan dengan

menampilkan data dengan representasi warna yang berbeda-

beda. Biasanya, semakin tinggi angka suatu kelompok data,

warnanya akan semakin gelap, umumnya disimbolkan

dengan warna merah. Meskipun dapat bermanfaat di

berbagai bidang seperti statistika, geografi, dan lain-lain,

saat ini, heatmap banyak digunakan untuk melacak aktivitas


22

pengguna sebuah situs. Heatmapping dilakukan berdasarkan

gerakan mouse yang dilakukan, seperti mengklik pada link,

tombol, hovering, maupun scrolling.

Ada beberepa perintah dasar dalam heatmap antara lain :

 import seaborn as sns : untuk memamasukan library

seaborn

 plt.figure: adalah objek yang mengandung semua

elemen dari sebuah grafik

 corr = df.corr(): digunakan untuk kondisi elemen dari

heatmap

 sns.heatmap: merupakan dictionary dari heatmap dari

library seaborn

2. Tenserflow

Tensorflow adalah sebuah framework machine learning yang

mungkin akan menjadi sahabatmu ketika kamu bermain dengan data

dan apabila kamu fans dari salah satu area di AI (artificial intelligence)

yaitu deep learning. Google meluncurkan TensorFlow untuk

memperkenalkan ekosistem yang menyediakan kumpulan alur kerja

untuk mengembangkan dan melatih model, untuk

mengimplementasikan Machine Learning di hampir semua aplikasi.

Sebenarnya, kita semua menggunakan TensorFlow begitu

sering tanpa menyadari bahwa penggunaannya: Google Foto atau


23

Google voice, kamu menggunakan model TensorFlow secara tidak

langsung, model tersebut bekerja pada kelompok besar perangkat keras

Google dan sangat kuat dalam tugas perseptual.

Machine Learning memiliki manfaat yang sangat besar bagi

banyak perusahaan. Sehingga, berbagai perusahaan dari berbagai

industri membutuhkan alat dan sumber daya untuk menerapkan ML dan

memecahkan masalah terbesar mereka. Dari bidang Healthcare hingga

social network dan e-commerce, TensorFlow digunakan oleh semua

orang dan untuk banyak hal! Berikut adalah beberapa contoh siapa yang

menggunakan Tensorflow:

1) Airbnb: Mengkategorikan Foto Tempat di Airbnb

2) Lenovo: Pengoptimalan TensorFlow untuk Prosesor Intel Xeon

yang Dapat Diskalakan

3) Coca-Cola: Machine Learning dengan TensorFlow yang

mendukung Bukti Pembelian seluler di Coca-Cola

4) Lenovo: Lenovo Intelligent Computing Orchestration

menggunakan TensorFlow untuk membantu mempercepat

revolusi cerdas

5) PayPal: Menggunakan TensorFlow untuk terus memantau

Deteksi Penipuan

6) GE: General Electric melatih jaringan saraf menggunakan

TensorFlow untuk mengidentifikasi anatomi pada MRI di otak


24

7) Twitter: Memberi Peringkat Tweet di timeline beranda dengan

TensorFlow

3. Python

Python adalah bahasa pemrograman interpretatif multiguna.

Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python

lebih menekankan pada keterbacaan kode agar lebih mudah untuk

memahami sintaks. Hal ini membuat Python sangat mudah dipelajari

baik untuk pemula maupun untuk yang sudah menguasai bahasa

pemrograman lain.

Dan python merupakan salah satu bahasa pemrograman yang

banyak digunakan oleh perusahaaan besar maupunpara developer

untuk mengembangkan berbagai macam aplikasi berbasis desktop,

web dan mobile.

Python diciptakan oleh Guido van Rossum di Belanda pada

tahun 1990 dan namanya diambildari acara televisikesukaanGuido

Monty Python’s Flying Circus. Van Rossum mengembangkan

Python sebagaihobi, kemudian Python menjadi bahasa pemrograman

yang dipakai secara luas dalam industri dan pendidikan karena

sederhana, ringkas, sintak sintuitif dan memiliki pustaka yang luas

(Schuerer & Maufrais 2010).

 Fremwork Python antara lain :


25

1) Aplikasi Web: Flask, Pyramid, Django, CherryPy

2) Aplikasi Mobile: Python for Android, pyqtdeploy, Kivy,

BeeWare

3) Aplikasi Desktop: PyGUI, PyQt5, Tkinter, wxPython

 Beberapa Fungsi Python antara lain :

1. Fungsi type

- object : objek yang hendak dicari tahu tipenya

- name : nama kelas, sebagai atribut name

- bases : tuple base class, sebagai atribut bases

- dict : dictionary dari body class, sebagai atribut dict

2. Fungsi Staticmethod

- function – fungsi yang akan diubah menjadi static method.

3. Fungsi Split

- separator – Bertindak untuk menentukan pembatas atau

pemisah

- maxsplit – Bertindak untuk menentukan jumlah maksimum

split. Nilai defaultnya -1

4. Fungsi Enumerate

- iterable: data iterable seperti list, string, tuple, dan lain – lain

- start :awal dari indeks

5. Fungsi Evav
26

- expression : string yang akan dievaluasi (diparsing) sebagai

ekspresi Python

- globals (opsional) : dictionary

- locals (opsional): dictionary

2.2.2 Tipe Machine Learning

Ada beberapa teknik yang dimiliki oleh machine learning, namun secara luas

memiliki dua teknik dasar belajar, yaitu supervised dan unsupervised dan beberapa

tehknik lainnya antara lain :

1. Suvervised Learning

Teknik supervised learning merupakan teknik yang bisa kamu terapkan

pada pembelajaran mesin yang bisa menerima informasi yang sudah ada

pada data dengan memberikan label tertentu. Diharapkan teknik ini bisa

memberikan target terhadap output yang dilakukan dengan

membandingkan pengalaman belajar di masa lalu.

Gambar 2. 6 Supervised Learning


(https://tinyurl.com/39rsjdyr)
27

Gambar diatas merupakan proses memulai penerapan dari suvervised

learning dimana ada tahapan proses data mentah atau raw data hingga

menjadi sebuah output. Dan digunakan dalam memprediksi pola dimana

pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk

adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita

memasukan data baru, setelah kita melakukan ETL (Extract Transform

Load) maka kita mendapat info feature dari sample baru tersebut.

1) Prediction

Prediction dianggap sebagai tindakan yang menjelaskan mengenai

masa mendatang. Prediction tentunya berbeda dengan menebak

secara sederhana, mempertimbangkan pengalaman, opini, dan

informasi lainnya dalam melakukan peramalan. Istilah yang

umumnya dikaitkan dengan ‘prediction’ adalah ‘forecasting’.

Meskipun banyak orang yang percaya bahwa kedua istilah itu

adalah sinonim, tetapi ada perbedaan tipis namun sangat penting

diantara keduanya. ’Prediction’ pada umumnya berbasis opini dan

pengalaman, ‘forecasting’ berbasis data dan model. Dalam

terminology data mining, ‘prediction’ dan ‘forecasting’ digunakan

secara sinonim, dan istilah prediksi digunakan sebagai penyajian

yang umum ‘( Victor Saputra Ginting, Kusrini Kusrini, Emha

Taufiq , yogyakarta )’ .

2) Regresi Linear
28

Regresi Linear merupakan solusi yang cocok untuk digunakan oleh

perusahaanmultiproduk karena dengan memperkirakan berbagai

kombinasi produk, perusahaan dapat memaksimalkan keuntungan

serta memperkirakan jumlah produksi yang tepat. Namun dalam

menerapkan regresi linear diperlukan pengetahuan mengenai

kombinasi produk yang tepat, target pasar, serta jumlah permintaan

terhadap produk itu sendiri (“Statistika Terapan untuk Ilmu-Ilmu

Sosial dan Ekonomi, By Zulkarnain Lubi, 2015,05”).

 Nilai data matematis linear

Regresi linear harus memodifikasi atau mengubah nilai data

secara matematis untuk memenuhi empat asumsi berikut:

a. Hubungan linier

Hubungan linier harus ada antara variabel independen dan

dependen. Untuk menentukan hubungan ini, ilmuwan data

membuat plot sebar—kumpulan acak nilai x dan y—untuk

melihat apakah nilai tersebut berada di sepanjang garis lurus.

Jika tidak, Anda dapat menerapkan fungsi nonlinier seperti akar

kuadrat atau log untuk membuat hubungan linier antara dua

variabel secara matematis.

b. Independensi residual

Ilmuwan data menggunakan residual untuk mengukur

akurasi prediksi. Residual adalah selisih antara data yang


29

diamati dengan nilai prediksi. Residual tidak boleh memiliki

pola yang dapat diidentifikasi. Misalnya, Anda tidak ingin

residual tumbuh semakin besar seiring berjalannya waktu. Anda

dapat menggunakan uji matematika yang berbeda, seperti uji

Durbin-Watson, untuk menentukan independensi residual. Anda

dapat menggunakan data dummy untuk mengganti variasi data

apa pun, seperti data musiman.

c. Normalitas

Teknik pembuatan grafik seperti plot Q-Q menentukan

apakah residual terdistribusi secara normal. Residual harus

berada di sepanjang garis diagonal di tengah grafik. Jika residual

tidak dinormalisasi, Anda dapat menguji data untuk pencilan

acak atau nilai yang tidak umum. Menghapus pencilan atau

melakukan transformasi nonlinier dapat mengatasi masalah

tersebut.

d. Homoskedastisitas

Homoskedastisitas mengasumsikan bahwa residual

memiliki varians atau standar deviasi yang konstan dari rata-rata

untuk setiap nilai x. Jika tidak, hasil analisis mungkin tidak

akurat. Jika asumsi ini tidak terpenuhi, Anda mungkin harus

mengubah variabel dependen. Karena varians terjadi secara

alami dalam set data yang besar, masuk akal untuk mengubah
30

skala variabel dependen. Misalnya, alih-alih menggunakan

ukuran populasi untuk memprediksi jumlah stasiun pemadam

kebakaran di sebuah kota, ukuran populasi mungkin dapat

digunakan untuk memprediksi jumlah stasiun pemadam

kebakaran per orang.

 Jenis Regresi linear

Beberapa jenis analisis regresi lebih cocok untuk menangani set

data yang kompleks daripada yang lain. Berikut adalah beberapa

contohnya.

a. Regresi linier sederhana

Regresi linier sederhana didefinisikan oleh fungsi linear:

β0 and β1 adalah dua konstanta yang tidak diketahui dan

mewakili kemiringan regresi, sedangkan ε (epsilon) adalah

istilah kesalahannya.

Yi = merupakan nilai variabel independen observasi ke – i.

β0 = merupakan parameter koefisien regresi.

X1 = merupakan nilai variabel independen ke-k, observasi

ke-i

∈1 =merupakan nilai random error

b. Regresi linier berganda


31

Dalam analisis regresi linier berganda, set data berisi

satu variabel dependen dan beberapa variabel independen.

Fungsi garis regresi linier berubah untuk memasukkan lebih

banyak faktor sebagai berikut:

Ketika jumlah variabel prediktor meningkat, konstanta β

juga meningkat.

Regresi linier berganda mencontoh beberapa variabel dan

dampaknya terhadap hasil.

c. Regresi logistik

Ilmuwan data menggunakan regresi logistik untuk

mengukur probabilitas suatu peristiwa terjadi. Prediksi

adalah nilai antara 0 dan 1. Angka 0 menunjukkan suatu

peristiwa yang tidak mungkin terjadi dan angka 1

menunjukkan kemungkinan maksimum bahwa peristiwa itu

akan terjadi. Persamaan logistik menggunakan fungsi

logaritma untuk menghitung garis regresi.

Di bawah ini adalah beberapa contoh:

1) Probabilitas menang atau kalah dalam pertandingan

olahraga

2) Probabilitas lulus atau gagal dalam ujian

3) Probabilitas sebuah gambar berupa buah atau hewan

2. Unsupervised Learning
32

Teknik unsupervised learning merupakan teknik yang bisa kamu

terapkan pada machine learning yang digunakan pada data yang tidak

memiliki informasi yang bisa diterapkan secara langsung. Diharapkan

teknik ini dapat membantu menemukan struktur atau pola tersembunyi pada

data yang tidak memiliki label.

Berikut adalah contoh aplikasi dari unsupervised learning:

1) Clustering

Clustering yaitu teknik machine learning untuk melakukan

pengelompokkan data tidak berlabel berdasarkan persamaan atau

perbedaannya. Contoh machine learning untuk analisis Clustering

adalah K-Means Clustering yang sering digunakan dalam

melakukan klasifikasi tingkat kerentanan, analisis kelompok

konsumen dan lain-lain. Algoritma K-Means merupakan salah satu

algoritma pengelompokkan (clustering) berbasiskan metode non-

hierarchy yang mempartisi data dan membentuk satu atau lebih

kelompok yang memiliki kesamaan (‘Hasanah, Ugiarto, &

Puspitasari, 2017; Purnawansyah, Haviluddin, Gafar, & Tahyudin,

2017; Putra, Santosa, & Kusumawardani, 2015’).

K-Means Clustering merupakan salah satu algoritma Machine

Learning khususnya Unsupervised Learning yang populer

digunakan. Dalam algoritma ini, kita akan akrab dengan nilai k yang

merupakan jumlah cluster yang akan dibentuk. Sebelum mulai


33

menggunakan k-Means, kita harus mendefinisikan nilai k terlebih

dahulu. Pada dasarnya, nilai k ini akan merujuk kepada jumlah

centroid (titik pusat dari setiap cluster) yang kita butuhkan di

dataset. Gambar di atas merupakan contoh penyebaran data sebelum

dan sesudah menggunakan algoritma K-Means dengan nilai k = 3.

Untuk melakukan clustering K- Means, kita memerlukan beberapa

tahapan, diantaranya adalah:

 Penentuan nilai k atau cluster yang akan dibuat

 Inisialisasi nilai centroid secara random

 Centroid merupakan nilai pusat (center) dari sebuah cluster.

Misalkan kita mengatur k = 3, maka akan terbentuk centroid C1,

C2, dan C3 secara random.

 Menetapkan setiap data point ke centroid terdekat

Tahapan ini akan melakukan perhitungan jarak pada setiap data

terhadap centroid yang telah dibuat menggunakan Euclidean distance.

 Menghitung ulang nilai centroid dari cluster yang baru terbentuk.

 Proses ini dilakukan dengan menghitung nilai mean dari setiap data

points di dalam cluster tersebut.

 Melakukan optimasi agar kriteria terpenuhi dengan mengulang step

3 dan 4.
34

Diagram di bawah ini adalah ilustrasi cara kerja Algoritma Clustering K-means:

Gambar 2. 7 Ilustrasi K-Means

Cara kerja algoritma K-Means dijelaskan dalam langkah-langkah di bawah

ini:

Langkah-1: Pilih angka K untuk menentukan jumlah cluster.

Langkah-2: Pilih titik K atau centroid secara acak.

Langkah-3: Tetapkan setiap titik data ke centroid terdekat, yang akan

membentuk cluster K yang telah ditentukan.

Langkah-4: Hitung varians dan tempatkan centroid baru dari setiap

cluster.

Langkah-5: Ulangi langkah ketiga, yang berarti menetapkan kembali

setiap titik data ke centroid terdekat baru dari setiap cluster.


35

Langkah-6: Jika ada penugasan ulang, lanjutkan ke langkah-4 jika

tidak, lanjutkan ke FINISH.

Langkah-7: Model sudah siap.

2) Asosiasi

Asosiasi yaitu salah satu jenis unsupervised learning yang

dilakukan untuk menemukan hubungan antar variabel dalam sebuah

dataset. Dalam data science, asosiasi sering dipakai untuk

merancang mesin penelusuran dan rekomendasi suatu barang.

3) Dimensionality Reduction

Adalah teknik yang digunakan untuk mengurangi jumlah

variabel atau feature data. Proses ini dilakukan karena kita data

dengan variabel yang sangat besar atau sering disebut dengan high

dimensional data. Data seperti ini lebih menantang jika dilakukan

pemodelan, sering disebut kutukan dimensionalitas (dimensionality

curse).
36

Gambar 2. 8 Unsupervised Learning (https://tinyurl.com/39rsjdyr )

Gambar diatas merupakan proses tahapan untuk melakukan

unsupervised learning dan dimana Algoritma ini menemukan pola

tersembunyi dalam data tanpa adanya perlakuan tangan manusia.

3. Semi-Supervised Learning

Jenis algoritma yang kedua adalah semi-supervised learning. Semi-

supervised learning pada dasarnya mirip dengan supervised learning.

Namun perbedaannya ada pada data yang berlabel dan tidak berlabel untuk

training data. Biasanya sejumlah kecil data yang berlabel dengan jumlah

besar data yang tidak berlabel. Adapun sistem yang berhasil menggunakan

metode ini mampu meningkatkan akurasi pembelajaran secara signifikan.


37

Gambar 2. 9 Semi-Supervised Learning (https://tinyurl.com/39rsjdyr )

Gambar tersebut merupakan algoritma semi-supervised learning dipilih

ketika data berlabel yang diperoleh membutuhkan sumber daya yang

terampil dan relevan untuk melatihnya atau belajar darinya. Semi-

supervised learning berguna apabila biaya pelabelan data dinilai terlalu

tinggi untuk melakukan labelling secara penuh. Contoh dari penggunaan

semi-supervised learning adalah adanya identifikasi wajah seseorang yang

ada di webcam.

4. Reinforcement Learning

Reinforcement learning adalah tipe algoritma machine learning yang

bisa membuat agent software dan mesin bekerja secara otomatis untuk

menentukan perilaku yang ideal sehingga dapat memaksimalkan kinerja

algoritmanya. Dalam beberapa tahun terakhir, penggunaan reinforcement

learning terus meningkat, contohnya DeepMind and the Deep Q learning

pada tahun 2014, AlphaGo di tahun 2016, dan OpenAI dan PPO di tahun

2017. Algoritma reinforcement learning didefinisikan sebagai metode

machine learning yang berkaitan dengan cara software agent mengambil


38

tindakan di environmentnya. Algoritma ini merupakan bagian dari metode

deep learning yang akan memaksimalkan sebagian reward kumulatif.

Gambar 2. 10Reinforcement learning ( https://tinyurl.com/39rsjdyr )

Gambar ini merupakan proses Pada metode machine learning jenis

Reinforcement learning , agen akan belajar mendapatkan reward sebesar-

besarnya (long term reward). Reward diperoleh berdasarkan aksi yang

dilakukan pada suatu kondisi (state). Setia aksi yang dilakukan nantinya

akan menciptakan perubahan state yang akan mempengaruhi reward

selanjutnya. Tujuan akhir dari reinforcement learning dalam permainan

game adalah menang

5. Self-Supervised Learning

Self-Supervised Learning merupakan salah satu teknik algoritma

machine learning. Model algoritma tersebut dilatih untuk mempelajari satu

bagian input dengan bagian input lainnya. Self-supervised learning juga


39

dikenal dengan sebutan predictive learning. Dalam prosesnya,

permasalahan yang tidak diawasi akan dilakukan transformasi menjadi

permasalahan yang diawasi dengan membuat label secara otomatis. Untuk

memanfaatkan data yang tidak berlabel sangat penting untuk menetapkan

tujuan dari data tersebut. Adapun tujuan dari self-supervised learning yaitu

untuk melakukan identifikasi dari bagian input yang tidak tersembunyi.

6. Multi-Instance Learning

Multi-instance learning menjadi jenis algoritma terakhir dalam machine

learning. Jenis yang satu ini mirip pula dengan konsep supervised learning

namun dengan problem tidak lengkapnya wawasan terhadap label contoh

pelatihan. Dalam supervised learning, setiap instance pelatihan diberi label

diskrit. Sebagai contoh di Multi-Instance Learning misalnya sebuah tas

diberi label positif jika setidaknya satu instans di tas itu positif, dan tas

diberi label negatif jika semua instans di dalamnya negatif. Tidak ada label

pada masing-masing instance. Tujuan MIL adalah untuk

mengklasifikasikan tas atau instance yang tidak terlihat berdasarkan tas

berlabel sebagai data pelatihan.

3.2.2 Metode Machine Learning

1. Segmentasi Data

Segmentasi merupakan pengelompokan konsumen menurut

aspek lokasi seperti tempat tinggalnya. Segmentasi satu ini tentu tidak
40

kalah penting dari lainnya mengingat kebutuhan maupun kegunaan

suatu produk dan jasa selalu akan berbeda-beda tergantung pada lokasi,

keadaan, maupun cuaca. Segmentasi data dapat melakukan tahapan

metode pada data engineering (“Pengenalan Pembelajaran Mesin dan

Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro, U”).

Dan data engineering merupakan salah satu sub bidang dari

Software Engineering yang berfokus pada praktik membangun dan

mendesain sistem guna mengumpulkan, menyimpan, dan menganalisis

data dengan jumlah yang besar. Dan data engineering adalah bidang

yang sangat luas dan bisa diterapkan dalam berbagai jenis industri.

Dengan adanya data engineer perusahaan akan bisa mengumpulkan data

dalam jumlah yang sangat besar dan memastikan data tersebut siap

digunakan oleh data scientist dan data analyst (“Pengenalan Data

Engineering,05,2018, Widya Accarya”).

2. Market Basket Analysis

Market basket analysis atau MBA adalah teknik penambangan

data yang digunakan oleh pengecer untuk meningkatkan penjualan

dengan lebih memahami pola pembelian pelanggan. Ini melibatkan

analisis kumpulan data besar, seperti riwayat pembelian, untuk

mengungkapkan pengelompokan produk, serta produk yang

kemungkinan akan dibeli bersama (“Pengenalan Pembelajaran


41

Mesin dan Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro,

U.”).

Penerapan market basket analysis atau MBA dibantu oleh

munculnya sistem point-of-sale (POS) elektronik. Dibandingkan

dengan catatan tulisan tangan yang disimpan oleh pemilik toko,

catatan digital yang dihasilkan oleh sistem POS memudahkan

aplikasi untuk memproses dan menganalisis data pembelian dalam

jumlah besar.

Implementasi market basket analysis atau MBA memerlukan

latar belakang statistik dan ilmu data, serta beberapa keterampilan

pemrograman komputer algoritmik. Bagi mereka yang tidak

memiliki keterampilan teknis yang dibutuhkan, ada alat komersial

yang tersedia.

3. Q-Learning

Q-Learning merupakan salah satu algoritma yang berada pada

kategori Reinforcement Learning alias Reinforced Learning. Model

yang digunakan untuk mengidentifikasi kebijakan pemilihan

tindakan untuk mengontrol domain Markovian secara optimal, atau

kumpulan data grafis tak terarah dari bidang acak. Algoritma secara

iteratif mendekati utilitas yang diharapkan dari tindakan saat ini dan

mengembangkan kebijakan dengan imbalan tertinggi (akurasi nilai

yang diharapkan) untuk status fungsi Q di masa mendatang.


42

Teknik ini banyak digunakan dalam perencanaan gerak dan

aplikasi berbasis navigasi di robotika, mobil dan video game.

Kelayakan setiap algoritma tergantung pada beberapa

pertimbangan, termasuk akurasi dan linieritas klasifikasi yang

diperlukan, waktu pelatihan dan jumlah parameter yang digunakan

untuk menghasilkan hasil yang sesuai (“Pengenalan Pembelajaran

Mesin dan Deep Learning, 1.4 , 2020,Adhiguna Surya Kuncoro,

U.”).

Setiap model juga dapat membuat asumsi khusus untuk

mempercepat kinerja atau memberikan hasil yang bermanfaat.

Pengorbanannya paling baik dikembangkan setelah pemahaman

yang mendetail dan menyeluruh tentang cara kerja setiap model dan

persyaratan pembelajaran mesin dari kumpulan data

2.3 Prepocessing Data

Preprocessing merupakan proses awal yang akan mentransformasikan data

masukan menjadi data dengan format yang sesuai dan siap untuk diproses. Beberapa

contoh hal yang dilakukan dalam preprocessing meliputi berbagai proses yang

diperlukan. Penggabungan, pengubahan bentuk, ataupun pentransformasian data

sebagai cara untuk membersihkan, mengintegrasikan, mereduksi dan mendiskritisasi.

Lebih lanjut proses yang ada alam preprosesing dapat terdiri dari salah satu

kegiatan proses ataupun gabungan dari beberapa proses diatas. Proses yang ada
43

tergantung dari tujuan yang akan dicapai dalam preprocessing tersebut (Karthick &

Malathi, 2015). Pemilihan proses yang tepat perlu dilakukan mengingat karena proses

yang sesuai dalam tahapan preprocessing data akan meningkatkan performansi

klasifikasi (Raviya & Gajjar, 2019).

Data preprocessing biasanya digunakan pada aplikasi rule-based dan yang

berbasis database. Dalam machine learning, kegiatan ini sangat penting untuk

memastikan bahwa big data sudah diformat dan informasi yang dikandungnya dapat

ditafsirkan dan algoritma perusahaan.

Ada 3 tahapan utama Data Preprocessing sebagai berikut :

1. Data Cleaning

Dalam langkah data cleaning, data mentah akan dibersihkan melalui

beberapa proses seperti mengisi nilai yang hilang, menghaluskan noisy data,

dan menyelesaikan inkonsestensi yang ditemukan. Data juga bisa dibersihkan

dan dirapikan menggunakan segmen-segmen yang memiliki ukuran serupa lalu

dihaluskan (binning), dengan fungsi regresi linear atau berganda (regression),

atau dengan mengelompokkannya ke dalam kelompok data yang serupa

(grouping).

2. Data Integration

Data integration adalah tahap yang menggabungkan data dari berbagai

sumber menjadi satu kesatuan data (dataset). Dalam proses penggabungan


44

tersebut, data dengan format yang berbeda harus diubah terlebih dahulu ke

format yang sama. Secara keseluruhan, proses integrasi data ini ditujukan untuk

menyatukan dan membuat data menjadi lebih halus melalui upaya-upaya

sebagai berikut.

 Memastikan data memiliki format dan atribut yang sama

 Menghapus atribut yang tidak dibutuhkan dari semua sumber data

 Mendeteksi nilai data yang konflik

3. Data Transformation

Pada tahap ini, data akan dinormalisasi dan digeneralisasi. Normalisasi

data dilakukan untuk memastikan bahwa tidak ada data yang berlebihan,

sementara generalisasi data dilakukan untuk menyeragamkan data.

Data transformation memungkinkan Anda untuk mengubah struktur data,

format data, dan nilai data menjadi sebuah dataset yang sesuai untuk proses

mining ataupun algoritma yang sudah dirancang.

Terdapat setidaknya lima langkah yang dapat dilakukan dalam proses data

transformation, yaitu:

1) Agregation: Langkah untuk menggabungkan semua data dalam format

yang seragam.

2) Normalization: Langkah untuk mengubah data ke dalam skala yang

teratur sehingga dapat dibandingkan dengan lebih akurat.


45

3) Feature Selection: Langkah untuk menentukan variabel apa saja yang

paling penting untuk analisis, di mana variabel ini juga akan digunakan

untuk melatih model machine learning atau kecerdasan buatan.

4) Discreditization: Langkah untuk mengumpulkan data ke dalam interval

yang lebih kecil. Misalnya, saat menghitung latihan harian rata-rata,

Anda bisa mengelompokkannya menjadi 0-15 menit, 15-30 menit, dan

seterusnya, daripada menggunakan menit dan detik secara rinci.

5) Concept Hierarchy Generation: Langkah untuk menambahkan hirarki

baru di dalam dataset.


BAB III

GAMBARAN UMUM

BISA AI ACADEMY PT BISA ARTIFISIAL INDONESIA

Logo BISA AI (https://bisa.ai/ )

3.1 Sejarah Perusahaan

BISA AI merupakan start up yang mengembangkan layanan dan produk

seputar Artificial Intelligence yang didirikan pada tahun 2019. Layanan-

layanan yang pertama kali kembangkan oleh BISA Al diantaranya: Image

Recognition Service, Video Analytics Service Language Service, Data Analysis

Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama

46
47

dengan banyak perusahaan dalam menyelesaikan masalah melalui Artificial

Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.

Pada tahun 2020, BISA AI dapat fokus mengembangkan dua produk

utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya

sederhana, dengan BISA Tampil sebagai platform video conference dan BISA

AI Academy sebagai platform pembelajaran daring.

Namun akhirnya BISA AI berkembang dan memanfaatkan kesempatan

yang ada, ini menghasilkan diantaranya: BISA Tampil yang menjadi platform

kolaborasi dan penyelenggaraan webinar, bootcamp dan event online dan BISA

AI Academy yang selain menjadi platform pembelajaran daring, dapat menjadi

platform pencarian kerja, freelance, diskusi dan masih banyak lagi yang

lainnya.

Perkembangan BISA AI ini menandakan bahwa dari setiap langkah dan

kesempatan yang BISA Al raih dapat bermanfaat dan membantu masyarakat

dalam mencari ilmu, menyelesaikan masalah hingga meraih kesuksesan di

masa depan.

3.2 VISI MISI Bisa IA

Visi :

Menjadi startup terdepan di Indonesia di bidang pembelajaran AI.

Misi :
48

Mencerdaskan kehidupan bangsa dengan AI melalui pelatihan dan

webinar. Kami adalah start up yang mengembangkan layanan seperti

custom project di bidang Kecerdasan Artifisial guna memenuhi

kebutuhan masyarakat, industri dan pemerintah dan 2 produk seputar

Artificial Intelligence yang didirikan pada tahun 2019, seperti:

 Tampil yang menjadi platform kolaborasi dan penyelenggaraan

webinar,

 BISA AI Academy platform aplikasi pembelajaran daring yang

berisi pembelajaran Kecerdasan Artifisial dan subset-nya yang

dapat diakses melalui aplikasi Android dan iOS, juga.

3.3 Struktur Organiasi BISA AI Pada Tahun 2022

M. Octaviano
Pratama, S.Kom.,
M.Kom.
President Director

Pamela Kareen,
Ir. Wira Satywan,
S.T., M.Kom.
CISA., CISSP.
Operasional
Komisaris
Director

( Sumber : https://bisa.ai/ )
49

3.4 Lokasi BISA AI 2022

Denah lokasi BISA AI EduPlex Coworking Space Jl. Ir. H. Juanda

No.84, Lebakgede, Kecamatan Coblong, Kota Bandung, Jawa Barat

40132 .

Gambar 3. 1 Gambar Kantor BISA AI (https://bisa.ai/ )


BAB IV

PEMBAHASAN

Studi Independen Bersertifikat adalah bagian dari program Kampus Merdeka

yang bertujuan untuk memberikan kesempatan kepada mahasiswa untuk belajar dan

mengembangkan diri melalui aktivitas di luar kelas perkuliahan, namun tetap diakui

sebagai bagian dari perkuliahan. Program ini diperuntukkan bagi mahasiswa yang ingin

memperlengkapi dirinya dengan menguasai kompetensi spesifik dan praktis yang juga

dicari oleh dunia usaha dunia industri.

4.1 Kegiatan MSIB

Kegiatan MSIB ini terdiri dari beberapa kegiatan wajib yang

dilaksanakan pada PT BISA ARTFISIAL INDONESIA dan kegetian ini dibagi

menjadi 6 kegiatan antara lain ialah :

4.1.1 Pembelajaran Terjadwal

Mengikuti course wajib atau pilihan terkait masing - masing program

melalui pembelajaran tatap muka secara daring dengan instruktur.

Pelaksanaan selama 3 bulan pertama program melalui platform

TAMPIL ID (https://tampil.id) untuk pembelajaran tatap muka dan E-

Learning Bisa (https://elearning.bisaai.id) untuk bahan materi ajar.

Peserta diwajibkan mengambil minimal 2 Kelas Wajib, 1 Kelas Project

Capstone dan minimal 2 kelas Pilihan. maksimal kelas yang dapat

50
51

diambil mahasiswa adalah 10 kelas. Untuk mengambil pembelajaran

terjadwal, anda harus harus mengambil pembelajaran terjadwal melalui

https://msib.bisa.ai pada jadwal yang telah ditentukan (Rencana

Pengambilan Pembelajaran Terjadwal / RPPT). Anda dapat mencoba

kelas yang berjalan selama 1 minggu untuk kemudian dapat melakukan

add/drop RPPT. Pada minggu ke-2 kelas berjalan, anda tidak

diperkenankan mengganti kelas. Jumlah kelas yang anda ambil minimal

5 kelas dan maksimal 10 kelas pembelajaran terjadwal. Pada kelas :

 Kehadiran Pembelajaran terjadwal

 Studi Independen pada kelas

 Quiz, Pre-test, Post-test dan Tugas

 UAS / UTS / Project

Pembelajaran terjadwal yang telah di ikuti setiap masing masing

mahasiswa adalah 8 maksimal dan 6 minimal matakuliah dan yang telah

di ikuti ada 7 matakuliah ikuti antara lain :

1. Data Science

2. Project Capstone

3. Fullstack Development

4. Bisnis Startup

5. Image Procesing

6. Cyber Security
52

7. Cloud computing

4.1.2 Pembelajaran Mandiri

Mengikuti pembelajaran mandiri melalui MOOC (Massive Online Open

Courses) BISA AI Academy. Pelaksanaan selama 5 bulan SIB. Peserta akan

diarahkan untuk enroll course Gratis dan Premium dari Bisa AI Academy

(https://bisa.ai ), Bisa Design Academy (https://bisa.design ), Bisa Network

Academy (https://academy.bisa.network) dan Bisa Business Academy

(https://bisa.business ). Saat ini terdapat lebih dari +120 Learning Course

dan +20 Course Premium yang terdapat di seluruh platform digital Bisa AI

Academy yang dapat diikuti mahasiswa.

Dalam 1 periode SIB, anda diwajibkan mengambil minimum 10 Course

selama 1 semester. Komponen penilaian sebagai berikut:

 Jumlah Course mandiri yang diambil

 Nilai Quiz dan Tugas setiap course mandiri

Dalam pembelajaran , mandiri ini cukup sulit dalam pengisian silabus yang ada

karna sering terjadi perbedaan materi yang berbeda dengan soal yang di

terapkan dan kurang lengkap materi untuk pengisian dan adanya kurang jelas

pertanyaan soal yang ada. Dan beberapa lampiran sertifikat yang telah

didapatkan selama pembelajaran mandiri pada BISA AI.

Ada 10 course mandiri yang telah diikuti antara lain :

1. Manajamen Startup
53

2. Cloud Computing

3. Cyber Security Kali Linux

4. Data Science

5. Dasar – Dasar NodeJS

6. Image Processing

7. Pemrograman GO

8. Pengenalan Sistem Operasi Linux

9. Image Processing With OpenCV

10. Bisnis Startup Digital

Jadwal kegiatan yang telah dilaksanakan antara lain :

Tabel 4. 1Jadwal Kegiatan


Minggu/Tgl Kegiatan Hasil
Minggu ke 1 Kegiatan pada 15 Agustus 2022 hingga 19

15 - 19 Agustus 2022 para peserta MSIB BISA IA

Agustus 2022 melakukan pengisian KRS pada hari pertama

serta para mahasiswa mengambil mengambil

matakuiah yang diminati pada siakad masing

dan diberikan akses oleh para mentor yang

bertugas pada mitra BISA AI dan pada hari

kedua para peserta melakukan pembelajaran

mandiri dari course BISA AI seperti dasar

dasar python seperti pembelajaran dasar


54

Minggu/Tgl Kegiatan Hasil


seperti bilangan rekursif dan sebagainya, pada

hari Rabu merupakan libuar nasional

mempringati hari kemerdekaan republik Terlaksana

Indonesia . Pada hari, Kamis peserta MSIB

angkatan 2 dan 3 mengikuti acara kegiatan

pisah sambut MSIB angkatan 2 dan 3 , dan

peserta mengisi absen dan testimoni dari link

form kampus merdeka , dan pada hari, jumat

para peserta MSIB dari BISA AI melakukan

course secara mandiri seperti dasar-dasar

Python mengerjakan suatu project pada course

mandiri yang ada pada website Bisa IA dan

belajar materi yang akan diselenggarakan dan

melihat E- learning pada mitra BISA IA dan

melihat pembelajaran apa saja yang akan

dilakukan dan melihat materinya

Minggu ke-2 22 Pada hari Senin, 22 Agustus 2022 hingga

-26 Agustus jumat tanggal 26 agustus 2022 para peserta

2022 MSIB Bisa AI melakukan course terjadawal

dan course mandiri, dan pada hari Senin, 22


55

Minggu/Tgl Kegiatan Hasil


Agustus para peserta mengikuti kegiatan

onboarding MSIB batch 3 pada pagi dan

setelah kegiatan tersebut saya dan peserta

lainya mengikuti 2 kegiatan terjadwal yakni

fullstack programming dan memahami dasar

dari fullstack dengan materi dasar python dan

bisnis startup dengan materi dasar bisnis Terlaksana

startup, pada hari kedua tanggal , 23

Agustus 2022 para peserta mengikuti jadwal

materi Data Science dan mempelajari tentang

data science data analyst dan data engineer dan

mengisi soal pretest dan post test tentang

pemahaman materi masing masing data

science seperti apa itu data science. Pada hari

ketiga 24 Agustus 2022, saya mengikuti mata

kuliah Cloud Computing dari Cloud Huawei

dan mempelajari cara akses sebuah Cloud pada

huawei dan mengenal apa itu Cloud

Computing. Hari keempat 25 Agustus 2022

para peserta mempelajari matkul IOT dan


56

Minggu/Tgl Kegiatan Hasil


mengerti dasar, pengertian, alat, dan

konektivitas dari ioT agar bisa memahami apa

itu IOT para peserta juga mengikuti matkul

Project IA-Hacker dan mengambil tema dari

masing - masing kelompok memiliki tema

masing masing yang di minati sebanyak 3

orang dalam kelompok. Dan pada Jumat

tanggal 26 Agustus 2022 peserta MSIB BISA

IA mengikuti pembelajran tamu dengan tema

Design Engineering In Manufacture dan

mepelajari dasar dan struktur dari Manufacture

dari mentor dan pemahaman tentang industri

dari sebuah manufaktur dan ilmu design

engineering dari sebuah industri manufaktur.

Minggu ke-3 Laporan Senin, 29 Agustus hingga 03

29 September 2022 ialah pada senin saya

Agustus - 02 mengikuti pembelajaran Fullstack

September 2022 Development dan bisnis startup yaitu

mempelajari dari materi Fullstack

Development adalah tentang databse key


57

Minggu/Tgl Kegiatan Hasil


seperti MYSQL RDBMS struktur database Terlaksana

dengan DDL dan belajar membuat databse.

Dan yang kedua ialah bisnis startup yaitu para

peserta mempresentasikan sebuah pengertian

contohnya tentang metaverse edutech dan lain

lain . Pada hari Selasa, 30 Agustus saya

mengikuti course terdawal yaitu Data Science

dan mempelajari tentang python .dasar dan

juga memahami apa itu python . dan juga

saya dan peserta lainya mengerjakan

latihan sebanyak 10 soal deng google colab

contohnya membuata data diri dengan python

colab dan materi lainnya. Dan pada Rabu, 31

Agustus aya belajar tentang materi Cloud

Computing dengan menggunakan sistem

operasi linux secara basic dan memahami

apaitu linux dan cara penggunaanya

bagaimana dan cara mengisntal sebuah sistem

cloud pada linux dengan metode CMD

kedalam sebuh cloud. Dan selanjutnya pada


58

Minggu/Tgl Kegiatan Hasil


Kamis, 01 September saya mengikuti

pembelajaran project AI-Hacker yaitu setiap

kelompok mempresentasikan tema dari setiap

kelompok yang ada dan program apa yang

ingin dibuat untuk project akhir, dan pada

pertemuan kedua saya mengikuti pembelajaran

image processing memperlajari tentang

operasi dasar citra digital dan mempelajari

berbagai level pada dasar citra digital dan

mengenal berbagai level citra digital seperti

pembelajran tentang pixel dan mempelajari

berbagai operasi yang ada pada image

processing contohnya operasi aritmatika. Dan

pada Jumat, 02 September saya melakukan

pembelajaran mandiri yaitu course mandiri

dengan pembelajaram materi machine learning

yang pada pada course academy BISA AI

.dengan pembelajaran dasar dasar machine

learning dan decision tree dan cara

pemahaman tentang machine learning. Dan


59

Minggu/Tgl Kegiatan Hasil


pada Sabtu, 03 September saya mengikuti

pembelajaran Cyber Security dan memelajari

tentang dasar dari system oprasi linux dan cara

penggunaanya.

Minggu ke-4 05 Laporan minggu ke 4, pada Senin, 05

- 09 September September saya mengikuti pembelajaran

2022 Fullstack Development dan mempelajari

tentang pembuatan database dengan

phpmyadmin dengan membuat database

CRUD dan di buat menggunakan dengan

python PYSQL dengan JSON, dan pada

pembelajaran kedua saya mengikuti Terlaksana

pembelajaran bisnis startup yaitu sertai

kelompok mempresentasikan hasil dikusi

tentang startup GoTo dan BMC nya

mengetahui apa iru GoTo dan pada Selasa, 06

September 2022 saya mengikuti pembelajaran

data science dan saya mempelajari tentang

python dengan tema Exploratory Data

Analysis dan para peserta dapat bisa


60

Minggu/Tgl Kegiatan Hasil


memmahami apa itu EDA (Exploratory Data

Analysis) dalam python dan mempraktekan

dara penggunaan dari EDA itu sendiri. Hari

ketiga saya mengikuti pembelajaran Cloud

Computing dan mempelajari cara mengakses

sebuah database dan membuat sebuah database

pada phpmyadmin setelah itu membuat akses

dengan code data python degan akses cmd dan

membuat sebuah API pada postman dengan

quary yang ada pada databse phpmyadmin dan

pada Kamis, 08 September 2022 saya

mengikuti pembelajaran IOT pada pertemuan

pertama dan mempelajari tentang kontrol

urdino, dan pada pertemuan kedua saya

megikuti pembelajaran project AI-Hacker dan

masing masing kelompok menjelaskan tentang

prototype program kelompok masing masing

dan pertemuan trakhir adalah mempelajari

tentang Image Processing mempelajari citra

warna sebuah digital . dan pada Jumat, 09


61

Minggu/Tgl Kegiatan Hasil


September 2022 saya melakukan pembelajaran

mandiri yaitu mengerjakan course secara

mandiri yang saya kerjakan Ialah Image

Processing dan Data Science dan saya

mengerjakan silabus yang ada dan

mempelajari kuis dan tugas akhir yang akan

dikerjakan selanjutnya.

4.1.3 Pembelajaran Tamu

Peserta diarahkan untuk mengikuti webinar dengan narasumber industri,

dan dilaksanakan setiap hari mengikuti minat peserta akademisi dan pelaku

bisnis serta mitra BISA AI Academy melalui https://tampil.id. Pelaksanaan

program selama 5 bulan SIB dan komponen penilaian sebagai berikut:

 Jumlah webinar yang diambil / diikuti


62

 Durasi mengikuti webinar / keaktifan mengikuti webinar

Gambar 4. 1 Pembelajaran Tamu (https://bisa.ai/ )

4.1.4 Project Capstone

Proyek Capstone, yaitu mengerjakan proyek pada masing - masing

program. Proyek Industri yang diberikan adalah proyek Riil/case study

terkait dengan 8 Aktivitas yang diikuti oleh mahasiswa. proyek ini

diberikan dengan tujuan mahasiswa memiliki gambaran dan pengalaman

proyek pada startup digital. Pelaksanaan selama 3 bulan SIB dan project

capstone ini dilaksanakan pada hari kamis pada pukul 15:30 – 17:30 .

Project Capstone akan diampu oleh 2 mentor untuk setiap aktivitas. Peserta

dapat secara aktif diskusi / share progress setiap minggu-nya. Komponen

penilain secara umum:

• Weekly meeting / cek progress rutin

• Proses dan Luaran project capstone

• Keaktifan peserta
63

Ada 8 Aktifitas yang dilakukan oleh proyek ini antara lain :

1. Pertemuan mingguan

2. Progress yang akan dipilih dengan tema yang akan dipilih

3. Diskusi project yang akan dibuat bersama kelompok

4. Pelaporan project yang dipilih

5. Membuat dataset melalui riset dan survei

6. Proses bimbingan progress dengan mentor

7. Pelaporan hasil project yang telah dibuat

8. Mengumpulkan project akhir dalam bentuk laporan hasil project

4.1.5 Membangun Digital Startup

Dimana mahasiswa didorong untuk membuat bisnis plan hingga

membuat startup digital terkait dengan 8 aktivitas program. Startup digital

yang dibangun nantinya akan diberikan fasilitas pembuatan startup seperti

Cloud, fasilitas legal, dan pendanaan. Pelaksanaan selama 2 bulan SIB

kegiatan ini di lakukan pada senin pukul 19;00 – 21:00 wib .

Program yang kelompok kami kembangkan untuk digitak startup ialah NFT

Gaming program yang berbentuk uang kripto dengan bermain game atau

disebut dengan play-to-earn. Untuk mendapatkan uang dengan bermain

game, sangat bervariasi tergantung dari jenis permainan yang kamu pilih.

Pitching deck NFT(Non Fungible Token ) Gaming antara lain :


64

a. NFT dalam game dapat memperkaya tingkat engagement para

gamer, terutama seseorang yang sudah lama memainkan game

tersebut.

b. Game NFT dapat memberi pemain prospek pendapatan yang

substansial. Artinya peluang untuk menghasilkan pendapatan yang

luar biasa akan menarik banyak gamer ke dunia game NFT.

c. Nilai token kepemilikan dalam game dapat meningkat seiring

dengan peningkatan minat

Mockup & Prototype sebagai berikut :

Gambar 4. 2 Tampilan Mockup & Prototype menu 1


65

Gambar 4. 3 Tampilan Mockup & Prototype menu 2

4.1.6 Rangkaian Pembelajaran Terjadwal Pada AI Hacker

Pada pembelajaran terjadwal ini mengikuti pembelajaran yang telah

memilih dalam sesi pemilihan mata kuliah yang diambil pada siakad Bisa AI

da nada beberapa pembelajaran wajib yaitu data science dan fulstack

development dan 1 project capstone pembelajaran project .

Dan pembelajaran pilihan merupakan pembelajaran yang dipiliah oleh

mahasiswa masing masing yang diminati. Peninalaian yangmengenai pengajar

cukup baik dan beberapa yang menurut kurang baik antara lain mentor dari

bisnis start up digital. Dan ada beberapa pilihan jurusan pada BISA

ARTIFISIAL INDONESIA antara lain sebagai berikut :

1. AI-Hacker

Pada bidang Hacker merupakan bidang yang bergerak dibidang

teknologi informasi dimana teknologi kecerdasan keamanan jarring

dan big data.


66

2. AI-Game

Bidang ini bergerak di bidang teknologi kecerdasan dalam bentuk

game dan perngkat lunak dalam pembuatan game.

3. AI-Hipster

Hipster memastikan praktik pemasaran, branding¸ dan tampilan

produk dapat memberikan kepuasan terbaik bagi pengguna. Hipster

lebih fokus dalam melahirkan inovasi baru dari setiap produk yang

dimiliki.

4. AI-Hustler

Hustler merupakan orang yang berperan dalam memastikan

keuntungan perusahaan. Hustler harus memiliki visi jangka pendek

dan jangka panjang dan jeli dalam melihat peluang. Hustler

berperan dalam membangun tim, mengelola seluruh pekerjaan,

membentuk model bisnis, dan memimpin tim. Biasanya, peran

hustler disebut juga sebagai CEO.

5. AI-Manufacture

Bidang Proses manufaktur sendiri merupakan sebuah kegiatan atau

proses produksi mengubah bentuk bahan baku menjadi bahan jadi.

Adapun proses manufaktur berawal dari mendesain produk,

menentukan spesifikasi bahan dari mana produk tersebut dibuat.


67

6. AI- BLOCKCHAIN

Pada bidang Blockchain seperti Blockchain Development,

Blockchain Data Analytics dan Blockchain Bisnis. Selama proses

Studi Independen Bersertifikat, para peserta akan mengikuti

berbagai kegiatan seperti pembelajaran terjadwal, pembelajaran

mandiri, pembelajaran tamu industri mitra BISA AI Academy,

proyek industri.

7. AI- Infra

Bidang Infrastruktur jaringan merupakan sebuah kumpulan sistem

komputer yang saling berhubungan, dihubungkan oleh berbagai

macam bagian dari sebuah arsitektur telekomunikasi. Secara

khusus, infrastruktur ini mengacu pada organisasi dan berbagai

bagian konfigurasi dari jaringan komputer individu sampai pada

router, kabel, wireless access point, switch, backbone, network

protocol, dan network access methodologies.

4.2 Lingkup Pekerjaan

Seorang mentoring akan mendampingi kurang lebih 18 - 40 peserta

MSIB (mahasiswa) dalam satu kelas. Terdapat dua jenis fasilitator,

yakni:

a) Homeroom Mentoring
68

Homeroom mentoring bertugas menyampaikan materi tentang

dasar-dasar AI, memberikan penilaian pada peserta dan

membimbing peserta saat pengerjaan Proyek Akhir (PA).

b) Domain Mentoring

Domain mentoring bertugas menyampaikan materi tentang

domain AI dan memberikan penilaian pada peserta. Lingkup

pekerjaan peserta adalah mengikuti kelas bersama homeroom

mentoring atau domain coach dan mengerjakan semua

assessment yang diberikan sesuai agenda kelas hingga program

selesai.

c) Deskripsi pekerjaan

 Kehadiran pembelajaran terjadwal

 Study independen pada kelas

 Quiz,pre-test,post-test,dan Tugas

 UAS/UTS dan project

 Pembelajaran tamu

 Pembelajaran mandiri

 Project capstone

 Membangun startup digital


69

4.3 Rincian Program

BISA AI merupakan start up yang mengembangkan layanan dan produk

seputar Artificial Intelligence yang didirikan pada tahun 2019. Layanan-

layanan yang pertama kali kembangkan oleh BISA Al diantaranya: Image

Recognition Service, Video Analytics Service Language Service, Data Analysis

Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama

dengan banyak perusahaan dalam menyelesaikan masalah melalui Artificial

Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.

4.4 Tujuan Program

Tujuan yang diharapkan setelah peserta mengikuti program ini adalah:

1. Memiliki wawasan tentang AI dan perkembangannya.

2. Mampu merancang dan mengimplementasikan AI Project

Cycle.

3. Mampu menggunakan bahasa pemrograman Python untuk

mengembangkan aplikasi AI.

4. Mampu mengembangkan salah satu dari 4 domain AI (DS, NLP,

CV, RL) hingga tahap deployment.

5. Mampu menggunakan soft skills dan hard skills dalam dunia

industri dan lingkungan perusahaan.

6. Mampu mengaplikasikan kiat-kiat yang dibutuhkan seorang

wirausahawan yang bergerak di bidang start-up dalam


70

mentransformasikan ide ke dalam bentuk produk/jasa sehingga

dapat menciptakan peluang bisnis yang terus berinovasi,

berevolusi, dan berkelanjutan.

4.5 Uraian Tugas Peserta

Dalam hal ini ada beberapa tugas yang di lakukan oleh peserta MSIB

antara lain :

1. Kehadiran pembelajaran terjadwal

2. Study independen pada kelas

3. Quiz,pre-test,post-test,dan Tugas

4. UAS/UTS dan project

5. Mengikuti program dari awal hingga selesai.

6. Mematuhi aturan program.

7. Mematuhi aturan kelas yang dibuat bersama oleh peserta dengan

homeroom mentoring atau domain mentoring.

8. Mengikuti kelas daring secara aktif dengan presensi minimal

85%.

4.6 Membuat Project Akhir Segmentasi Alokasi Dana Pelanggan

Segmentasi pelanggan adalah suatu cara untuk mengelompokkan

pelanggan ke dalam beberapa kelompok (cluster) dan setiap kelompok

memiliki beberapa anggota dengan karakteristik. yang sama. Usaha untuk


71

mengklasifkasikan objek-objek dengan suatu kesamaan ke dalam satu grup

tersebut juga dapat dikatakan sebagai clustering. Analisis cluster akan

membangun suatu cluster yang baik ketika setiap anggota dari clustermemiliki

derajat kesamaan yang tinggi dalam proses membuat segmentasi ini adalah

sebagai berikut:

4.6.1 Mempersiapkan Library Yang Dibutuhkan

Persiapkan berbagai library yang akan digunakan seperti Pandas, NumPy,

Scikit-learn, dan Matplotlib

Source Code :

import numpy as np

from google.colab import drive

import tensorflow as tf

import tensorflow.keras

import pandas as pd

4.6.2 Set Hyperparameter dan Mempersiapkan Dataset

Disini mempersiapkan beberapa variabel hyperparameter dan dataset yang telah

kami dapatkan dengan cara mengunggahnya pada platform Google Colab. Dataset

yang berupa csv, harus diubah dulu kedalam bentuk DataFrame menggunakan

library Pandas.

Source Code :
72

df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Family Income and

Expenditure.csv')df

Gambar 4. 4 Tampilan Dataset

Keterangan :

df = pd.read_csv : perintah untuk menampilkan dataset csv kedalam bentuk data

tabular atau dataframe.

4.6.3 Preprocessing Data

Preprocessing Data ini adalah proses dimana data yang berupa objek akan

mengalami proses encoding menjadi atribut baru dengan nilai 0 atau 1. Lalu,

data akan dipetakan dan dicari korelasi antar atriburnya. Data yang kosong dan

berelasi rendah akan dibersihkan.

Source code :
73

df = pd.DataFrame({'Total Household Income':[int(x) for x i

n df[['Total Household Income']].values],

'Communication Expenditure':[int(x) for

x in df[['Communication Expenditure']].values],

'Housing and water Expenditure':[int(x)

for x in df[['Housing and water Expenditure']].values],

'Miscellaneous Goods and Services Expend

iture':[int(x) for x in df[['Miscellaneous Goods and Servi

ces Expenditure']].values],

'Clothing, Footwear and Other Wear Expen

diture':[int(x) for x in df[['Clothing, Footwear and Other

Wear Expenditure']].values],

Gambar 4. 5 Prepocessing Data


74

Keteragan :

df = pd.DataFrame : perintah untuk menampilakn tabular data

[int(x) for x in : Perulangan for akan dijalankan sebanyak jumlah elemen yang

ada di dalam variable dan int merupakan tipe data integer yang merupakan bilanagan

bulat.

4.6.4 Otomatisasi Mencari Korelasi Tertinggi dengan Atribut Dependent

Algoritma akan mencari dan menyimpan n (jumlah atribut) atribut dengan korelasi

tertinggi dari antara atribut dengan atribut dependent yang dipilih. Dengan

menggunakan saborn HeatMap :

Source Code :

import seaborn as sns

plt.figure(figsize=(20,20))

corr = df.corr()
75

sns.heatmap(corr, annot=True)

Gambar 4. 6 Tampilan Korelasi Heatmap

Index data frame HeatMap object diatas antara lain :

Total Household Income', 'Region', 'Total Food Expenditure',

'Main Source of Income', 'Agricultural Household indicator',

'Bread and Cereals Expenditure', 'Total Rice Expenditure',

'Meat Expenditure', 'Total Fish and marine products

Expenditure', 'Fruit Expenditure', 'Vegetables Expenditure',

'Restaurant and hotels Expenditure', 'Alcoholic Beverages

Expenditure', 'Tobacco Expenditure', 'Clothing, Footwear and

Other Wear Expenditure', 'Housing and water Expenditure',


76

'Imputed House Rental Value', 'Medical Care Expenditure',

'Transportation Expenditure', 'Communication Expenditure',

'Education Expenditure', 'Miscellaneous Goods and Services

Expenditure', 'Special Occasions Expenditure', 'Crop Farming

and Gardening expenses', 'Total Income from Entrepreneurial

Acitivites', 'Household Head Sex', 'Household Head Age',

'Household Head Marital Status', 'Household Head Highest Grade

Completed', 'Household Head Job or Business Indicator',

'Household Head Occupation', 'Household Head Class of Worker',

'Type of Household', 'Total Number of Family members',

'Members with age less than 5 year old', 'Members with age 5 -

17 years old', 'Total number of family members employed',

'Type of Building/House', 'Type of Roof', 'Type of Walls',

'House Floor Area', 'House Age', 'Number of bedrooms', 'Tenure

Status', 'Toilet Facilities', 'Electricity', 'Main Source of

Water Supply', 'Number of Television', 'Number of CD/VCD/DVD',

'Number of Component/Stereo set', 'Number of

Refrigerator/Freezer', 'Number of Washing Machine', 'Number of

Airconditioner', 'Number of Car, Jeep, Van', 'Number of

Landline/wireless telephones', 'Number of Cellular phone',

'Number of Personal Computer', 'Number of Stove with Oven/Gas

Range', 'Number of Motorized Banca', 'Number of

Motorcycle/Tricycle'], dtype='object'))

Data yang diambil sebagai data frame utama antara lain :


77

1. Total Household Income Communication Expenditure

Tabel 4. 2 Household Income


No Income Expenditire

0 480332 2880

1 198235 5700

2 82785 420

3 107589 660

4 189322 2100

... ... ...

41539 119773 600

41540 137320 1560

41541 133171 1080

41542 129500 1020

41543 128598 960

2. Housing and water Expenditure

Tabel 4. 3 Housing
No Expenditure

0 63636

1 41370

2 14340
78

3 16638

4 31122

... ...

41539 18372

41540 17640

41541 9240

41542 12438

41543 11316

3. Miscellaneous Goods and Services Expenditure

Tabel 4. 4 Miscellaneous
No Expenditure

0 34056

1 9150

2 6450

3 3762

4 8472

... ...

41539 3978

41540 6090

41541 3570
79

41542 5760

41543 6060

4. Clothing, Footwear and Other Wear Expenditure

Tabel 4. 5 Clothing, Footwear


No Expenditure

0 4607

1 8230

2 2735

3 1390

4 4620

... ...

41539 1395

41540 3136

41541 2460

41542 3755

41543 2320
80

Keterangan :

Expenditure atau biasa disebut dengan pembayaran yang dilakukan pada saat

ini untuk digunakan kewajiban pada masa yang akan dating dimana total

pemasukan dari pelanggan.

4.6.5 Menentukan Jumlah Segmentasi secara Otomatis dengan Metode

Elbow dan K-Means

Algoritma akan mencari dan menyimpan jumlah segmentasi yang

optimal berdasarkan signifikasi jarak antara jumlah segmentasi yang di

inputkan oleh secara otomatis. Dan untuk menampilkan diagram Inertia.

Metode Elbow merupakan salah satu metode untuk menentukan jumlah

cluster yang tepat melalui persentase hasil perbandingan antara jumlah cluster

yang akan membentuk siku pada suatu titik . Jika nilai cluster pertama dengan

nilai cluster kedua memberikan sudut dalam grafik atau nilainya

Source Code :

from sklearn.cluster import KMeans

wcss = []

for i in range(1,11):

kmeans = KMeans(n_clusters=i, init='k-

means++', random_state=42)

kmeans.fit(df)

wcss.append(kmeans.inertia_)

print(wcss)
81

plt.figure(figsize=(10,8))

plt.plot(range(1,11),wcss)

plt.title('Inertia')

plt.xlabel('n_clusters')

plt.ylabel('inertia')

plt.show()

Gambar 4. 7 Tampilan Diagram Inertia

4.6.6 Menampilkan Total Income Pada Segmentasi Dari Data Diagram

Heatmap

Tampilan ini untuk digunakan sebagai segmentasi ke dalam bentuk label

scatter menjadi bentuk 6 warna yang berbeda menjadi 3 Total Household

income . dan menggunakan diagram scatter plot dari data yang telah dipilih

sebagai clustering dan di prediksi ke dalam bentuk diagram .


82

Source code :

for i in [x for x in df.columns if (x!='Total Household Inc

ome' and x!='label')]:

plt.figure(figsize=(12,10))

for x in pd.unique(df['label']):

plt.title('Total Household Income with '+i)

plt.xlabel('Total Household Income')

plt.ylabel(i)

plt.scatter(df['Total Household Income'][df.label == x

], df[i][df.label == x])

plt.legend([1,2,3,4,5], loc = 'center right')

plt.show()

Gambar 4. 8 Tampilan Scatter Plot Total Household 1


83

Gambar 4. 9 Tampilan Scatter Plot Total Household 2

Gambar 4. 10 Tampilan Scatter Plot Total Household 3


84

4.6.7 Clustering Data

Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih

akan dipasangkan dan mengalami klusterisai atau segmentsai dengan algoritma

K-Means. Visual dari data yang telah mengalami segmentasi akan ditampilkan.

Souce code :

data_needed = {y : [float(x) for x in df[[y]].values] for

x,y in tmp}

data_needed[benchmark] = [float(x) for x in df[[benchmark]

].values]

data_needed

df = pd.DataFrame(data_needed )

df

Gambar 4. 11 Hasil Clustering


85

4.6.8 Prediksi Linear Data

Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih

akan dipasangkan dan akan dicari regresi linearnya dengan algoritma Linear

Regression-Means. Visual dari data dan regresi linearnya beserta dengan

MSE (Mean Square Error) akan ditampilkan. Dan 4 tampilan dari diagram

scatter plot. Dari total household income dari data yang telah di regresi dari

metriks dan linear data .

Souce code :

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error

from sklearn.preprocessing import MinMaxScaler

divider = int(len(df)*0.8)

for x in [y for y in df.columns if y != 'label' and y

!='Total Household Income']:

mms = MinMaxScaler()

df_x_train = df[['Total Household

Income']].iloc[:divider]

df_y_train = df[[x]].iloc[:divider]

df_x_test = df[['Total Household

Income']].iloc[divider:]

df_y_test = df[[x]].iloc[divider:]

lr = LinearRegression()
86

lr.fit(df_x_train,df_test)

mms = mms.fit(df_y_test)

df_y_test = mms.transform(df_y_test)

df_y_pred = mms.transform(lr.predict(df_x_test))

mse = mean_squared_error(df_y_test, df_y_pred)

plt.scatter(df[['Total Household

Income']].iloc[divider:], df[[x]].iloc[divider:])

plt.plot(df_x_test,lr.predict(df_x_test), color =

'red')

plt.xlabel('Total Household Income')

plt.ylabel(x)

plt.show()

print(f'MSE : {mse}')

lr.predict(df[[x]].iloc[divider:])

Gambar 4. 12 Linear Total Household Income Communication Expenditure


87

Gambar 4. 13 Linear Housing and water Expenditure

Gambar 4. 14 Linear Miscellaneous Goods and Services Expenditure


88

Gambar 4. 15 Linear Clothing, Footwear And Other Wear Expenditure

4.6.9 Data HeatMap Seaborn Uraian

Data heatmap yang telah di uraikan menjadi 4 bagian disesuaikan dengan

data pilihan yang telh dipilih sebagai data frame utama antara lain adaalah

Source code :

import seaborn as sns

plt.figure(figsize=(20,20))

corr = df.corr()

sns.heatmap(corr, annot=True)

p = []

for y in range(len(df.corr()[benchmark])):
89

tmp.append((abs(df.corr()[benchmark][y]),df.corr().c

olumns[y])) if df.corr().columns[y]!=benchmark else No

ne

tmp = list(filter(lambda x : not np.isnan(x[0]) ,tmp))

tmp.sort(key = lambda x : x[0], reverse=True)

tmp = tmp[:top_feature]

tmp

Gambar 4. 16 Hetamp 00 hingga 1.00 warna terang


90

Gambar 4. 17 Heatmap 00 hingga 1.00 warna gelap

Keterangan warna gelap dan terang pada heatmap :

Heatmap disebut juga visualisasi atau pemetaan dengan menampilkan data

dengan cara representasi warna yang berbeda-beda. Biasanya pada heatmap

semakin tinggi angka suatu kelompok data maka warnanya akan semakin

gelap dan umumnya disimbolkan dengan warna berwarna merah.


BAB V

PENUTUP

1. Kesimpulan

Dari hasil penelitian segmentasi prediksi dan klasterisasi data

engginerring ini di manfaatkan untuk pengetahuan tentang segmentasi dengan

metode prediksi dan klasterisasi data engineering alokasi dana pelanggan pada

study independen bersertifikat yang dilaksanakan pada PT BISA ARTIFISIAL

INDONESIA yang di gunakan sebagai projek akhir kelulusan study

independen.

Berdasarkan hasil penulisan diatas maka didapatkan hasil sebagai berikut:

1. Program MSIB ini adalah salah satu terobosan yang bagus untuk

memajukan pendidikan di Indonesia terutama bagi kalangan

mahasiswa. Dengan adanya kegiatan ini dapat mempermudah

mahasiswa untuk menyalurkan minatnya di bidang yang dituju.

2. BISA AI Academy (PT BISA ARTIFISIAL INDONESIA) merupakan

startup digital berbasis education technology (edutech) yang fokus pada

pembelajaran terkait Kecerdasan Artifisial (AI), Ilmu Data (Data

Science) dan subset lainnya. Selamat Datang di BISA AI Academy E-

Learning, E-learning ini akan menjadi penunjang Pembelajaran

Terjadwal di kegiatan program Magang Bersertifikat dan Studi

Independen Bersertifikat.

91
92

3. Sebagaimana hasil penelitian ini berhasil membuat sebuah project yaitu

segmentasi data engineering alokasi dana pelanggan dengan metode

prediksi dan klasterisasi.

2. Saran

Secara keseluruhan program sudah berjalan dengan baik dan para mentor juga

memiliki kapabilitas sesuai dengan keahlian masing-masing. Namun ada

beberapa masukan yang bisa dipertimbangkan diantaranya:

1) Untuk recording kadang lambat dalam pengaupload .

2) Ketika ada kelas yang setiap harinya 2-4 jam terlalu lama sehingga bisa

menyebabkan mahasiswa menjadi bosan dan tidak fokus lagi

memperhatikan materi yang disampaikan.

3) Untuk BISA AI diutamakan untuk lebih memperhatikan course yang di

berikan agar lebih di perbaiki lagi untuk soalnya.

4) Bagi kampus Universitas Aki Untuk lebih memperhatikan dalam

pemilihan bagi mahasiswa yang masuk dalam MSIB melaui mitra.


93

DAFTAR PUSTAKA

ActiveState. (2021). What Is Scikit-Learn In Python? Activestate.Com.


https://www.activestate.com/resources/quick-reads/what-is-scikit-
learn-in-python/

Afifah, L. (2020a). 3 Metode Normalisasi Data (Feature Scaling) di Python.


Imudatapy.Com. https://ilmudatapy.com/metode-normalisasi-data/

Afifah, L. (2020b). 5 Jenis Visualisasi Data Populer di Python dengan Matplotlib.


Https://Ilmudatapy.Com/. https://ilmudatapy.com/visualisasi-data-di-
python-dengan-matplotlib/

Aminuddin, J., Sehah, F.P. Zen, and H. Latief, 2008, Numerical Solution of Basic
Korteweg de Vries, Conference on Computational, Computing and Non Linear
Science, LIPI, Jakarta, Indonesia.

Aulia, P. U. F., & Saepudin, S. (2021). Penerapan Data Mining K-Means Clustering
Untuk Mengelompokkan Berbagai Jenis Merk Laptop. Sismatik
(Seminar Nasional Sistem Informasidan Manajemen Informatika), 209–
2017.
Barus, S.P. (2021). Implementation of Naïve Bayes Classifier-based Machine Learning
to Predict and Classify New Students at Matana University. Journal of Physics:
Conference Series 1842 (1), 012008

Edwardo, T. O. (2018). Penggunaan Python untuk Data Mining. Binus University


School of Computer Science.

Gartner. (2018). Gartner Says Global Artificial Intelligence Business Value to Reach
$1.2 Trillion in 2018. https://www.gartner.com/en/new sroom/press-
releases/2018-04-25-gartner-says-global-artificialintelligence-business-value-
toreach-1-point-2-trillion-in-2018.

Gustientiedina, Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma K-Means


Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru. Jurnal
Nasional Teknologi Dan Sistem Informasi, 05(01), 17–24. Hall
International, Inc
94

Harahap, B. (2019). Penerapan Algoritma K-Means Untuk Menentukan Bahan


Bangunan Laris (Studi Kasus Pada UD. Toko Bangunan YD Indarung).
READY-STAR (Regional Development Industry & Health Science,
Technology and Art of Life ), 2(1), 394–403.

Hosmer. D. W., Lemeshow. S. 1989. Applied Logistic Regression. John Wiley &
Sons, Inc Johnson. R. A., Wichern. D. W. 2007. Applied Multivariate
Statistical Analysis. Sixth Edition. New Jersey: Prentice

Jurnal Ilmiah Wahana Pendidikan, Agustus 2022, 8 (12), 198-210 Algoritma K-Means
Untuk Pengelompokan Bantuan Langsung Tunai (BLT) Muhamad Khandava
Mulyadien1 , Ultach Enri

Khalid, I. A. (2020). Customer Segmentation in Python. Towards Data Science.


Manalu, D. A., & Gunadi, G. (2022). Impelentasi Metode Data Mining K-Means
Clustering Terhadap Data Pembayaran Transaksi Menggunakan Bahasa
Pemrograman Python Pada Cv Digital Dimensi. Sekolah Tinggi
Manajemen Informatika dan Komputer (STMIK) Widuri Jakarta.

Miyamoto, S., Ichihashi, H., & Honda, K. (2008). Algorithms for Fuzzy Clustering –
Methods cMeans Clustering with Application. Springer- Verlag Berlin
Heidelberg.

Nishom, M. (2019). Perbandingan Akurasi Euclidean Distance, Minkowski Distance,


dan Manhattan Distance pada Algoritma K-Means Clustering berbasis
Chi-Square. JPIT (Jurnal Informatika: Jurnal Pengembangan IT), 4(1),
20–24.

LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel, A. (2014). Implementation of
machine learning for classifying hemiplegic gait disparity through use of a force
plate. 2014 13th International Conference on Machine Learning and
Applications, 379– 382.
LAMPIRAN
Biodata Diri

A. Data Pribadi
Nama : Fadli Deri Pranda
Tempat, Tanggal Lahir : Temula, 05 Maret 2001
Alamat : Kampung Linggang Melape, kecamatan
Linggang Bigung
No. Telepon : 082353273707
Jenis Kelamin : Laki – Laki
E- email : Fadlideri08@gmail.com

B. Riwayat Pendidikan
 SDK WR.Soepratman Linggang Melapeh
 SMPN 35 Sendawar,Linggang Melapeh Kabupaten Kutai Barat
 SMKN 1 Sendawar, Melak Kabupaten Kutai Barat
 Universitas AKI, Semarang, Fakultas Teknik Dan Informatika
Surat Penerimaan MSIB
Sertifikat dan Transkip Nilai MSIB Pada BISA ARTIFISIAL INDONESIA
Dataset

card reports age income share expenditure Owner selfemp dependents Months majorcards active
0 yes 0 37.66667 4.5200 0.033270 124.983300 yes No 3 54 1
12
1 yes 0 33.25000 2.4200 0.005217 9.854167 no No 3 34 1
13
2 yes 0 33.66667 4.5000 0.004156 15.000000 yes No 4 58 1
5
3 yes 0 30.50000 2.5400 0.065214 137.869200 no No 0 25 1
7
4 yes 0 32.16667 9.7867 0.067051 546.503300 yes No 2 64 1
5
... ... ... ... ... ... ... ... ... ... ... ...
...
1314 yes 0 33.58333 4.5660 0.002146 7.333333 yes no 0 94 1
19
1315 no 5 23.91667 3.1920 0.000376 0.000000 no no 3 12 1
5
1316 yes 0 40.58333 4.6000 0.026513 101.298300 yes no 2 1 1
2
1317 yes 0 32.83333 3.7000 0.008999 26.996670 no yes 0 60 1
7
1318 yes 0 48.25000 3.7000 0.111619 344.157500 yes no 2 2 1
0
Foto Kegiatan
Buku Bimbingan

Anda mungkin juga menyukai