PENDAHULUAN
kepada mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas
di luar kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan.
dengan menguasai kompetensi spesifik dan praktis yang juga dicari oleh dunia
layanan dan produk seputar Artificial Intelligence yang didirikan pada tahun
2019. Dan pada penerapan data engineering ini saya melakukan prediksi
Model yang buat pada project akhir ini bukan hanya mampu untuk
prediksi alokasi dana pengeluaran dari pelanggan, namun model ini juga
1
2
Service, Data Analysis Service, Lab as a Service, e-learning, dan loT Service.
melalui Artificial Intelligence, BISA AI bisa mulai berkembang lebih jauh lagi.
utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya
sederhana, dengan BISA Tampil sebagai platform video conference dan BISA
adalah menyiapkan data yang dikoleksi dari berbagai sumber informasi dengan
membangun sistem data atau infrastruktur agar data tersebut dapat mudah untuk
klasterisasi.
tertentu dengan adanya bantuan prediksi dan analisa dari produk model .
mahasiswa agar bisa belajar dan mengembangkan diri melalui aktivitas di luar
kelas perkuliahan, namun tetap diakui sebagai bagian dari perkuliahan . Dengan
adanya kegiatan seperti MSIB ini diharapkan penulis atau mahasiswa lain dapat
mengasah baik hard skill maupun soft skill dan dapat memahami konsep
Dari permasalahan yang ada, penulis membatasi masalah yang dibahas sebagai
berikut :
3. Penelitian ini menggunakan data survei yang didapat dari riset dana
magang
mentor profesional
5
permasalahan ini maka penulis mendapatkan data-data yang jelas dan akurat
foto-foto atau karya tulis akademik dan seni yang telah ada
dari buku jurnal karya tulis ilmiah serta sumber referensi yang
Untuk memperoleh hasil gambaran yang jelas dari semua isi laporan kerja
praktek ini, maka garis besar pembahasaan dibagi menjadi 5 bab yaitu:
BAB 1 PENDAHULUAN
menjadi acuan penelitian, batasan masalah penelitian, tujuan dan manfaat yang
BAB IV PEMBAHASAN
hasil analisis.
BAB V PENUTUP
Bab ini berisi Kesimpulan dari hasil pembahasan yang diperoleh dari
hasil Penelitian dari MSIB pada BISA AI dan saran yang diberikan dalam
penelitian.
BAB II
LANDASAN TEORI
Magang dan Studi Independen Bersertifikat atau MSIB adalah salah satu
kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi SKS mata kuliah
yang diambil.
MSIB adalah salah satu program Kampus Merdeka yang dirancang untuk
dan terkini untuk menghadapi dunia masa depan. Mahasiswa mendapat pengalaman
belajar diluar kampus selama lebih dari 16 hingga 24 minggu dengan mengkonversi
kesempatan ini. Sebelum mendaftar pada program MSIB mahasiswa membuat akun
Kampus Merdeka.
Program MSIB ini terdiri dari 2 program, yakni Magang dan Studi Independen.
8
9
Peserta magang diberikan real project atau proyek riil yang mempunyai
persoalan proyek
disiplin ilmu
untuk mahasiswa
statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi
besar dan mengidentifikasi pola data (LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel,
A. (2014).
10
membuat suatu keputusan atau prediksi yang dibuat berdasarkan data-data tersebut. Di
mana semakin bagus algoritma dari machine learning tersebut maka akurasi keputusan
dan prediksi sistemnya akan semakin baik. Ibaratnya, seperti otak manusia di mana jika
ia semakin pintar maka harus banyak belajar. Di sini pun, mesin yang mengolah
banyak data maka akan menghasilkan output yang semakin akurat. Maka dari itu, kini
machine learning adalah satu bagian yang wajib ada karena berperan penting bagi
Hal ini memungkinkannya untuk memprediksi hasil yang lebih akurat dari set
data input yang diberikan. Misalnya, ilmuwan data dapat melatih aplikasi medis untuk
mendiagnosis kanker dari gambar sinar-x dengan cara menyimpan jutaan gambar yang
ini ada Beberapa tools yang digunakan untuk tahapan machine learning antara lain :
1. Google Collaboratory
produk dari Google Internal Research. Dilansir dari e-book Logika Matematika
untuk Analisis Algoritma karya Dr. Putu Harry Gunawan, tools satu ini
tambahan lagi. Untuk bisa menggunakan Google Colab, kamu hanya perlu akun
Google untuk login dan menyimpan file Python ke Google Drive milikmu.
Menurut e-book Informatika untuk SMP/MTs Kelas VII karya Gunawan Trieko
arbitrer melalui browser, dan sangat cocok untuk machine learning, analisis
data, serta pendidikan. Secara lebih teknis, Colab merupakan layanan notebook
Colab tidak dijamin dan sifatnya terbatas, serta batas penggunaannya terkadang
dimensi.
12
learning.
analisis fitur
noise
NumPy adalah
13
Malang,2019’).
Keterangan :
data frame
Input :
import numpy as np
variable :
a= np.array([1,2,3,4,5])
b=np.array([1.2,1.5,5,6,7])
output 1:
14
print(b)
output 2:
Pandas
dimensi)
input :
import pandas as pd
import numpy as np
15
variable:
9834],
5298] }
df = pd.DataFrame(dict)
print(df)
Output :
Populasi
5298
16
Matplotlib
1. Line Plot
2. Scatter Plot
3. Box Plot
4. Bar Plot
5. Hostogram
Keterangan :
pada plot
17
1) Line Plot
pergerakan data.
2) Scatter Plot
18
kelompok data.
3) Box Plot
Bar plot atau bisa disebut juga dengan bar chart adalah
dalam interval.
20
bagian.
21
Gambar 2. 5 Histogram
2. Seaborn
1) Heatmap plot
seaborn
heatmap
library seaborn
2. Tenserflow
dan apabila kamu fans dari salah satu area di AI (artificial intelligence)
orang dan untuk banyak hal! Berikut adalah beberapa contoh siapa yang
menggunakan Tensorflow:
revolusi cerdas
Deteksi Penipuan
TensorFlow
3. Python
Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python
pemrograman lain.
BeeWare
1. Fungsi type
2. Fungsi Staticmethod
3. Fungsi Split
pemisah
4. Fungsi Enumerate
- iterable: data iterable seperti list, string, tuple, dan lain – lain
5. Fungsi Evav
26
ekspresi Python
Ada beberapa teknik yang dimiliki oleh machine learning, namun secara luas
memiliki dua teknik dasar belajar, yaitu supervised dan unsupervised dan beberapa
1. Suvervised Learning
pada pembelajaran mesin yang bisa menerima informasi yang sudah ada
pada data dengan memberikan label tertentu. Diharapkan teknik ini bisa
learning dimana ada tahapan proses data mentah atau raw data hingga
pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk
Load) maka kita mendapat info feature dari sample baru tersebut.
1) Prediction
Taufiq , yogyakarta )’ .
2) Regresi Linear
28
a. Hubungan linier
b. Independensi residual
c. Normalitas
tersebut.
d. Homoskedastisitas
alami dalam set data yang besar, masuk akal untuk mengubah
30
contohnya.
istilah kesalahannya.
ke-i
juga meningkat.
c. Regresi logistik
olahraga
2. Unsupervised Learning
32
terapkan pada machine learning yang digunakan pada data yang tidak
teknik ini dapat membantu menemukan struktur atau pola tersembunyi pada
1) Clustering
digunakan. Dalam algoritma ini, kita akan akrab dengan nilai k yang
Proses ini dilakukan dengan menghitung nilai mean dari setiap data
3 dan 4.
34
Diagram di bawah ini adalah ilustrasi cara kerja Algoritma Clustering K-means:
ini:
cluster.
2) Asosiasi
3) Dimensionality Reduction
variabel atau feature data. Proses ini dilakukan karena kita data
dengan variabel yang sangat besar atau sering disebut dengan high
curse).
36
3. Semi-Supervised Learning
Namun perbedaannya ada pada data yang berlabel dan tidak berlabel untuk
training data. Biasanya sejumlah kecil data yang berlabel dengan jumlah
besar data yang tidak berlabel. Adapun sistem yang berhasil menggunakan
ada di webcam.
4. Reinforcement Learning
bisa membuat agent software dan mesin bekerja secara otomatis untuk
pada tahun 2014, AlphaGo di tahun 2016, dan OpenAI dan PPO di tahun
dilakukan pada suatu kondisi (state). Setia aksi yang dilakukan nantinya
5. Self-Supervised Learning
tujuan dari data tersebut. Adapun tujuan dari self-supervised learning yaitu
6. Multi-Instance Learning
learning. Jenis yang satu ini mirip pula dengan konsep supervised learning
diberi label positif jika setidaknya satu instans di tas itu positif, dan tas
diberi label negatif jika semua instans di dalamnya negatif. Tidak ada label
1. Segmentasi Data
aspek lokasi seperti tempat tinggalnya. Segmentasi satu ini tentu tidak
40
suatu produk dan jasa selalu akan berbeda-beda tergantung pada lokasi,
data dengan jumlah yang besar. Dan data engineering adalah bidang
yang sangat luas dan bisa diterapkan dalam berbagai jenis industri.
dalam jumlah yang sangat besar dan memastikan data tersebut siap
U.”).
jumlah besar.
yang tersedia.
3. Q-Learning
kumpulan data grafis tak terarah dari bidang acak. Algoritma secara
iteratif mendekati utilitas yang diharapkan dari tindakan saat ini dan
U.”).
yang mendetail dan menyeluruh tentang cara kerja setiap model dan
masukan menjadi data dengan format yang sesuai dan siap untuk diproses. Beberapa
contoh hal yang dilakukan dalam preprocessing meliputi berbagai proses yang
Lebih lanjut proses yang ada alam preprosesing dapat terdiri dari salah satu
kegiatan proses ataupun gabungan dari beberapa proses diatas. Proses yang ada
43
tergantung dari tujuan yang akan dicapai dalam preprocessing tersebut (Karthick &
Malathi, 2015). Pemilihan proses yang tepat perlu dilakukan mengingat karena proses
berbasis database. Dalam machine learning, kegiatan ini sangat penting untuk
memastikan bahwa big data sudah diformat dan informasi yang dikandungnya dapat
1. Data Cleaning
beberapa proses seperti mengisi nilai yang hilang, menghaluskan noisy data,
(grouping).
2. Data Integration
tersebut, data dengan format yang berbeda harus diubah terlebih dahulu ke
format yang sama. Secara keseluruhan, proses integrasi data ini ditujukan untuk
sebagai berikut.
3. Data Transformation
data dilakukan untuk memastikan bahwa tidak ada data yang berlebihan,
format data, dan nilai data menjadi sebuah dataset yang sesuai untuk proses
Terdapat setidaknya lima langkah yang dapat dilakukan dalam proses data
transformation, yaitu:
yang seragam.
paling penting untuk analisis, di mana variabel ini juga akan digunakan
GAMBARAN UMUM
Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama
46
47
utamanya yaitu: BISA Tampil dan BISA AI Academy. Dua produk ini awalnya
sederhana, dengan BISA Tampil sebagai platform video conference dan BISA
yang ada, ini menghasilkan diantaranya: BISA Tampil yang menjadi platform
kolaborasi dan penyelenggaraan webinar, bootcamp dan event online dan BISA
platform pencarian kerja, freelance, diskusi dan masih banyak lagi yang
lainnya.
masa depan.
Visi :
Misi :
48
webinar,
M. Octaviano
Pratama, S.Kom.,
M.Kom.
President Director
Pamela Kareen,
Ir. Wira Satywan,
S.T., M.Kom.
CISA., CISSP.
Operasional
Komisaris
Director
( Sumber : https://bisa.ai/ )
49
40132 .
PEMBAHASAN
yang bertujuan untuk memberikan kesempatan kepada mahasiswa untuk belajar dan
mengembangkan diri melalui aktivitas di luar kelas perkuliahan, namun tetap diakui
sebagai bagian dari perkuliahan. Program ini diperuntukkan bagi mahasiswa yang ingin
memperlengkapi dirinya dengan menguasai kompetensi spesifik dan praktis yang juga
50
51
1. Data Science
2. Project Capstone
3. Fullstack Development
4. Bisnis Startup
5. Image Procesing
6. Cyber Security
52
7. Cloud computing
diarahkan untuk enroll course Gratis dan Premium dari Bisa AI Academy
dan +20 Course Premium yang terdapat di seluruh platform digital Bisa AI
Dalam pembelajaran , mandiri ini cukup sulit dalam pengisian silabus yang ada
karna sering terjadi perbedaan materi yang berbeda dengan soal yang di
terapkan dan kurang lengkap materi untuk pengisian dan adanya kurang jelas
pertanyaan soal yang ada. Dan beberapa lampiran sertifikat yang telah
1. Manajamen Startup
53
2. Cloud Computing
4. Data Science
6. Image Processing
7. Pemrograman GO
penggunaanya.
dikerjakan selanjutnya.
dan dilaksanakan setiap hari mengikuti minat peserta akademisi dan pelaku
proyek pada startup digital. Pelaksanaan selama 3 bulan SIB dan project
capstone ini dilaksanakan pada hari kamis pada pukul 15:30 – 17:30 .
Project Capstone akan diampu oleh 2 mentor untuk setiap aktivitas. Peserta
• Keaktifan peserta
63
1. Pertemuan mingguan
Program yang kelompok kami kembangkan untuk digitak startup ialah NFT
Gaming program yang berbentuk uang kripto dengan bermain game atau
game, sangat bervariasi tergantung dari jenis permainan yang kamu pilih.
tersebut.
memilih dalam sesi pemilihan mata kuliah yang diambil pada siakad Bisa AI
cukup baik dan beberapa yang menurut kurang baik antara lain mentor dari
bisnis start up digital. Dan ada beberapa pilihan jurusan pada BISA
1. AI-Hacker
2. AI-Game
3. AI-Hipster
lebih fokus dalam melahirkan inovasi baru dari setiap produk yang
dimiliki.
4. AI-Hustler
5. AI-Manufacture
6. AI- BLOCKCHAIN
proyek industri.
7. AI- Infra
yakni:
a) Homeroom Mentoring
68
b) Domain Mentoring
selesai.
c) Deskripsi pekerjaan
Quiz,pre-test,post-test,dan Tugas
Pembelajaran tamu
Pembelajaran mandiri
Project capstone
Service, Lab as a Service, e-learning, dan loT Service. Sukses bekerja sama
Cycle.
Dalam hal ini ada beberapa tugas yang di lakukan oleh peserta MSIB
antara lain :
3. Quiz,pre-test,post-test,dan Tugas
85%.
membangun suatu cluster yang baik ketika setiap anggota dari clustermemiliki
derajat kesamaan yang tinggi dalam proses membuat segmentasi ini adalah
sebagai berikut:
Source Code :
import numpy as np
import tensorflow as tf
import tensorflow.keras
import pandas as pd
kami dapatkan dengan cara mengunggahnya pada platform Google Colab. Dataset
yang berupa csv, harus diubah dulu kedalam bentuk DataFrame menggunakan
library Pandas.
Source Code :
72
Expenditure.csv')df
Keterangan :
Preprocessing Data ini adalah proses dimana data yang berupa objek akan
mengalami proses encoding menjadi atribut baru dengan nilai 0 atau 1. Lalu,
data akan dipetakan dan dicari korelasi antar atriburnya. Data yang kosong dan
Source code :
73
x in df[['Communication Expenditure']].values],
ces Expenditure']].values],
Wear Expenditure']].values],
Keteragan :
[int(x) for x in : Perulangan for akan dijalankan sebanyak jumlah elemen yang
ada di dalam variable dan int merupakan tipe data integer yang merupakan bilanagan
bulat.
Algoritma akan mencari dan menyimpan n (jumlah atribut) atribut dengan korelasi
tertinggi dari antara atribut dengan atribut dependent yang dipilih. Dengan
Source Code :
plt.figure(figsize=(20,20))
corr = df.corr()
75
sns.heatmap(corr, annot=True)
'Members with age less than 5 year old', 'Members with age 5 -
Motorcycle/Tricycle'], dtype='object'))
0 480332 2880
1 198235 5700
2 82785 420
3 107589 660
4 189322 2100
Tabel 4. 3 Housing
No Expenditure
0 63636
1 41370
2 14340
78
3 16638
4 31122
... ...
41539 18372
41540 17640
41541 9240
41542 12438
41543 11316
Tabel 4. 4 Miscellaneous
No Expenditure
0 34056
1 9150
2 6450
3 3762
4 8472
... ...
41539 3978
41540 6090
41541 3570
79
41542 5760
41543 6060
0 4607
1 8230
2 2735
3 1390
4 4620
... ...
41539 1395
41540 3136
41541 2460
41542 3755
41543 2320
80
Keterangan :
Expenditure atau biasa disebut dengan pembayaran yang dilakukan pada saat
ini untuk digunakan kewajiban pada masa yang akan dating dimana total
cluster yang tepat melalui persentase hasil perbandingan antara jumlah cluster
yang akan membentuk siku pada suatu titik . Jika nilai cluster pertama dengan
Source Code :
wcss = []
for i in range(1,11):
means++', random_state=42)
kmeans.fit(df)
wcss.append(kmeans.inertia_)
print(wcss)
81
plt.figure(figsize=(10,8))
plt.plot(range(1,11),wcss)
plt.title('Inertia')
plt.xlabel('n_clusters')
plt.ylabel('inertia')
plt.show()
Heatmap
income . dan menggunakan diagram scatter plot dari data yang telah dipilih
Source code :
plt.figure(figsize=(12,10))
for x in pd.unique(df['label']):
plt.ylabel(i)
], df[i][df.label == x])
plt.show()
Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih
K-Means. Visual dari data yang telah mengalami segmentasi akan ditampilkan.
Souce code :
x,y in tmp}
].values]
data_needed
df = pd.DataFrame(data_needed )
df
Data dengan korelasi atribut tertinggi dengan atribut dependent yang dipilih
akan dipasangkan dan akan dicari regresi linearnya dengan algoritma Linear
MSE (Mean Square Error) akan ditampilkan. Dan 4 tampilan dari diagram
scatter plot. Dari total household income dari data yang telah di regresi dari
Souce code :
divider = int(len(df)*0.8)
mms = MinMaxScaler()
Income']].iloc[:divider]
df_y_train = df[[x]].iloc[:divider]
Income']].iloc[divider:]
df_y_test = df[[x]].iloc[divider:]
lr = LinearRegression()
86
lr.fit(df_x_train,df_test)
mms = mms.fit(df_y_test)
df_y_test = mms.transform(df_y_test)
df_y_pred = mms.transform(lr.predict(df_x_test))
plt.scatter(df[['Total Household
Income']].iloc[divider:], df[[x]].iloc[divider:])
plt.plot(df_x_test,lr.predict(df_x_test), color =
'red')
plt.ylabel(x)
plt.show()
print(f'MSE : {mse}')
lr.predict(df[[x]].iloc[divider:])
data pilihan yang telh dipilih sebagai data frame utama antara lain adaalah
Source code :
plt.figure(figsize=(20,20))
corr = df.corr()
sns.heatmap(corr, annot=True)
p = []
for y in range(len(df.corr()[benchmark])):
89
tmp.append((abs(df.corr()[benchmark][y]),df.corr().c
ne
tmp = tmp[:top_feature]
tmp
semakin tinggi angka suatu kelompok data maka warnanya akan semakin
PENUTUP
1. Kesimpulan
metode prediksi dan klasterisasi data engineering alokasi dana pelanggan pada
independen.
1. Program MSIB ini adalah salah satu terobosan yang bagus untuk
Independen Bersertifikat.
91
92
2. Saran
Secara keseluruhan program sudah berjalan dengan baik dan para mentor juga
2) Ketika ada kelas yang setiap harinya 2-4 jam terlalu lama sehingga bisa
DAFTAR PUSTAKA
Aminuddin, J., Sehah, F.P. Zen, and H. Latief, 2008, Numerical Solution of Basic
Korteweg de Vries, Conference on Computational, Computing and Non Linear
Science, LIPI, Jakarta, Indonesia.
Aulia, P. U. F., & Saepudin, S. (2021). Penerapan Data Mining K-Means Clustering
Untuk Mengelompokkan Berbagai Jenis Merk Laptop. Sismatik
(Seminar Nasional Sistem Informasidan Manajemen Informatika), 209–
2017.
Barus, S.P. (2021). Implementation of Naïve Bayes Classifier-based Machine Learning
to Predict and Classify New Students at Matana University. Journal of Physics:
Conference Series 1842 (1), 012008
Gartner. (2018). Gartner Says Global Artificial Intelligence Business Value to Reach
$1.2 Trillion in 2018. https://www.gartner.com/en/new sroom/press-
releases/2018-04-25-gartner-says-global-artificialintelligence-business-value-
toreach-1-point-2-trillion-in-2018.
Hosmer. D. W., Lemeshow. S. 1989. Applied Logistic Regression. John Wiley &
Sons, Inc Johnson. R. A., Wichern. D. W. 2007. Applied Multivariate
Statistical Analysis. Sixth Edition. New Jersey: Prentice
Jurnal Ilmiah Wahana Pendidikan, Agustus 2022, 8 (12), 198-210 Algoritma K-Means
Untuk Pengelompokan Bantuan Langsung Tunai (BLT) Muhamad Khandava
Mulyadien1 , Ultach Enri
Miyamoto, S., Ichihashi, H., & Honda, K. (2008). Algorithms for Fuzzy Clustering –
Methods cMeans Clustering with Application. Springer- Verlag Berlin
Heidelberg.
LeMoyne, R., Kerr, W., Mastroianni, T., & Hessel, A. (2014). Implementation of
machine learning for classifying hemiplegic gait disparity through use of a force
plate. 2014 13th International Conference on Machine Learning and
Applications, 379– 382.
LAMPIRAN
Biodata Diri
A. Data Pribadi
Nama : Fadli Deri Pranda
Tempat, Tanggal Lahir : Temula, 05 Maret 2001
Alamat : Kampung Linggang Melape, kecamatan
Linggang Bigung
No. Telepon : 082353273707
Jenis Kelamin : Laki – Laki
E- email : Fadlideri08@gmail.com
B. Riwayat Pendidikan
SDK WR.Soepratman Linggang Melapeh
SMPN 35 Sendawar,Linggang Melapeh Kabupaten Kutai Barat
SMKN 1 Sendawar, Melak Kabupaten Kutai Barat
Universitas AKI, Semarang, Fakultas Teknik Dan Informatika
Surat Penerimaan MSIB
Sertifikat dan Transkip Nilai MSIB Pada BISA ARTIFISIAL INDONESIA
Dataset
card reports age income share expenditure Owner selfemp dependents Months majorcards active
0 yes 0 37.66667 4.5200 0.033270 124.983300 yes No 3 54 1
12
1 yes 0 33.25000 2.4200 0.005217 9.854167 no No 3 34 1
13
2 yes 0 33.66667 4.5000 0.004156 15.000000 yes No 4 58 1
5
3 yes 0 30.50000 2.5400 0.065214 137.869200 no No 0 25 1
7
4 yes 0 32.16667 9.7867 0.067051 546.503300 yes No 2 64 1
5
... ... ... ... ... ... ... ... ... ... ... ...
...
1314 yes 0 33.58333 4.5660 0.002146 7.333333 yes no 0 94 1
19
1315 no 5 23.91667 3.1920 0.000376 0.000000 no no 3 12 1
5
1316 yes 0 40.58333 4.6000 0.026513 101.298300 yes no 2 1 1
2
1317 yes 0 32.83333 3.7000 0.008999 26.996670 no yes 0 60 1
7
1318 yes 0 48.25000 3.7000 0.111619 344.157500 yes no 2 2 1
0
Foto Kegiatan
Buku Bimbingan