Anda di halaman 1dari 24

PREDIKSI PENJUALAN VIDEO GAMES MENGGUNAKAN CATBOOST

CLASSIFIER PADA APLIKASI BERBASIS WEBSITE

Disusun untuk memenuhi tugas akhir


Disusun oleh :
Hanida Adzkia Zahra 2013020184
4 ITE 1

CEP-CCIT Fakultas Teknik Universitas Indonesia

Gedung Enginering Center Lt. 1, FTUI Kampus Baru UI Depok, Jalan Prof. DR. Ir R.
Roosseno,
Kukusan, Kecamatan Beji, Kota Depok, Jawa Barat 16425
(021)-7884-9047 / 786-3508

TAHUN AJARAN 2021/2022


Kata Pengantar

Puji syukur kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya
sehingga saya dapat menyelesaikan tugas PROJECT akhir Data Analitycs ini tepat pada
waktunya.

Adapun tujuan dari penulisan makalah ini adalah untuk memenuhi tugas akhir
perkuliahan di CEP - CCIT FT UI. Selain itu, makalah ini juga bertujuan untuk menambah
wawasan tentang cara mengolah, dan menganalisa sebuah data menggunakan machine
learning, python, dan algoritma catboost classifier dengan tujuan dapat diimplementasikan
dalam sebuah aplikasi berbasis website.

Saya mengucapkan terima kasih kepada Bapak Ivan Firdaus, ST. yang telah
membimbing saya dalam pembuatan tugas project akhir ini, serta seluruh dosen yang pernah
mengajar saya tanpa saya sebutkan satu per satu namanya, namun tidak mengurangi rasa
hormat saya sebagai siswa sehingga dapat menambah pengetahuan dan wawasan sesuai
dengan bidang studi yang saya tekuni.

Saya juga mengucapkan terima kasih kepada semua pihak yang telah membagi
sebagian pengetahuannya sehingga saya dapat menyelesaikan makalah ini.

Saya menyadari, makalah yang saya tulis ini masih jauh dari kata sempurna. Oleh
karena itu, kritik dan saran yang membangun akan saya nantikan demi kesempurnaan
makalah ini.

Depok, Juli 2022

Penulis

i
DAFTAR ISI

Contents
Kata Pengantar..............................................................................................................................1
DAFTAR ISI...................................................................................................................................2
BAB I...............................................................................................................................................1
PENDAHULUAN...........................................................................................................................1
1.1 Latar Belakang.....................................................................................................................1
1.2 Rumusan Masalah................................................................................................................2
1.3 Tujuan Penulisan..................................................................................................................2
1.4 Batasan Masalah...................................................................................................................2
1.5 Metode Penulisan Makalah..............................................................................................2
1.5.1 Jenis Penulisan...............................................................................................................................2
1.5.2 Sumber Data..................................................................................................................................3
1.5.3 Teknik Pengumpulan Data............................................................................................................3
1.5.4 Analisis Data...................................................................................................................................3
1.5.5 Manfaat Penelitian........................................................................................................................3
BAB II.............................................................................................................................................4
LANDASAN TEORI......................................................................................................................4
2.1 Pengertian Machine Learning.............................................................................................4
2.2 Data Mining..........................................................................................................................5
2.3 Fungsi Data Mining..............................................................................................................5
2.3.1 Fungsi Prediktif.......................................................................................................................5
2.3.2 Fungsi Deskriptif.....................................................................................................................5
2.4 Jenis Metode Analisis...........................................................................................................6
2.4.1 Metode Predictive Analytics........................................................................................6
2.4.2 Metode Prescriptive Analytics.....................................................................................6
2.5 Jenis dan Sumber Data........................................................................................................6
2.5.1 Data Primer.............................................................................................................................6
2.5.2 Data Sekunder.........................................................................................................................7
2.6 Jenis Tipe Data.....................................................................................................................7
2.7 Metode Learning Algoritma Data Mining.........................................................................8
2.7.1 Supervised Learning......................................................................................................................8
2.7.2 Unsupervised Learning..................................................................................................................8
2.7.3 Semi-Supervised Learning............................................................................................................8
2.8 Metode Data Mining............................................................................................................9
2.8.1 Kriteria Evaluasi dan Validasi Model..........................................................................................9

ii
2.9 Python....................................................................................................................................9
2.9.2 CatBoost Classifier.......................................................................................................................11
2.10 Phyton dan Sejarahnya..............................................................................................11
2.11 Xampp..........................................................................................................................11
2.12 Pengertian Game Console..........................................................................................11
2.13 Jenis Tipe Data............................................................................................................11
2.14 Bahasa Pemrograman Python...................................................................................11
2.15 Kelebihan dan Kekurangan Python..........................................................................11
2.16 Open Source Jupyter..................................................................................................11
2.17 Metode Predictive.......................................................................................................11
2.17.1 Metode Predictive Analytics..................................................................................11
2.17.2 Metode Prescriptive Analytics...............................................................................11
2.18 Jenis dan Sumber Data..............................................................................................12
2.13.1 Data Sekunder............................................................................................................................12
2.13.2 Data Primer................................................................................................................................12
BAB III..........................................................................................................................................14
ANALISA DATASET..................................................................................................................14
3.1.1 Gross Profit Margin (GPM %)......................................................................................14
3.1.2 Profit by Varian and Level.............................................................................................14
3.1.3 Jumlah by Level and Varian..........................................................................................14
3.1.4 Profit by Pekerjaan.........................................................................................................14
3.1.5 Jumlah by Gender dan Pekerjaan.................................................................................15
3.2.3 Hasil Jumlah by Level and Varian................................................................................16
3.2.4 Hasil Profit by Pekerjaan...............................................................................................16
3.2.5 Hasil Jumlah by Gender dan Pekerjaan.......................................................................16
3.3 Dashboard Business Performance....................................................................................17
BAB IV..........................................................................................................................................18
KESIMPULAN.............................................................................................................................18

iii
BAB I

PENDAHULUAN

1.1 Latar Belakang


Seiring berkembangnya zaman, perubahan tidak dapat dihindarkan. Semua elemen terus
berkembang, salah satunya adalah pengolahan data. Pengolahan data yang dahulu
dilakukan secara manual melalui fisik, sekarang sudah berubah dan berkembang melalui
media digital seiring berkembangnya zaman. Data menjadi salah satu elemen penting baik
dalam organisasi maupun perusahaan. Hampir seluruhnya membutuhkan data untuk
menganalisis kemungkinan atau bahkan mencari dan menciptakan sesuatu yang baru
dengan analisis data yang dikakukan. Namun belum semua sektor sadar akan pentingnya
pengolahan data ini, padahal pengolahan data dapat membantu para pencari keputusan
dengan kemudahan mengatur dan memproses data.
Pada dasarnya, analisis data adalah proses menganalisis, membersihkan,
menginterpretasikan, dan memvisualisasikan data menggunakan berbagai metode, teknik,
dan tools. Tools analisis data ini akan membantu perusahaan untuk mendapatkan insight
yang relevan sebagai dasar pengambilan keputusan yang cerdas dan efektif.
Prediksi atau forecasting merupakan seni dan ilmu yang dilakukan untuk mengetahui atau
memperkirakan apa yang terjadi pada masa yang akan datang. Prediksi menjadi sangat
penting karena penyusunan suatu rencana, di antaranya didasarkan pada suatu proyeksi atau
ramalan. Oleh karena itu perusahaan atau badan usaha perlu mempredisikan apa yang terjadi
pada masa yang akan datang yang digunakan sebagai landasan pembuatan keputusan atau
kebijakan untuk kelangsungan perusahaan. Prediksi dilakukan perusahaan bertujuan untuk
mengetahui dan memperkirakan jumlah penjualan yang akan datang dan jumlah kesalahan
prediksi, sehingga dapat memenuhi kebutuhan konsumen dan manajemen perusahaan.

Permasalahan yang umum dihadapi oleh para pemilik perusahaan atau badan usaha
adalah bagaimana memprediksi atau meramalkan penjualan barang di masa mendatang
berdasarkan data yang telah direkam sebelumnya.

Prediksi tersebut sangat berpengaruh pada keputusan pemilik perusahaan untuk


menentukan jumlah barang yang harus disediakan, apabila memesan barang dalam jumlah
yang cukup banyak dan ternyata penjualan barang tersebut hanya terjual beberapa saja. Oleh
karena itu diperlukan suatu aplikasi yang dapat digunakan oleh perusahaan atau badan

1
komersial untuk memperkirakan jumlah permintaan barang, bahkan strategi marketing dengan
menerapkan prediksi ramalan tertentu.

Dengan adanya rumusan masalah di atas, maka dari itu saya selaku penulis membuat
aplikasi berbasis website dengan machine learning dengan tujuan agar pelaku usaha dapat
memprediksi penjualan per tahun dari setiap sub barang yang dijual demi kepentingan strategi
marketing maupun evaluasi penjualan, dengan judul Aplikasi Prediksi Penjualan Berbasis
Website dengan Catboost Classifier.

1.2 Rumusan Masalah


Berdasarkan latar belakang yang sudah diuraikan di atas dan kepentingan lainnya, maka dapat
di tentukan yang menjadi rumusan masalah dalam penulisan ini adalah

1.2.1 Apa itu data analytics?

1.2.2 Apa itu machine learning?

1.2.3 Apa manfaat dari menganalisis data?

1.2.4 Metode apakah yang paling cocok digunakan untuk melakukan prediksi penjualan?

1.2.5 Bagaimana proses pengolahan data serta proses implementasi ke dalam website?

1.3 Tujuan Penulisan


1.3.1 Menyelesaikan tugas akhir perkuliahan di CEP - CCIT FTUI.
1.3.2 Sebagai persyaratan untuk kelulusan di CEP - CCIT - FTUI.
1.3.3 Memprediksi penjualan video games dalam juta di dalam tampilan website.

1.4 Batasan Masalah


Batasan masalah pada analisis project saya kali ini adalah, analisis ini menggunakan
data sekunder yang diambil dari website, sehingga informasi yang didapatkan hanya
sebatas apa yang tertulis di dalam website tersebut. Dengan keterbatasan data yang ada
maka hasil analisis ini hanya bisa dijadikan sebagai acuan dan perkiraan dari data yang
tersedia. Analisis ini juga menggunakan satu metode analisis saja yaitu Catboost
Clasiffier sehingga tidak menutup kemungkinan bisa dianalisa menggunakan metode
yang lain.

1.5 Metode Penulisan Makalah


1.5.1 Jenis Penulisan

2
Penulisan makalah ini bersifat deskriptif analisis. Metode deskriptif analisis adalah
metode atau cara kerja dalam suatu pemecahan masalah dengan cara mendeskripsikan,
menggambarkan, menjelaskan dan menganalisis situasi dan kondisi suatu obyek
permasalahan dari sudut pandang penulis berdasarkan hasil telaah pustaka yang menunjang
(studi literatur).

1.5.2 Sumber Data


Sumber data yang digunakan pada analisis ini adalah sumber data sekunder. Data
sekunder dapat diperoleh dari pustaka yang menunjang seperti jurnal, dokumentasi, data
lembaga penelitian, maupun data instansi terkait yang relevan.
1.5.3 Teknik Pengumpulan Data
Teknik pengumpulan data melalui studi literal (studi kepustakaan). Studi
kepustakaan dilakukan dengan cara mengumpulkan data-data berupa data sekunder yang
berhubungan dengan topik dan masalah yang terkait analisis penjualan video games
menggunakan machine learning.
1.5.4 Analisis Data
Proses menganalisis data dilakukan setelah seluruh data terkumpul. Analisis data
dilakukan dengan cara membaca, mempelajari, menelaah, dan mengolah data menggunakan
machine learning sehingga dapat menjawab semua permasalahan. Tahap terakhir adalah
menarik kesimpulan dari permasalahan yang telah terjawab.

1.5.5 Manfaat Penelitian


Hasil penelitian ini diharapkan dapat memberikan manfaat sebagai berikut:
1.5.5.1 Manfaat Bagi Pelaku Usaha
Manfaat bagi pelaku usaha dengan adanya tugas ini adalah dapat membantu pelaku
usaha untuk evaluasi, menentukan strategi penjualan dengan melihat kemungkinan atau
prediksi barang yang terjual dalam kurun waktu tahunan.
1.5.5.4 Manfaat bagi Penulis
Menyelesaikan tugas akhir perkuliahan di CEP CCIT FTUI dan menambah wawasan
penulis tentang bagaimana menganalisis data dan mengimplementasikan nya ke dalam
aplikasi berbasis website.
1.5.5.3 Manfaat bagi Akademisi
Penelitian ini diharapkan dapat mengembangkan pengetahuan, khususnya Manajemen
Pemasaran terutama bagi akademisi yang ingin menganalisis masalah merek, kualitas
dan, promosi terhadap penjualan produk.
3
BAB II
LANDASAN TEORI

2.1 Pengertian Machine Learning


Machine learning (pembelajaran mesin) merupakan salah satu cabang dari bidang
kecerdasan buatan yang berkembang pesat saat ini. Pembelajaran mesin menempati peringkat
ketiga untuk kategori perkembangan tercepat hak paten yang disetujui. Tujuh perusahan
raksasa seperti IBM, Microsoft, Google, LinkedIn, Facebook, Intel, dan Fujitsu tercatat
memiliki paten baru terbanyak di bidang tersebut.
Pembelajaran mesin mengalami laju pertumbuhan majemuk tahunan sebesar 34%
antara tahun 2003-2017, dan diperkirakan masih akan mengalami laju pertumbuhan majemuk
hingga 13% tahun 2021 nanti. Deloitte Global juga pernah memprediksi pada tahun 2018
penggunaan pembelajaran mesin meningkat dua kali lipat dan akan meningkat dua kali lipat
lagi pada tahun 2020. Dengan meningkatnya animo pada bidang ini, wajarlah bila
pembelajaran mesin kemudian menjadi salah satu topik yang sering diangkat dalam riset,
termasuk dalam tugas akhir mahasiswa atau penelitian mandiri. Pada umumnya, sistem
cerdas berbasis pembelajaran yang terlibat dalam projek projek komputasi fisik atau sistem
tertanam seringkali menerima input dari sensor dan menghasilkan output yang harus
dijalankan aktuator, yang membutuhkan antarmuka input output yang tidak built-in pada
Personal Computer (PC) desktop atau laptop.
Machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan
sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan berdasarkan
disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga mesin dapat
belajar dengan menganalisa data tanpa perlu di program ulang atau diperintah.
Dalam hal ini Machine Learning memiliki kemampuan untuk memperoleh data yang
ada dengan perintah ia sendiri. Machine Learning juga dapat mempelajari data yang ada dan
data yang diperoleh sehingga bisa melakukan tugas tertentu. Tugas yang dapat dilakukan oleh
Machine Learning sangat beragam, tergantung dari apa yang dipelajari.
Istilah Machine Learning pertama kali dikemukakan oleh beberapa ilmuwan
matematika yaitu Adrien Marie Legendre, Thomas Bayes dan Andrey Markov pada tahun
1920-an dengan mengemukakan dasar-dasar Machine Learning dan konsepnya. Sejak saat itu
Machine Learning banyak yang mengembangkan. Salah satu contoh dari penerapan Machine
Learning yang cukup terkenal adalah Deep Blue yang dibuat oleh IBM pada tahun 1996.

4
Deep Blue merupakan Machine Learning yang dikembangkan agar bisa belajar dan
bermain catur. Deep Blue adalah komputer pertama yang memenangkan sebuah permainan
catur melawan seorang juara dunia (Garry Kasparov) dalam waktu standar sebuah turnamen
catur.
Menurut Tom M. Mitchell membuat definisi bahwa “Sebuah program komputer yang
belajar dari pengalaman (experience) E dari tugas yang dibebankan (Task) T dengan
kinerjanya (performance) P yang terukur. Contohnya yaitu sebuah program komputer yang
belajar menggunakan catur, dapat mengembangkan kemampuannya P, yang diukur sebagai
kemampuan supaya menang dalam tugas T bermain catur berdasarkan pengalaman E yang
diperoleh dari bermain catur melawan dirinya sendiri.
2.2 Data Mining
Data Mining merupakan salah satu teknik untuk menganalisis data dari beberapa
perspektif dan meringkas data menjadi salah satu data yang menjadi informasi yang berharga
seperti pendapatan, pemotongan biaya, atau keduanya. Software untuk Data Mining berkerja
sebagai fitur analitik untuk menganalisis data. Software tersebut membantu pengguna untuk
menganalisis data dari beberapa dimensi atau sisi, mengurutkannya, dan menjumlahkan data
yang di identifikasi. Tipenya, data mining merupakan sebuah proses untuk menemukan
korelasi atau pola di antara berbagai bidang dalam basis data relasional yang sangat besar.
2.3 Fungsi Data Mining
Secara umum fungsi dari Data Mining terbagi menjadi dua yaitu ada fungsi deskriptif
dan fungsi prediktif.
2.3.1 Fungsi Prediktif
Fungsi prediksi merupakan sebuah fungsi untuk mengetahui bagaimana sebuah
proses nantinya akan menemukan pola tertentu dari suatu data. Pola-pola tersebut bisa
diketahui dari berbagai variabel-variabel yang ada pada data. Ketika pola sudah
ditemukan, selanjutnya pola yang didapat tersebut dapat digunakan untuk
memprediksi variabel lain yang belum diketahui nilai ataupun jenisnya.
Itulah mengapa fungsi satu ini dikatakan sebagai fungsi prediksi sama halnya
dengan melakukan predictive analisis. Fungsi ini juga dapat digunakan untuk
memprediksi sebuah variabel tertentu yang belum ada dalam suatu data. Sehingga
fungsi ini sangat memudahkan dan menguntungkan bagi siapapun yang memerlukan
prediksi yang akurat untuk menjadikan hal penting tersebut menjadi lebih baik.
2.3.2 Fungsi Deskriptif
Fungsi ini dalam data mining merupakan sebuah fungsi untuk memahami lebih jauh

5
tentang data yang diamati. Dengan melakukan sebuah proses diharap dapat
mengetahui perilaku atau pola dari sebuah data tersebut. Data tersebutlah yang
nantinya bisa digunakan untuk mengetahui karakteristik dari data yang diamati.
Dengan menggunakan Fungsi deskripsi Data mining, maka selanjutnya dapat
ditemukan pola tertentu yang tersembunyi dalam sebuah data. Dengan demikian,
apabila pola yang berulang dan bernilai tersebut merupakan karakteristik sebuah data
dapat diketahui.
2.4 Jenis Metode Analisis
Metode analisis untuk memprediksi kondisi di masa yang akan datang. Metode analisis
ini diperlukan tak hanya oleh perusahaan bisnis, tetapi juga oleh institusi pendidikan
2.4.1 Metode Predictive Analytics
Predivtive Analyst adalah salah satu bentuk analisis yang menggunakan data
baru dan data historis dengan tujuan untuk memprediksi serta memperkirakan,
perilaku, tren, dan aktivitas yang terjadi dalam sebuah data. Dapat juga disebut
sebagai data yang menggunakan algoritma dan machine learning guna
mengidentifikasi trend dalam sebuah data demi kepentingan melihat
kemungkinan di masa depan. Predivtive Analytics bisa disebut sebagai kategori
penting hasil dari pemanfaatan teknologi 5G, metode ini sangat dapat membantu
dalam berbagai industry seperti keuangan, perawatan Kesehatan, bahkan
industri otomotif.

2.4.2 Metode Prescriptive Analytics


Prescriptive Analytics merupakan metode pembelajaran yang mengacu pada
tujuan akhir untuk suatu keberhasilan. Metode ini juga menjelaskan tentang
tindakan yang harus dilakukan setelah mengetahui risiko dan prospek dari bisnis
tersebut. Metode analisis ini dapat diimplementasikan ketika sebuah perusahaan
atau instansi akan memilik produk apa yang akan dikembangkan, strategi seperti
apa yang harus dilakukan yang tentunya dengan mempertimbangkan potensi
pemasaran, laporan penjualan, serta minat konsumen berdasarkan data yang di
analisis.

2.5 Jenis dan Sumber Data


2.5.1 Data Primer
Data primer adalah jenis data yang dikumpulkan oleh peneliti secara langsung dari
sumber utama, bisa melalui wawancara, survei, eksperimen, dan sebagainya. Biasanya,

6
sumber data primer dipilih dan disesuaikan secara khusus untuk memenuhi tujuan
penelitian tertentu. Sebelum memilih sumber pengumpulan data, tujuan penelitian dan
populasi sasaran perlu diidentifikasi lebih dulu.
Contoh data primer adalah saat melakukan survei pasar, tujuan survei dan populasi
sampel perlu diidentifikasi. Melalui langkah ini, Anda dapat mengetahui sumber
pengumpulan data yang paling tepat digunakan. Misalnya, survei offline mungkin akan
lebih pas untuk masyarakat yang tinggal di daerah terpencil tanpa koneksi internet
dibandingkan dengan survei online.
2.5.2 Data Sekunder
Menurut Husein Umar (2013:42) data sekunder adalah: “Data sekunder merupakan
data primer yang telah diolah lebih lanjut dan disajikan baik oleh pihak pengumpul
data primer atau oleh pihak lain misalnya dalam bentuk beberapa tabel atau beberapa
diagram”. Sedangkan menurut Nur Indrianto dan Bambang Supomo (2013:143) data
sekunder adalah: “Data sekunder merupakan sumber data penelitian yang diperoleh
peneliti secara tidak langsung melalui media perantara (diperoleh dan 42 dicatat oleh
pihak lain)”.
Contoh data sekunder misalnya catatan atau dokumentasi perusahaan berupa
absensi, gaji, laporan keuangan publikasi perusahaan, laporan pemerintah, data yang
diperoleh dari majalah, dan lain sebagianya. Dalam mempermudah prosesan
pengolahan data, peneliti melakukan pengolahan untuk mempermudah proses
klasifikasi dan proses query yang peneliti lakukan didalam Jupyter menggunakan
Bahasa Python, dan berikut merupakan data yang sudah diolah dari data primer yang
digunakan pada analisis kali ini :
• ID
• CONSOLE
• YEAR
• CATEGORY
• PUBLISHER
• RATING
• CRITICS_POINTS
• USER_POINTS
• Sales In Millions
2.6 Jenis Tipe Data
Berikut merupakan jenis jenis tipe data yang sering digunakan :

7
1. Integer : Integer merupakan salah satu tipe data pada database yang berupa bilangan
bulat. Tipe data ini sering digunakan dalam database khususnya yang berkaitan
dengan bilangan bulat.
2. Array : Array merupakan kumpulan dari tipe data, didalamnya memiliki banyak
nilai. Jadi dapat dikatakan array merupakan tipe data yang terdiri dari beberapa
kumpulan tipe data.
3. Float : Float dapat di katakan juga bilangan yang berkoma(,) tapi dalam
pemrogramannya tidak menggunakan titik(.).
4. String : String merupakan tipe data yang berupa karakter. Didalamnya berupa teks
atau kata.
5. Boolean : Merupakan tipe data yang bernilai True or False. Tipe data boolean
biasanya digunakan untuk logika, seperti pada kondisi if atau looping
(pengulangan).
6. Object : Tipe data objek dapat berupa bilangan, fungsi .

2.7 Metode Learning Algoritma Data Mining


Data mining mempunya 3 algoritma yaitu Supervised Learning, Unsupervised
Learning dan Semi-Supervised Learning.

2.7.1 Supervised Learning


 Pembelajaran dengan guru, data set memiliki target/label/class
 Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
 Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang
terasosiasi dengan nilai dari variable predictor

2.7.2 Unsupervised Learning


• Algoritma data mining mencari pola dari semua variable (atribut)
• Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
• Algoritma clustering adalah algoritma unsupervised learning

2.7.3 Semi-Supervised Learning


• Semi-supervised learning adalah metode data mining yang menggunakan data
dengan label dan tidak berlabel sekaligus dalam proses pembelajarannya

8
• Data yang memiliki kelas digunakan untuk membentuk model (pengetahuan),
data tanpa label digunakan untuk membuat batasan antara kelas

2.8 Metode Data Mining


1. Estimation (Estimasi): Linear Regression (LR), Neural Network (NN), Deep
Learning (DL), Support Vector Machine (SVM), Generalized Linear Model
(GLM), dll.
2. Forecasting (Prediksi/Peramalan): Linear Regression (LR), Neural Network (NN),
Deep Learning (DL), Support Vector Machine (SVM), Generalized Linear Model
(GLM), dll.
3. Classification (Klasifikasi): Decision Tree (CART, ID3, C4.5, Credal DT, Credal
C4.5, Adaptative Credal C4.5), Naive Bayes (NB), K-Nearest Neighbor (kNN),
Linear Discriminant Analysis (LDA), Logistic Regression (LogR), dll.
4. Clustering (Klastering): K-Means, K-Medoids, Self-Organizing Map (SOM),
Fuzzy C-Means (FCM), dll.
5. Association (Asosiasi): FP-Growth, A Priori, Coefficient of Correlation, Chi
Square, dll.

2.8.1 Kriteria Evaluasi dan Validasi Model


1. Akurasi
• Ukuran dari seberapa baik model mengkorelasikan antara hasil dengan
atribut dalam data yang telah disediakan
• Terdapat berbagai model akurasi, tetapi semua model akurasi tergantung
pada data yang digunakan
2. Kehandalan
• Ukuran di mana model data mining diterapkan pada dataset yang
berbeda
• Model data mining dapat diandalkan jika menghasil kan pola umum
yang sama terlepas dari data testing yang disediakan
3. Kegunaan
• Mencakup berbagai metrik yang mengukur apakah model tersebut
memberikan informasi yang berguna

9
Keseimbangan diantaranya ketiganya diperlukan karena belum tentu model yang
akurat adalah handal, dan yang handal atau akurat belum tentu berguna.

2.9 Python
Python adalah bahasa pemrograman interpretatif yang dapat digunakan di berbagai
platform dengan filosofi perancangan yang berfokus pada tingkat keterbacaan kode
dan merupakan salah satu bahasa populer yang berkaitan dengan Data Science,
Machine Learning, dan Internet of Things (IoT). Keunggulan Python yang bersifat
interpretatif juga banyak digunakan untuk prototyping, scripting dalam pengelolaan
infrastruktur, hingga pembuatan website berskala besar.

 Bahasa Python menjadi keharusan untuk mempelajari dasar-dasar scripting dan


pengolahan data atau machine learning.
 Bahasa Python digunakan secara luas, masuk dalam 3 besar bahasa pemrograman
yang digunakan dalam beberapa tahun belakangan.
 Pustaka (Library) yang luas, memungkinkan untuk mengembangkan ke bidang-
bidang lainnya. Beberapa library atau framework terpopuler data science dan machine
learning menggunakan Python antara lain: Scikit-Learn, TensorFlow, PyTorch.
 Bahasa Python memiliki kurva pembelajaran (learning-curve) yang sangat landai,
cocok untuk dipelajari sebagai bahasa pemrograman pertama - dengan kemudahan
pembacaan dan kemudahan mempelajari sintaksisnya.

2.9.1.1 Kelebihan Python


Kelebihan dari Bahasa pemrograman python antara lain adalah tidak adanya
deklarasi tipe sehingga program yang dihasilkan menjasi lebih sederhana dan
fleksibel. Python juga memiliki memori otomatis. Pemrograman yang ada pada
python berorientasi pada objek, sehingga tipe data dan operasi tingkat tingginya
memiliki kecepatan pembuatan system aplikasi menggunakan objek yang telah
tersedia. Python dilengkapi dengan kelas, modul, dan eksepsi sehingga terdapat
dukungan pemrograman skala besar secara modular.

2.9.1.2 Kekurangan Python


Python merupakan interpreter yang bukan merupaan perangkat bantu terbaik
untuk pengantar komponen performa kritis, maka dari itu ada beberapa penugasan
yang diluar jangkauan dari Bahasa pemrograman python ini seperti Bahasa

10
pemrograman lainnya. Python tidak secepat atau efisien seperti bahasa pemrograman
bahasa C, namun hal ini juga tergantung dengan perangkat yang digunakan untuk
menjalankan program.

2.10 Catboost Classifier


Dokumentasi CatBoost mengatakan bahwa "CatBoost adalah perpustakaan open
source berkinerja tinggi untuk peningkatan gradien pada pohon keputusan."
Jadi, CatBoost adalah algoritma untuk peningkatan gradien pada pohon keputusan.
Ini adalah pengklasifikasi siap pakai dalam istilah konvensi scikit-learn yang akan
menangani fitur kategoris secara otomatis. Hal ini dapat dengan mudah diintegrasikan
dengan kerangka kerja pembelajaran mendalam seperti Google TensorFlow dan
Apple Core ML.Catboost Classifier dapat bekerja dengan beragam tipe data untuk
membantu memecahkan berbagai masalah yang dihadapi bisnis saat ini.
Catboost Classifier dikembangkan oleh para peneliti dan insinyur Yandex, dan
digunakan untuk pencarian, sistem rekomendasi, asisten pribadi, mobil self-driving,
prediksi cuaca, dan banyak tugas lainnya.
Catboost Classifier memberikan akurasi terbaik di kelasnya.
Ada du acara yaitu:
 Catboost Classifier menghasilkan hasil mutakhir tanpa pelatihan data ekstensif
yang biasanya diperlukan oleh metode pembelajaran mesin lainnya.
 Menyediakan dukungan out-of-the-box yang kuat untuk format data yang
lebih deskriptif yang menyertai banyak masalah bisnis.
Nama "CatBoost" berasal dari dua kata - "Cat" dan "Boost". Catboost bekerja
dengan baik dengan beberapa kategori data, seperti audio, teks, gambar termasuk data
historis. "Boost" berasal dari algoritma pembelajaran mesin penambah gradien karena
pustaka ini didasarkan pada pustaka penambah gradien. Peningkatan gradien adalah
algoritma pembelajaran mesin yang kuat yang diterapkan secara luas ke berbagai jenis
tantangan bisnis seperti deteksi penipuan, item rekomendasi, perkiraan, dan
kinerjanya juga baik. Itu juga dapat mengembalikan hasil yang sangat baik dengan
data yang relatif lebih sedikit. Catboost Classifier dalam sumber terbuka dan dapat
digunakan oleh siapa saja.
Kelebihan dari perpustakaan CatBoost adalah sebagai berikut:
 Performance : CatBoost memberikan hasil yang canggih dan kompetitif
dengan algoritme pembelajaran mesin terkemuka di bidang performa.

11
 Handling Categorical features automatically : Kita dapat menggunakan
CatBoost tanpa pra-pemrosesan eksplisit untuk mengubah kategori
menjadi angka. CatBoost mengubah nilai kategorikal menjadi angka
menggunakan berbagai statistik pada kombinasi fitur kategorikal dan
kombinasi fitur kategorikal dan numerik.
 Robust : Catboost mengurangi kebutuhan untuk penyetelan hyper-
parameter yang ekstensif dan menurunkan kemungkinan overfitting juga
yang mengarah ke model yang lebih umum. Meskipun, CatBoost memiliki
beberapa parameter untuk disetel dan berisi parameter seperti jumlah
pohon, kecepatan pembelajaran, regularisasi, kedalaman pohon, ukuran
lipatan, suhu pengantongan, dan lain-lain.
 Easy-to-use : Kita dapat menggunakan CatBoost dari baris perintah,
menggunakan API yang mudah digunakan untuk Python dan R.

2.11Jupyter Notebook
Jupyter adalah aplikasi web gratis untuk yang digunakan untuk membuat dan
membagikan dokumen yang memiliki kode, hasil hitungan, visualisasi, dan teks.
Jupyter adalah singkatan dari tiga bahasa pemrograman Julia (Ju), Python (Py) dan
R Tiga bahasa pemrograman ini adalah sesuatu yang penting bagi seorang data
scientist.

Jupyter berfungsi untuk membantu kamu dalam membuat narasi komputasi


yang menjelaskan makna dari data di dalamnya dan memberikan insight mengenai
data tersebut. Selain itu, Jupyter juga mempermudah kerja sama antara insinyur
dan data scientist karena kemudahannya dalam menulis dan berbagi teks dan kode.
Karena alasan inilah, Jupyter mempermudah data scientist untuk berkolaborasi
dengan data scientist, data researchers atau data engineers lainnya.

2.11.1 Struktur Utama Jupyter


 Front-end notebook
Front-end notebook adalah fungsi untuk dapat mengedit atau
menjalankan notebook lain, Front-end adalah sebuah aplikasi JavaScript yang
dikirimkan ke browser kamu seperti aplikasi web lainnya. Fungsi dari front-end
notebook adalah menyimpan, mengelola, dan mengirim notebook
ke server Jupyter.

12
 Jupyter Server
Jupyter server adalah aplikasi yang berjalan di komputer. Server sendiri adalah
program yang berfungsi untuk melayani komputer ketika terhubung ke internet.

 Protokol Kernel
Protokol kernel memungkinkan server untuk melimpahkan tugas menjalankan
kode menjadi berbagai bahasa. Kernel pada dasarnya adalah bahasa
pemrograman. Contohnya seperti Phyton 2, Phyton 3, dan lain-lain.
2.11.2 Fitur dalam Jupyter
 File, Kolom File di Jupyter berfungsi untuk membuat notebook baru atau
membuka notebook yang telah ada. Selain itu, di kolom ini juga terdapat
fitur Save and Checkpoint yang berfungsi untuk membuat checkpoint lalu
kembali ke titik terakhir apabila terjadi sesuatu yang tidak diinginkan.
 Edit, Kolom Edit Jupyter bisa digunakan untuk melakukan cut, copy atau
paste dari cell yang ada. Fungsi kolom ini juga untuk membagi, menyatukan,
atau menghapus cell. Selain itu, edit juga bisa mengorganisir susunan cell
sesuai yang di mau di kolom Edit ini.
 View, View di Jupyter berfungsi untuk mengaktifkan atau mematikan
terlihatnya header dan toolbar. View juga bisa menyalakan atau
mematikan Line Numbers di dalam cells.
 Insert, Kolom Insert di Jupyter berfungsi untuk memasukkan cell di atas atau
di bawah cell yang di pilih.
 Cell, Kolom Cell  bisa menjalankan satu, beberapa, atau bahkan
seluruh cell yang ada. Di kolom ini juga, bisa mengubah tipe dari cell yang
akan di pilih. Selain itu, kolom cell juga bisa membantu dalam
menghapus output dari cell yang telah dikerjakan. Biasanya orang-orang
melakuan ini untuk membagikan notebook nya dengan orang lain. Sehinga,
orang lain tersebut dapat menjalankan cell-nya sendiri.
 Kernel, Kolom Kernel Jupyter adalah untuk mengerjakan kernel atau bahasa
pemrograman yang berjalan. Di kolom ini, bisa melakukan restart, reconnect,
mematikan, atau mengganti kernel yang digunakan di notebook.
 Widget, Kolom Widget Jupyter memiliki fungsi untuk menambah atau
menghapus widget yang ada. Pada dasarnya, widget adalah
JavaScript widget yang digunakan untuk membuat konten cell kamu menjadi

13
dinamis dengan menggunakan Phyton atau Kernel yang lain. 
 Help, Kolom terakhir di Jupyter adalah Help. Fungsi kolom ini digunakan
ketika membutuhkan bantuan atau ingin mempelajari notebook kamu lebih
dalam.

2.12 Flask
2.12.1 Pengertian Flask
Flask adalah sebuah framework sekaligus library keluaran Python, yang memiliki
fungsi sebagai alat bantu pengembangan web development. Framework ini
memungkinkan penggunanya membangun web development, dengan berbagai macam
fitur terbaik melalui tools dan pustakanya. Dengan adanya library bawaan ini,
memungkinkan Python bisa langsung digunakan tanpa adanya ketergantungan pada
library pihak ketiga. Library Flask adalah framework yang harus dipelajari bersamaan
dengan bahasa python.

Jika bahasa pemrograman lain membutuhkan library tambahan untuk bisa tumbuh,
dengan Flask bisa menggunakan Python dengan lebih ringan dan mudah. Framework
canggih ini sudah support pada berbagai macam kebutuhan, seperti deteksi error dan
bug, keamanan sistem, dan masih bisa menambahkan extensi. Yang unik dari Flask
adalah framework yang masuk dalam kategori mikro, sehingga akan mengurangi
ketergantungan pada library dan extensi pihak luar. Karena termasuk dalam micro
framework, framework ini memungkinkan untuk membuat core dengan sintaks yang
sangat sederhana.

Framework ini pertama kali dikembangkan oleh Pocoo pada tahun 2004 silam.
Dengan dasar pembangunan dari Werkzeug dan Jinja2 yang merupakan proyek lain
dari sang pengembang. Microframework ini sudah berbasis unicode, yang
menggunakan Jinja2 template engine.

2.12.2 Kelebihan dari Flask

Jika dibandingkan dengan framework Python lainnya seperti Django, framework ini
memiliki beberapa kelebihan khusus. Tak heran jika Flask adalah salah satu framework
terbaik yang harus dipelajari. Berikut ini beberapa kelebihan yang bisa dirasakan:

a. Framework Super Ringan

14
Kelebihan pertama yang bisa dirasakan, adalah performa penggunaan
framework. Flask adalah sebuah framework web development yang sangat ringan,
hal ini bisa terjadi karena core dengan desain modular yang super simpel.
b. Friendly untuk Pemula
Framework ini menggunakan bahasa yang sangat friendly untuk pemula,
sehingga akan lebih mudah mempelajari Python dengan framework ini. Namun
untuk mempelajari Flask, akan lebih baik jika mempelajari Python terlebih dahulu.
c. Support Extensi Pihak Ketiga
Flask memiliki fungsi dasar yang support pada penambahan library, module,
hingga plugin lain sebagai extensi tambahan. Dengan kelebihan ini, akan
memungkinkan pengguna membangun web development super kompleks.
d. Flask adalah Framework yang Free Penggunaan
Pada dasarnya framework ini menggunakan Python sebagai bahasa
pemrograman. Dengan sifat open source dan dukungan sistem dari Flask,
pengguna bisa menggunakannya secara gratis. Bahkan bisa membuat sebuah
website untuk kebutuhan komersil.
e. Flask adalah Framework yang Fleksibel
Microframework ini memungkinkan membangun web development, yang
mencakup pengembangan front end dan back end. Sehingga lebih leluasa untuk
mengembangkan web, dalam satu framework saja.
f. Fitur Bawaan yang Menarik
Dengan menggunakan framework ini bisa menikmati berbagai fitur bawaan
yang menarik. Sebut saja pengembangan server dan pewaktuan, dukungan integrasi
pada pengujian unit, Secure Cookies, ReSTful Request dispatching, dan berbagai
fitur menarik lainnya.

12.2.3 Kegunaan Flask

Dengan menggunakan microframework ini bisa membangun berbagai web


development. Berikut beberapa contoh penggunaan Flask:

1. Membuat Web Development


Hal paling umum dari flask adalah membuat website sederhana hingga
website super kompleks. Dengan framework ini bisa mengembangkan front end

15
dan back end dalam satu project kerja. Flask juga bisa menambahkan berbagai
fitur menarik hingga menambahkan berbagai fitur dan plugin tambahan.
2. Membuat Machine Learning
Flask adalah salah satu microframework yang bisa digunakan untuk
membuat machine learning, framework ini akan memberikan fasilitas penuh pada
sisi server. Flask bisa menambahkan library tambahan, untuk menunjang kinerja
machine learning yang dibuat.
3. Membuat Aplikasi Web
Kegunaan lain dari Flask adalah memungkinkan untuk membuat aplikasi
web, seperti contoh adalah aplikasi kasir sederhana, drive online, sistem
akuntansi dan masih banyak lagi. Flask bisa membuat aplikasi sederhana hingga
kompleks, dengan scripting yang lebih mudah.
4. Membuat Sistem Informasi Web
Selain kegunaan tersebut, Flask juga bisa membuat sistem informasi web.
Flask bisa mengeksplorasi berbagai fitur yang ada, bahkan menambahkan plugin
untuk kebutuhan performa sistem informasi.
5. Membuat Game Berbasis Web
Framework bawaan Python ini, adalah kemungkinan besar dalam
membangun sebuah game berbasis web. Flask bisa membuat berbagai game
ringan seperti flappy bird, puzzle dan berbagai game web lainnya.
6. Membuat Marketplace dan Katalog Web
Flask bisa membuat toko online dan katalog web. Hal ini akan menambah
nilai plus dari usaha, apalagi bisa menambahkan berbagai fitur seperti
matematika dasar, fitur keranjang, fitur tracking dan masih banyak lagi.

2.12 MySQL
MySQL adalah sebuah DBMS (Database Management System) menggunakan
perintah SQL (Structured Query Language) yang banyak digunakan saat ini dalam
pembuatan aplikasi berbasis website. MySQL dibagi menjadi dua lisensi, pertama
adalah Free Software dimana perangkat lunak dapat diakses oleh siapa saja dan kedua
adalah Shareware dimana perangkat lunak berpemilik memiliki batasan dalam
penggunaannya.
MySQL termasuk ke dalam RDBMS (Relational Database Management
System). Sehingga, menggunakan tabel, kolom, baris, di dalam struktur databasenya.

16
Jadi, dalam proses pengambilan data menggunakan metode relational database dan
juga menjadi penghubung antara perangkat lunak dan database server.
2.13 XAMPP
Aplikasi XAMPP adalah software komputer yang penamaannya diambil dari
akronim kata X (cross platform) A (Apache), M (MySQL), P (PHP), dan P (Perl)
dimana program-program tersebut tersedia di dalamnya.

XAMPP dipakai untuk membuat web server lokal di komputer atau localhost.
Aplikasi XAMPP memudahkan dalam mendesain, keperluan testing website dan
pengembangannya, yang semua file bisa diakses melalui web browser computer.

XAMPP adalah versi offline dari website pada komputer, hal ini akan berguna
melakukan pengujian fitur baru pada website, memodifikasi tema maupun plugin, dan
juga mempelajari dasar-dasar website untuk pengembangan.

2.14 Game Console


Game konsol merupakan mesin elekronik yang dibuat secara khusus agar dapat
memainkan game. Untuk perangkat penampilnya bisa berupa monitor, televisi, maupun
komputer. Sementara itu, untuk alat pengontrolnya sendiri dinamakan joystick.
Terdapat dua jenis konsol yang sangat populer hingga saat ini yaitu Play Station (PS)
dan juga Microsoft Xbox.
Selain itu, sebenarnya masih ada Nintendo yang juga menjadi pesaing dari
keduanya. Akan tetapi, sepertinya Play Station merupakan game konsol yang paling
banyak digunakan hingga sekarang.

17
BAB III
ANALISA DAN PEMBAHASAN

18
BAB IV
KESIMPULAN

19
DAFTAR PUSTAKA
Data mining : Definisi, Fungsi, Metode, Dan Contoh Penerapan. (2022, June 15). Retrieved

from https://inmarketing.id/data-mining-adalah.html#Fungsi_Data_Mining

Efendi. (2021, January 22). APA ITU game Konsol? Mengenal Pengertian game Konsol.

Retrieved from https://www.nesabamedia.com/game-konsol/

Medina, M. I. (2021, August 21). Penting untuk data scientist, Ketahui APA Saja Fungsi

Dan Fitur Jupyter. Retrieved from

https://glints.com/id/lowongan/jupyter-adalah/#.Yvop5nZBw2w

Mengenal data primer Dan Cara Mendapatkannya. (2022, July 17). Retrieved from

https://algorit.ma/blog/data-primer-2022/

Prashant111. (2020, August 20). CatBoost classifier in Python. Retrieved from

https://www.kaggle.com/code/prashant111/catboost-classifier-in-python/notebook

20

Anda mungkin juga menyukai