Anda di halaman 1dari 11

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/344419764

Machine Learning: Konsep dan Implementasi

Book · August 2020

CITATIONS READS

0 584

2 authors:

Yaya Heryadi Teguh Wahyono


Binus University Universitas Kristen Satya Wacana
75 PUBLICATIONS   381 CITATIONS    27 PUBLICATIONS   44 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Software Engineering for Better Software View project

Software Engineering View project

All content following this page was uploaded by Teguh Wahyono on 29 September 2020.

The user has requested enhancement of the downloaded file.


MACHINE LEARNING
KONSEP DAN IMPLEMENTASI

Oleh:

Dr. Yaya Heryadi


Teguh Wahyono, M.Cs

Penerbit Gava Media Yogyakarta


2020

1
2
Kata Pengantar

Machine learning merupakan salah satu cabang ilmu


Kecerdasan Buatan (Artificial Intelligence) yang berkembang sangat
cepat dan telah menyebabkan masalah klasifikasi, regresi, klastering,
dan anomaly detection pada berbagai bidang dapat diatasi lebih
efisien. Misalnya, pengenalan sel yang bersifat abnormal berdasarkan
citra CT Scan membantu dokter mendiagnosis pasien. Pengenalan
jenis dan lokasi objek yang akurat berdasarkan video digital atau citra
satelit sudah dipergunakan secara luas dibidang keamanan wilayah,
periklanan, penanganan bencana alam, atau transportasi cerdas.
Luasnya potensi aplikasi machine learning telah menginspirasi
banyak peneliti untuk terus mengembangkan model dan teknologi
machine learning yang menghasilkan sejumlah besar publikasi
ataupun prototipe produk teknologi cerdas. Meskipun banyak
publikasi dapat diakses melalui internet, pemula yang ingin
mempelajari dasar-dasar algoritma machine learning seringkali
mengalami kesulitan untuk memperoleh bahan bacaan dasar yang
dibutuhkan.
Oleh karena itu, tujuan dari buku ini menguraikan beberapa
konsep dasar dari machine learning dengan pendekatan matematika
terapan dan pemrograman menggunakan Python. Kedua penulis
mengucapkan terima kasih kepada berbagai pihak yang telah
membantu selama proses penulisan buku ini. Terakhir, semoga buku
ini bermanfaat bagi para pembacanya.
Jakarta, Mei 2020

Yaya Heryadi
Teguh Wahyono

3
Daftar Isi
BAGIAN 1. DASAR MATEMATIKA MACHINE LEARNING

Bab 1. Matriks, Vektor dan Kalkulus


Bab 2. Statistika dan Peluang

BAGIAN 2. KONSEP DASAR MACHINE LEARNING

Bab 3. Pengertian Dasar Machine Learning


Bab 4. Teknik Pembelajaran dalam Machine Learning
Bab 5. Pentingnya Dataset dalam Machine Learning

BAGIAN 3. IMPLEMENTASI PEMBELAJARAN SUPERVISED

Bab 6. Regresi Linear dan Regresi Logistik


Bab 7. K-Nearest Neighbors dan Decission Tree
Bab 8. Random Forest, Naive Bayes
Bab 9. Support Vector Machines

BAGIAN 4. IMPLEMENTASI PEMBELAJARAN UNSUPERVISED

Bab 10. K-Means


Bab 11. Principal Component Analysis
Bab 12. DBSCAN dan STDBSCAN

4
BAB 1

Matriks, Vektor dan


Kalkulus

Bab ini menjelaskan tentang :


❖ Pengertian dan Jenis-Jenis Matriks
❖ Operasional Matriks
❖ Pengertian Vektor
❖ Peran Kalkulus pada Machine Learning

Bab ini bertujuan untuk memberikan uraian ringkas mengenai


beberapa konsep dasar matematika yang dipergunakan didalam
algoritma machine learning yaitu: matriks, probability, statistika, dan
kalkulus. Selain dari penjelasan singkat mengenai definisi, contoh
implementasi dari beberapa konsep matematika tersebut dijelaskan
menggunakan library dari python. Bab ini tidak bermaksud untuk
menjelaskan aspek matematika dari setiap konsep tersebut secara
detail. Oleh karena itu, bagi pembaca yang berminat mendalami
setiap konsep tersebut dipersilahkan untuk membaca referensi
terkait yang diberikan dari setiap sub-bab.

1.1. Matriks dan Vektor


Matriks adalah susunan elemen didalam sebuah struktur
persegi panjang (rectangular) yang terdiri dari baris dan kolom
(Hogben, 2007). Susunan elemen demikian sering juga disebut
sebagai matriks dua dimensi. Untuk membedakan sebuah matriks
dua dimensi dari matriks lainya dipergunakan ukuran atau dimensi

5
sebuah matriks yang dinyatakan dengan 𝑚 × 𝑛 dimana 𝑚
menyatakan jumlah baris dan 𝑛 menyatakan jumlah kolom matrik
tersebut.
Didalam algoritma machine learning, matriks dua dimensi
umumnya dipergunakan untuk merepresentasikan data berupa
bilangan dimana setiap baris matriks merepresentasikan sampel dan
setiap kolom merepresentasikan fitur dari sampel tersebut.
Secara umum, sebuah matriks dengan elemen bilangan real 𝐴
berdimensi 𝑚 × 𝑛 dapat dinyatakan sebagai:
𝑎11 ⋯ 𝑎1𝑛
𝐴=[ ⋮ ⋱ ⋮ ]. (1.1)
𝑎𝑚1 ⋯ 𝑎𝑚𝑛
Elemen matriks 𝐴 pada baris ke-𝑖 dan kolom ke-𝑗 dinotasikan
dengan 𝑎𝑖𝑗 ∈ ℛ, dimana: 𝑖 = 1,2, . . , 𝑚 adalah indeks baris, dan 𝑗 =
1,2, . . , 𝑛 adalah indeks kolom. Sehingga, sebuah matriks 𝐴 dapat
dinotasikan dengan notasi 𝐴 = [𝑎𝑖𝑗 ]. Contoh sebuah matriks
berdimensi 3 × 3 adalah sebagai berikut:
132.5 4.0 25.2
𝐴 = [240.2 1.2 34.1] . (1.2)
321.4 3.3 12.3
Dengan demikian dua buah matriks 𝐴 dan 𝐵 disebut sama
apabila kedua matriks tersebut memenuhi dua persyaratan yaitu: (i)
dimensi kedua matrik sama, dan (ii) elemen yang letaknya
bersesuaian dari kedua matriks tersebut memiliki nilai yang sama.
Dengan kata lain jika 𝐴 = [𝑎𝑖𝑗 ] dan 𝐵 = [𝑏𝑖𝑗 ] adalah dua matriks
maka 𝐴 = 𝐵 jika 𝑎𝑖𝑗 = 𝑏𝑖𝑗 untuk semua 𝑖 dan 𝑗.
Didalam algoritma machine learning seringkali data bersifat
multi-dimensi sehingga diperlukan sebuah matriks berdimensi lebih
dari dua. Misalnya: susunan nilai-nilai pixel sebagai representasi
sebuah gambar berwarna (RGB) yang memiliki layer merah, hijau,
dan biru direpresentasikan dalam sebuah matriks yang memiliki tiga
dimensi 𝑚 × 𝑛 × 3 dimana: 𝑚 menyatakan jumlah baris, 𝑛
6
menyatakan jumlah kolom, dan 3 menyatakan jumlah kedalaman
(depth) atau jumlah layer. Secara umum matrik tiga dimensi dapat
dinyatakan dengan notasi 𝐴 = [𝑎𝑖𝑗𝑘 ] dimana 𝑖 = 1,2, … , 𝑚; 𝑗 =
1,2, … , 𝑛; dan 𝑘 = 1,2, … , 𝑑.
Sebagai contoh: sebuah matriks dengan elemen bilangan real
berdimensi: 3 × 3 × 3 adalah sebagai berikut:
132.5 4.5 125.2
[𝑎𝑖𝑗1 ] = [240.2 1.2 134.1] , (1.3)
321.4 3.1 212.3
250.5 1.0 225.2
[𝑎𝑖𝑗2 ] = [120.3 2.3 314.1] , (1.4)
90.4 1.5 122.3
132.5 0.5 250.2
[𝑎𝑖𝑗3 ] = [240.2 1.4 234.1] . (1.5)
321.4 1.2 412.3
Vektor adalah sebuah bentuk khusus dari matriks, yaitu
sebuah matriks yang hanya memiliki sebuah baris atau kolom. Secara
umum, sebuah vektor dapat direpresentasikan sebagai berikut:
𝑏1
𝐵 = [ ⋮ ], (1.6)
𝑏𝑚
atau 𝐶 = [𝑐1 … 𝑐𝑛 ] (1.7)
Vector pada persamaan (1.6) dan (1.7) diatas masing-masing disebut
sebagai vektor kolom dan vektor baris.

………. Dan seterusnya


Buku bisa dibeli di Toko Buku Gramedia seluruh Indonesia,
atau melalui www.gavamedia.net

7
Daftar Pustaka
Aeberhard, S., D. Coomans and O. de Vel. (1992). Comparison of
Classifiers in High Dimensional Settings. Tech. Rep. no. 92-02,
(1992), Dept. of Computer Science and Dept. of Mathematics
and Statistics, James Cook University of North Queensland.
Bishop, C. M. (2006). Pattern recognition and machine learning.
Springer.
Burges, C. J. (1998). A tutorial on support vector machines for
pattern recognition. Data mining and knowledge discovery,
2(2), 121-167.
Chollet, F. (2017). Deep learning with Python.
Dangeti, P. (2017). Statistics for machine learning. Packt Publishing
Ltd.
Fisher, R.A. (1950). The use of multiple measurements in taxonomic
problems" Annual Eugenics, 7, Part II, 179-188; also in
Contributions to Mathematical Statistics, John Wiley.
Garg, A., & Tai, K. (2013). Comparison of statistical and machine
learning methods in modelling of data with multicollinearity.
International Journal of Modelling, Identification and Control,
18(4), 295-312.
Heryadi, Y., & Miranda, E. (2019). Land Cover Classification Based
on Sentinel-2 Satellite Imagery Using Convolutional Neural
Network Model: A Case Study in Semarang Area, Indonesia. In
Asian Conference on Intelligent Information and Database
Systems (pp. 191-206). Springer, Cham.
Heryadi, Y., & Warnars, H. L. H. S. (2017). Learning temporal
representation of transaction amount for fraudulent
transaction recognition using CNN, Stacked LSTM, and CNN-

8
LSTM. IEEE International Conference on Cybernetics and
Computational Intelligence (CyberneticsCom) (pp. 84-89). IEEE.
Hogben, Leslie. (2007). Handbook of Linear Algebra: Discrete
Mathematics and Its Applications, CRC Press.
Hurwitz, J., & Kirsch, D. (2018). Machine learning for dummies. IBM
Limited Edition, 75.
Langley, P., & Simon, H. (1995). Applications of machine learning
and rule induction. Communications of the ACM, 38(1 I), 55-64.
Mitchell, T.M. (1997). Machine Learning. McGraw-Hill Company
Inc., Boston, Massachusetts.
P. T. Nguyen, T. T. Nguyen, N. C. Nguyen and T. T. Le (2019).
Multiclass Breast Cancer Classification Using Convolutional
Neural Network. International Symposium on Electrical and
Electronics Engineering (ISEE), Ho Chi Minh, Vietnam, 2019,
pp. 130-134.
P. Zhang, Y. Su and C. Wang (2007). Statistical Machine Learning
Used in Integrated Anti-Spam System. International
Conference on Machine Learning and Cybernetics, Hong Kong,
pp. 4055-4058.
Raschka, S. (2015). Python machine learning. Packt Publishing Ltd.
Sammut, C., & Webb, G. I. (Eds.). (2011). Encyclopedia of machine
learning. Springer Science & Business Media.
Samuel, A. L. (1959). Some studies in machine learning using the
game of checkers. IBM Journal of Research and Development, 3,
21 1-229.
T. Wahyono, (2018), Fundamental of Python for Machine Learning:
Dasar-Dasar Pemrograman Python untuk Machine Learning
dan Kecerdasan Buatan, Gava Media, Yogyakarta.

9
Y. Heryadi, E. Miranda and H. L. H. S. Warnars (2017). Learning
decision rules from incomplete biochemical risk factor
indicators to predict cardiovascular risk level for adult
patients. IEEE International Conference on Cybernetics and
Computational Intelligence (CyberneticsCom), Phuket pp. 185-
190.
Zhang, A., Lipton, Z. C., Li, M., & Smola, A. J. (2019). Dive into Deep
Learning. Unpublished draft. Retrieved, 3, 319.

Internet Resources
https://archive.ics.uci.edu/ml/index.php
https://medium.com/@16611077
https://github.com/marcopeix/ISL-linear regression/tree/master
/data
https://www.wordstream.com/blog/ws/2017/07/28/machine-
learning-applications

10

View publication stats

Anda mungkin juga menyukai