Anda di halaman 1dari 8

Machine Learning (ML)

Disusun untuk memenuhi tugas mata kuliah machine Learning

Kelompok 4

Disusun oleh:

1. Ahmad Kadarisman - (1842452)

2.Arie Dirgantara - (1942910)

3.Aditya Prasetya Kusnadi - ( 2042906 )

4.Farhamsyah - (1741003)

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN


KOMPUTER
“STMIK AMIK BANDUNG”
Tahun 2021/2022
1. Apa yang dimaksud dengan 'Supervised Learning'?

Supervised Learning adalah salah satu metode pembelajaran yang dilakukan oleh mesin
terprogram di mana hasil yang diharapkan pengguna sudah diketahui atau informasi yang
dibutuhkan telah dimiliki oleh sistem. Dengan artian bahwa metode ini bekerja dengan
memanfaatkan kembali data-data dan hasil output yang pernah dimasukkan oleh pengguna atau
dikerjakan oleh sistem sebelumnya. Pada metode ini pola input serta output dibutuhkan untuk
mengenali suatu informasi dalam bank memori. Ketika suatu pola input dibentuk, sistem akan
meneruskan rangsangan data hingga ke bank memori dan sistem output. Sistem output yang
menerima rangsangan data akan menampilkan pola output dan menyesuaikan polanya dengan
pola input. Jika pola cocok, data akan ditampilkan dari bank memori dalam bentuk output.
Apabila pola input dan pola output tidak ada yang cocok, maka output akan error. Dan jika nilai
error cukup besar, pembelajaran lebih lanjut perlu dilakukan.

Kata “supervised” menunjukkan bahwa “kontrol” terhadap algoritma sangat berpengaruh pada
pembentukan model. Kontrol algoritma dilakukan dengan cara memberikan data set (D) yang
didefinisikan sebagai:

Atau

Dimana x adalah input dan y adalah output. Setiap x akan mengendalikan y. Data semacam ini
disebut dengan data berlabel (labeled data). Input dan output ini disebut juga input variabel dan
output variabel. Relasi keduanya dapat dirumuskan menjadi:

Data set yang tersedia dapat bersifat kuantitatif (quantitative) maupun kualitatif (qualitative).
Seiring dengan berjalannya periode pelatihan, algoritma dapat mengidentifikasi hubungan antara
dua variabel sehingga supervised learning dapat memprediksi hasil yang baru. Algoritma
supervised learning digunakan untuk menyelesaikan berbagai persoalan yang terkait dengan:

● Classification (klasifikasi)

● Regression (regresi)

● Ensemble (gabungan)

Algoritma supervised learning berorientasi pada tugas. Dengan semakin banyaknya sampel data
set yang berikan, ia dapat belajar dengan lebih baik sehingga dapat melaksanakan komputasi dan
menghasilkan output yang lebih akurat. Beberapa algoritma yang termasuk kategori supervised
learning adalah:

1. Linear Regression

Dalam linear regression (regresi linier), yang diukur adalah hubungan linier antara
dua atau lebih dari dua variabel. Berdasarkan hubungan tersebut, supervised
learning melakukan prediksi yang mengikuti pola linier ini.

2. Random Forest

Random Forest adalah metode ensemble learning untuk melakukan klasifikasi,


regresi serta tugas-tugas lainnya melalui pembangunan pohon keputusan (decision
tree) dan menyediakan output sebagai kelas yang merupakan mode atau mean dari
pohon individu yang mendasarinya.

3. Gradient Boosting

Gradient Boosting adalah metode ensemble learning yang merupakan kumpulan


dari beberapa pohon keputusan lemah yang menghasilkan pengklasifikasi yang
kuat.

4. Support Vector Machine (SVM)

SVM adalah algoritma lasifikasi yang kuat yang digunakan untuk


mengklasifikasikan dataset biner menjadi dua kelas dengan bantuan hyperplane.

5. Logistic Regression
Logistic Regression menggunakan kurva S berbentuk lonceng yang dihasilkan
dengan bantuan fungsi logis untuk mengkategorikan data ke dalam kelas masing-
masing.

6. Artificial Neural Network

Jaringan Syaraf Tiruan dimodelkan setelah otak manusia belajar dari data dari
waktu ke waktu. Mereka membentuk porsi yang jauh lebih besar dari machine
learning yang disebut dengan deep learning.
2. Apa yang dimaksud dengan 'Reinforcement Learning'?
Reinforcement Learning merupakan sebuah machine learning untuk membuat komputer
belajar sendiri dari sebuah lingkungan (environtment) melalui sebuah agent, jadi agent
akan melakukan pencarian sendiri ( self discovery ) dengan cara berinteraksi dengan
environment.

Reinforcement-learning didefinisikan sebagai metode machine learning yang berkaitan


dengan bagaimana agent perangkat lunak harus mengambil action di dalam environment.
RL adalah bagian dari metode deep learning yang membantu Anda memaksimalkan
sebagian dari reward kumulatif.

Berikut adalah karakteristik penting dari Reinforcement Learning:

● Tidak ada supervisor, hanya ada biangan real atau reward signal
● Pengambilan keputusan berurutan
● Waktu memainkan peran penting dalam masalah reinforcement
● Feedback balik selalu tertunda, tidak seketika
● Action dari sebuah agent menentukan data selanjutnya yang akan di terima.

Reinforcement-learning merupakan salah satu materi machine learning yang cukup berat
dipelajari (dari sisi ilmu matematikanya), namun juga menarik dan menantang untuk
dikuasai.

Berikut adalah alasan utama untuk menggunakan Reinforcement-learning:

● Untuk membantu menemukan situasi mana yang membutuhkan tindakan


● Membantu menemukan action mana yang menghasilkan reward tertinggi selama
periode yang lebih lama.
● Reinforcement-learning juga menyediakan fungsi reward bagi agent
pembelajaran.
● Reinforcement-learning memungkinkan untuk mengetahui metode terbaik untuk
mendapatkan reward besar.

Kita tidak dapat menerapkan Reinforcement-learning dalam semua kasus. Berikut adalah
beberapa kondisi ketika kita sebaiknya tidak menggunakan model reinforcement
learning.

● Memiliki cukup data untuk menyelesaikan masalah dengan metode supervised


learning
● Kita perlu ingat bahwa Reinforcement-learning membutuhkan banyak komputasi
dan memakan waktu terlbih jika ruang action nya besar.
Ada beberapa istilah yang familiar dengan Reinforcement-learning ini yaitu sebagai berikut:

● Agent: Sebuah entitas yang diasumsikan melakukan aksi (action) di environment untuk
mendapatkan beberapa reward.
● Environment (e): Skenario yang harus dihadapi agent.
● Reward (R): Feedback langsung yang diberikan kepada agent ketika dia melakukan
action atau tugas tertentu.
● State (s): Keadaan mengacu pada situasi saat ini yang dikembalikan oleh environment.
● Plicy (π): Ini adalah strategi yang diterapkan oleh agent untuk memutuskan action
selanjutnya berdasarkan state saat ini.
● Value (V): Diharapkan feedback jangka panjang dengan diskon, dibandingkan dengan
feedback jangka pendek.
● Value Function: Ini menentukan nilai state yang merupakan jumlah total reward.
● Environtment Model: Ini meniru perilaku lingkungan. Ini membantu kita membuat
kesimpulan yang akan dibuat dan juga menentukan bagaimana environment akan
berperilaku.
● Model based: Merupakan metode pemecahan masalah Reinforcement-learning yang
menggunakan metode berbasis model.
● Q Value / Action Value (Q): Q value sangat mirip dengan Value. Satu-satunya perbedaan
antara keduanya adalah bahwa dibutuhkan parameter tambahan sebagai tindakan saat ini

Ada dua model pembelajaran penting dalam reinforcement learning yaitu:

1. Markov Decision Process

Markov Decision Process lebih dikenal dengan MDP adalah suatu pendekatan dalam RL
untuk mengambil keputusan dalam environment gridworld. Lingkungan gridworld terdiri
dari state dalam bentuk grid.

MDP mencoba menangkap dunia dalam bentuk grid dengan membaginya menjadi state,
action, model / model transition, dan reward. Solusi untuk MDP disebut policy dan
tujuannya adalah menemukan policy yang optimal untuk tugas MDP tersebut. Oleh
karenanya parameter berikut digunakan untuk mendapatkan solusi yang diharapkan:

● Set of states -S
● Set of actions- A(s), A
● Transition- T(s,a,s’) ~ P(s’|s,a)
● Reward- R(s), R(s,a), R(s,a,s’)
● Policy- n
● Value- V
MDP jika digambarkan kurang lebih seperti ini:

Cara Kerja Reinforcement Learning (MDP)

Algoritma RL akan mencoba berbagai pilihan dan kemungkinan yang berbeda,


melakukan pengamatan (observation) dan evaluasi (evaluation) setiap pencapaian.
Reinforcement learning dapat belajar dari pengalaman.

Agent di dalam environtment diharuskan mengambil tindakan yang didasarkan pada state
saat ini. Jenis pembelajaran ini berbeda dengan supervised learning dalam artian data
training pada model sebelumnya memiliki output mapping yang disediakan sedemikian
rupa sehingga model mampu mempelajari jawaban yang benar. Sedangkan dalam hal ini
RL tidak ada kunci jawaban yang disediakan kepada agent ketika harus melakukan
action tertentu. Jika tidak ada set data pelatihan, ia belajar dari pengalamannya sendiri.

2. Q Learning

Q-learning (disebut sebagai model free algorithm) adalah algoritma RL tanpa model
untuk mempelajari policy yang memberi tahu agen tindakan apa yang harus diambil
dalam keadaan apa. Q-learning tidak memerlukan model dari environtment, dan dapat
menangani masalah dengan transisi stokastik dan reward, tanpa memerlukan adaptasi.
3. Jelaskan perbedaan mendasar antara keduanya!

Supervised machine learning adalah algoritma machine learning menggunakan data terlabel,
contohnya input di mana output-nya diketahui.

Sebagai contoh, sebuah alat memiliki data point yang berlabel F (failed) atau R (runs).

Algoritma supervised learning menerima sekumpulan input dengan output yang tepat.

Setelah itu, algoritma ini belajar dengan membandingkan output sebenarnya dengan output yang
benar untuk menemukan error atau kesalahan.

Dalam supervised learning, algoritma dapat memodifikasi model agar sesuai dengan hasil yang
diinginkan.

Biasanya, supervised learning digunakan pada aplikasi yang memprediksi kejadian di masa
mendatang berdasarkan data historis.

Sedangkan

Reinforcement learning biasanya digunakan untuk robotik, pembuatan game, dan navigasi.

Dengan metode learning ini, algoritma akan mampu menemukan aksi atau perlakuan yang
menghasilkan output terbaik dari hasil uji coba berulang kali (trial and error).

Ada tiga komponen utama untuk reinforcement learning, yaitu agen (pembuat keputusan),
lingkungan (apa saja yang berinteraksi dengan agen), dan aksi (apa yang agen bisa lakukan).

Tujuan utama reinforcement machine learning adalah bagi agen untuk menentukan aksi apa yang
memaksimalkan hasil dalam waktu yang ditentukan.

Anda mungkin juga menyukai