Anda di halaman 1dari 19

Pengantar Machine Learning

Gusti Made Arya Sasmita & TIM


Machine Learning
 Dalam era teknologi yang semakin maju, perkembangan Artificial Intelligence (AI) dan Data
Science semakin melonjak pesat.
 Machine
1. Terdaftar pada Learning merupakan
PD-Dikti dan bagian
aktif sebagai dari Artificial
mahasiswa ProgramIntelligence (kecerdasan
Sarjana maksimal buatan)
semester VI; yang
2. Berusia tidak lebih dengan
berhubungan dari 22 pengembangan
tahun pada tanggal 1 Januari yang
teknik-teknik 2023 bisa
yang diprogramkan
dibuktikan dengan
dan Kartu
belajarTanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
dari
3. Belum data menjadi
pernah masa lalu.
finalis Pilmapres Tingkat Nasional;
 Machinesurat
4. Melampirkan Learning merupakan
pengantar alat analisis
dari pimpinan dalam Data Mining.
perguruan
Machine Learning

1. Terdaftar pada PD-Dikti dan aktif sebagai mahasiswa Program Sarjana maksimal semester VI;
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Machine Learning adalah salah satu disiplin ilmu dari Computer Science yang mempelajari
bagaimana membuat komputer/mesin itu mempunyai suatu kecerdasan. Agar mempunyai
suatu kecerdasan,
1. Terdaftar pada PD-Diktikomputer/mesin
dan aktif sebagaiharus dapatProgram
mahasiswa belajar.Sarjana maksimal semester VI;
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Saat ini, Artificial Intelligence banyak digunakan untuk membantu pekerjaan manusia dalam
banyak bidang.
Banyakpada
1. Terdaftar kita jumpai
PD-DiktiAI yang
dan aktifdigunakan dalam bidang
sebagai mahasiswa : Sarjana maksimal semester VI;
Program
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
 hiburan,
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
 lalu
3. Belum lintasmenjadi
pernah dan navigasi,
finalis Pilmapres Tingkat Nasional;
 bidang kesehatan,
4. Melampirkan surat pengantar dari pimpinan perguruan

 edukasi/pendidikan,
 bidang bisnis & retail, dan lain-lain.
Machine Learning
Algoritma Machine Learning dibagi menjadi 3 bagian besar
berdasarkan input dan output yang diharapkan, yakni
 Supervised
1. Terdaftar Learning
pada PD-Dikti yang
dan aktif meliputi
sebagai klasifikasi
mahasiswa dan regresi,
Program Sarjana maksimal semester VI;
2. Berusia tidak lebih dari
 Unsupervised 22 tahun
Learning pada
yang tanggalclustering,
meliputi 1 Januaridan
2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
 Semi-supervised
3. Belum Learning
pernah menjadi finalis yang
Pilmapres merupakan
Tingkat penggabungan Supervised
Nasional;
Learningsurat
4. Melampirkan danpengantar
Unsupervised Learning.
dari pimpinan perguruan
Machine Learning
Secara umum, alur dari Machine Learning dapat kita kelompokan menjadi 3, yaitu
 Preprocessing Data,
 Modelling,
1. Terdaftar dan dan aktif sebagai mahasiswa Program Sarjana maksimal semester VI;
pada PD-Dikti
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
 Evaluasi.
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Preprocessing Data
 Preprocessing (pra-pemrosesan) data merupakan tahap awal untuk mempersiapkan data
sebelum
1. Terdaftar pada melakukan
PD-Dikti danmodelling.
aktif sebagai mahasiswa Program Sarjana maksimal semester VI;
2. Berusia tidak lebih dari
 Preprocessing data22initahun pada untuk
bertujuan tanggal 1 Januari 2023
mendapatkan hasilyang
yangdibuktikan dengan Kartu Tanda
lebih akurat.
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
 Dalam
3. Belum halmenjadi
pernah lain, preprocessing
finalis Pilmapresdata dapat
Tingkat berguna untuk mengurangi waktu komputasi
Nasional;
atau untuk
4. Melampirkan melihat
surat karakteristik
pengantar data.
dari pimpinan perguruan
Machine Learning
Preprocessing Data
 Data Cleaning.
 Transformasi
1. Terdaftar Data.
pada PD-Dikti dan aktif sebagai mahasiswa Program Sarjana maksimal semester VI;
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
 Data Cleaning
 Mengidentifikasi atau Menghilangkan Data Outlier dan Inkonsitensi Data.
 Menghaluskan
1. Terdaftar Noisy
pada PD-Dikti Datasebagai mahasiswa Program Sarjana maksimal semester VI;
dan aktif
2. Berusia tidak lebih
 Mengatasi dari 22
Missing tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Value
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Suatu data dapat dilakukan modelling jika data tersebut lengkap (tidak ada missing value).
Pada data tabular, jika terdapat data yang tidak lengkap (incomplete) maka kita dapat
menghapus
1. Terdaftar pada data tersebut
PD-Dikti jikasebagai
dan aktif proporsi data yang
mahasiswa tidak lengkap
Program hanya sedikit
Sarjana maksimal dibandingkan
semester VI;
2. Berusia
seluruhtidak
datalebih
yangdari
ada.22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
Jika suatu
3. Belum pernahdata terdapat
menjadi finalisbanyak data
Pilmapres yangNasional;
Tingkat hilang (missing) dan tidak mungkin dihapus, maka
kita harus mengisi
4. Melampirkan missingdari
surat pengantar value tersebut.
pimpinan perguruan

Ada beberapa cara mengisi missing value dengan pendekatan statistik seperti, mengisi
dengan nilai rata-rata, modus, ataupun mediannya.
Machine Learning
Transformasi Data
Centering
Centering
1. Terdaftar merupakan
pada teknik
PD-Dikti dan transformasi
aktif sebagai data dengan
mahasiswa Program cara mengurangi
Sarjana setiap data
maksimal semester VI; dengan
2. Berusia tidak
rata-rata darilebih dariatribut
setiap 22 tahun
yangpada
ada. tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Standarisasi (normalisasi z-score)
Setelah melakukan Centering, setiap hasil dari Centering dibagi dengan standar deviasi dari
atribut yang
1. Terdaftar pada bersangkutan.
PD-Dikti dan aktifCara demikian
sebagai disebut
mahasiswa dengan
Program Standarisasi.
Sarjana maksimal semester VI;
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Scaling
Scaling adalah prosedur merubah data sehingga berada dalam skala tertentu. Biasanya
menggunakan
1. Terdaftar skala dan
pada PD-Dikti [0,1]aktif
atau [-1,1] mahasiswa
sebagai tetapi bisa Program
juga menggunakan skalasemester
Sarjana maksimal tertentuVI;
lainnya.
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah menjadi finalis Pilmapres Tingkat Nasional;
4. Melampirkan surat pengantar dari pimpinan perguruan
Machine Learning
Modelling
Sebelum melakukan modelling. Kita membagi data menjadi 2 bagian, yaitu data untuk
melakukan
1. Terdaftar padamodelling atau
PD-Dikti dan aktifyang biasa
sebagai disebut
mahasiswa data train
Program danmaksimal
Sarjana data untuk menguji
semester VI; model
2. Berusia tidak lebih
hasil training yangdari 22 tahun
biasa pada
disebut tanggal
data test. 1Proporsi
Januari 2023 yang dibuktikan
pembagian dengan
antara data trainKartu Tanda
dan data
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
test tidak
3. Belum ada
pernah ketentuan
menjadi finalis baku, tetapi
Pilmapres biasanya
Tingkat digunakan proporsi 70% untuk data train dan
Nasional;
30% untuk surat
4. Melampirkan data pengantar
test. dari pimpinan perguruan
Machine Learning
Selanjutnya, data train ini yang akan kita gunakan untuk membuat model.
Algoritma Machine Learning yang digunakan disesuaikan dengan tujuan dari modellingnya.
Jika klasifikasi,
1. Terdaftar salahdan
pada PD-Dikti satu contoh
aktif algoritma
sebagai yang
mahasiswa dapat Sarjana
Program digunakan yaitu semester
maksimal Naive Bayes,
VI;
2. Berusia tidak kita
jika regresi lebihdapat
dari menggunakan
22 tahun pada Decision
tanggal 1 Tree
Januari 2023 yang dibuktikan dengan Kartu Tanda
Regresor,
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
jika clustering
3. Belum kita dapat
pernah menjadi finalisgunakan
PilmapresK-means.
Tingkat Nasional;
Selain itu, masih
4. Melampirkan banyak lagi
surat pengantar darialgoritma Machine Learning lainnya.
pimpinan perguruan
Machine Learning
Evaluasi
Untuk mengevaluasi kinerja suatu model tidak hanya ditentukan oleh akurasi saja. Banyak
cara lain yang dapat digunakan untuk menilai performa dari suatu model, diantaranya:
1. Terdaftar pada PD-Dikti dan aktif sebagai mahasiswa Program Sarjana maksimal semester VI;
 Klasifikasi (classification metrics): accuracy, precision, recall, F1-score, ROC, AUC, dan
2. Berusia tidak lebih dari 22 tahun pada tanggal 1 Januari 2023 yang dibuktikan dengan Kartu Tanda
lainnya.
Penduduk (KTP) atau Kartu Izin Tinggal Terbatas (KITAS);
3. Belum pernah(regression
 Regresi menjadi finalis Pilmapres
metrics) Tingkat
: MSE, Nasional;
MAE, dan lainnya.
4. Melampirkan surat pengantar dari pimpinan perguruan
 Klastering (clustering metrics): Silhouette Coefficient, Davies-Bouldin Index, Dunn Index,
dan lainnya.
Tugas Mandiri
Lakukanlah review terhadap salah satu paper
berbahasa inggris dari jurnal manapun, hasilnya
upload ke oase

07
TERIMA KASIH

07

Anda mungkin juga menyukai