LANGLANGBUANA FAKULTASTEKNIK UNIVERSITAS LANGLANGBUANA Jl. Karapitan 116 tel.022-4218086 Bandung 40261
SOAL UJIAN AKHIR SEMESTER (UAS)
SEMESTER GANJIL TAHUN AKADEMIK 2023/2024
Mata Kuliah : Machine Learning
Dosen : Estiyan Dwipriyoko, S.Kom.,M.T. Kelas :A Semester / SKS :7/3 Prodi : Teknik Informatika Hari / Tanggal : Januari 2024 Waktu : Dikumpulkan sebelum 31 Januari 2024 Sifat Ujian : Tugas lewat E-Learning
Nama : Yuraditha Aurelia Putri
NPM : 41155050200046 Kelas :A
Bagian 1 (40%) Jawab Pertanyaan berikut:
1. Apa itu Linear dan Logistic Regresion, apa gunanya dan syarat data apa? Jawab: a. Liner Regresion • Definisi Linear Regresion merupakan salah satu jenis machine learning yang digunakan untuk memodelkan hubungan linear antara satu atau lebih variabel predictor (independen) dan target (dependen). • Kegunaan Linear Regresion digunakan untuk memahami dan memprediksi nilai variabel dependen berdasarkan variabel independen. • Syarat Data Data yang digunakan merupakan data yang memiliki hubungan linear antara variabel independen dan dependen. b. Logistic Regresion • Definisi Logistic Regresion merupakan salah satu jenis machine learning yang digunakan untuk memodelkan dan menganalisis hubungan antara satu atau lebih variabel independen dan dependen biner atau multiclass. • Kegunaan Logistic Regresion digunakan untuk memprediksi probabilitas hasil kategorikal berdasarkan variabel independen. • Syarat Data Variabel dependen harus bersifat biner atau terkategori dan data tidak terdapat multikolinearitas yang signifikan. 2. Apa itu Naive Bayes, apa gunanya dan syarat data apa? Jawab: • Definisi Naïve Bayes merupakan algoritma klasifikasi yang digunakan dalam machine learning dan statistik yang berfungsi untuk memprediksi suatu kelas target. • Kegunaan Naïve Bayes digunakan untuk klasifikasi terutama klasifikasi teks dan dokumen. Naïve Bayes juga digunakan untuk memprediksi suatu kelas target berdasarkan distribusi probabilitas dari fitur yang diamati. • Syarat Data 1. Data Multinomial: Data yang terdiri dari frekuensi kata-kata atau token tertentu. 2. Data Bernoulli: Data yang terdiri dari bilangan biner 0 atau 1. 3. Data Gaussian: Data yang terdiri dari nilai kontinu yang terkait dengan setiap fitur bernilai numerik. 3. Apa itu Decision Tree, apa gunanya dan syarat data apa? Jawab: • Definisi Decision Tree merupakan salah satu metode klasifikasi yang menerapkan struktur pohon. Decision Tree menentukan keputusan berdasarkan serangkaian aturan dan kondisi. • Kegunaan Decision Tree digunakan untuk mengklasifikasikan suatu kategori atau kelas untuk suatu sampel yang berpengaruh dalam membuat keputusan. • Syarat Data 1. Data kategorikal atau numerical 2. Data yang sudah dibersihkan dari nilai yang anomali 3. Data yang terdistribusi seimbang artinya setiap kelas atau nilai target memiliki jumlah sampel yang seimbang 4. Apa itu Random Forest, apa gunanya dan syarat data apa? Jawab: • Definisi Random Forest merupakan algoritma yang digunakan untuk klasifikasi data dalam jumlah yang besar. Klasifikasi ini dilakukan dengan menggabungkan pohon dengan training pada sampel data yang dimiliki. Penggunaan pohon yang semakin banyak akan memengaruhi akurasi yang didapatkan. • Kegunaan Random Forest digunakan untuk pengklasifikasian dan regresi. Algoritma ini digunakan untuk membantu mengatasi permasalahan overfitting yang terjadi di Decision Tree karena algoritma ini menggunakan kombinasi dari banyak pohon yang berbeda. • Syarat Data 1. Data kategorikal dan numerical 2. Data yang sudah dibersihkan dari anomali karena Random Forest sensitif terhadap outlier 3. Data terdistribusi seimbang yang mana setiap kelas atau nilai target memiliki jumlah sampel yang sebanding. 5. Apa itu K-Means, apa gunanya dan syarat data apa? Jawab: • Definisi K-Means merupakan algoritma yang digunakan untuk pengelompokan yang mana algoritma tersebut membagi sejumlah pengamatan menjadi beberapa kelompok sehingga tiap pengamatan termasuk ke dalam kelompok dengan rata-rata terdekat. • Kegunaan K-Means digunakan untuk mengelompokkan data ke dalam kategori berdasarkan karakteristik yang dimiliki. • Syarat Data 1. Data numerical 2. Data yang digunakan memiliki skala variabel yang seragam 3. Jumlah cluster (K) yang dibutuhkan 6. Apa itu Perceptron, apa gunanya dan syarat data apa? Jawab: • Definisi Perceptron merupakan algoritma yang digunakan untuk melakukan klasifikasi biner atau dua jenis. Algoritma ini merupakan model dasar dari jaringan saraf tiruan. Model ini merupakan neuron yang menerima sejumlah input, memberikan bobot pada input, menjumlahkan, dan memberikan output berdasarkan perhitungan. Algoritma ini seperti otak manusia karena menggambarkan bagaimana otak manusia bekerja. • Kegunaan Perceptron digunakan untuk klasifikasi biner. Perceptron digunakan untuk menentukan apakah suatu data termasuk dalam suatu kelompok atau tidak. • Syarat Data 1. Data Binomial misalnya 0 atau 1 2. Dataset dipisahkan secara linear atau terdapat suatu garis yang memisahkan dua kelas. 7. Apa itu Backpropagation, apa gunanya dan syarat data apa? Jawab: • Definisi Backpropagation merupakan algoritma yang digunakan untuk melakukan supervised learning pada jaringan saraf tiruan untuk mencari beban pada setiap neuron yang menghasilkan nilai kesalahan seminimal mungkin melalui data pembelajaran yang diberikan. Algoritma ini dilakukan setelah proses perambatan maju yang merambatkan data dari data input ke output melalui koleksi neuron dan lapisan jaringan saraf tiruan untuk dirambatkan balik ke belakang dari lapisan output ke lapisan input untuk menghitung nilai kesalahan pada masing-masing neuron dibandingkan dengan nilai output yang seharusnya. • Kegunaan Backpropagation digunakan untuk melatih jaringan saraf tiruan sehingga dapat menghasilkan prediksi yang sesuai dengan data target. • Syarat Data 1. Dataset yang memiliki label sesuai 2. Data yang terdistribusi dengan rata pada seluruh kelas 3. Data yang representatif atau berisikan data yang mungkin muncul dalam data sebenarnya 8. Apa itu Self Organizing Map, apa gunanya dan syarat data apa? Jawab: • Definisi Self Organizing Map merupakan salah satu tipe dari Artificial Neural Network yang dilatih dengan cara Unsupervised untuk menghasilkan representasi input dalam dua dimensi. Self Organizing Map menggunakan competitive learning dan tidak menggunakan error- correction learning. Selain itu, Self Organizing Map tidak menggunakan fungsi aktivasi, hanya menggunakan bobot. • Kegunaan Self Organizing Map digunakan untuk mengurangi dimensi, clustering, dan visualisasi data yang kompleks. Self Organizing Map bertujuan untuk mengidentifikasi pola dalam data dan mengorganisasi informasi sehingga struktur hubungan antar data dapat diamati. • Syarat Data 1. Data multivariate yang mana data terdiri dari banyak dimensi atau atribut. 2. Struktur data yang dimiliki bersifat topologi seperti data spasial atau gambar dengan pola geografis. 3. Data yang digunakan memiliki skala yang seragam untuk menyeimbangkan pembentukan peta SOM. Bagian 2 (60%) Tugas 1.0. K-Means Clustering: Data Konsumen 1.1. Silakan menonton dahulu sampai habis video di https://www.youtube.com/watch?v=X3MNBMx6pk8. 1.2. Lakukan Studi Kasus Data Konsumen yang ada pada video tersebut. 1.3. Buat Screenshot Koding dan Hasil, harus menampilkan Nama dan NPM pada coding. Jawab: 2.0. Neural Network Percepteron: Klasifikasi Diabetes 2.1. Silakan menonton dahulu sampai habis video di https://youtu.be/vyAsO_fzNF8?si=ZzdXjRUDn3OzP9eU 2.2. Lakukan Studi Kasus Data Konsumen yang ada pada video tersebut. 2.3. Buat Screenshot Koding dan Hasil, harus menampilkan Nama dan NPM pada coding. Jawab: 3.0. Neural Network Backpropagation: Prediksi Harga Emas 3.1. Silakan menonton dahulu sampai habis video di https://youtu.be/Chg_Vtmr88?si=EzRfWEQQZEwa0nC5 3.2. Lakukan Studi Kasus Data Konsumen yang ada pada video tersebut. 3.3. Buat Screenshot Koding dan Hasil, harus menampilkan Nama dan NPM pada coding. Jawab: 4.0. Self Organizing Map: Pemetaan Tenaga Kerja 4.1. Silakan menonton dahulu sampai habis video di https://youtu.be/iVLixLtNYbk?si=Fb6eDuayl5xAJDy8 4.2. Lakukan Studi Kasus Data Konsumen yang ada pada video tersebut. 4.3. Buat Screenshot Koding dan Hasil, harus menampilkan Nama dan NPM pada coding. Jawab: