1. Jelaskan perbedaan konsep Artificial Intelligence (AI) Machine learning (ML) dan Deep
Learning (DL) dari sisi feature extraction, jumlah data, interpretability, waktu eksekusi?
Perbedaan konsep Artificial Intelligence (AI) Machine learning (ML) dan Deep Learning (DL)
dari sisi feature extraction, jumlah data, interpretability, waktu eksekusi adalah
a. Artificial Intelligence (AI) : AI sendiri adalah suatu bidang yang luas yang menyangkup Machine
Learning dan Deep Learning. Oleh karena itu karateristik darinya dapat bervariasi tergantung dengan
teknik atau metode yang digunakan. Secara general dapat disimpulkan dari 4 sisi yaitu :
i. Feature Extraction : Feature extraction dalam AI dapat dilakukan secara manual dan
otomatis, hal ini bergantung kepada metode atau teknik algoritma yang dipakai.
ii. Jumlah Data : Jumlah data yang dibutuhkan juga sangatlah bervariasi. Beberapa teknik AI
dapat bekerja dengan jumlah data yang sedikit, tetapi ada juga yang membutuhkan jumlah
data yang banyak seperti Deep Learning.
iii. Interpretability : Interpretability dari AI sendiri bervariasi, ada teknik yang mempunyai
intepretability yang mudah dipahami contohnya KNN, Linear Regression. dan Decission Tree.
Tetapi ada juga teknik yang terlalu kompleks untuk di interpretasikan, contohnya
model-model Deep Learning.
iv. Waktu Eksekusi : Waktu eksekusi AI sendiri dapat bervariasi bergantung pada kompleksitas
model/teknik dan jumlah data yang ada.
b. Machine Learning (ML) : ML adalah bagian dari AI yang berfokus pada mesin yang dapat belajar
melalui data. Secara general, tujuan dari utama dari ML adalah untuk membuat suatu
sistem/algoritma yang dapat belajar dengan sendiri nya melalui data yang diberikan. Berikut
penjelasan singkat atas feature extraction, jumlah data, interpretability, waktu eksekusi dalam ML :
i. Feature Extraction :Feature extraction dalam ML merupakan proses data mentah di
transformasi atau di ekstraksi, dengan tujuan untuk mendapatkan bentuk yang lebih mudah
di proses dan dapat meningkatkan akurasi prediksi.Feature extraction dalam Machine
Learning (ML) dapat dilakukan dengan dua pendekatan utama, yaitu secara manual atau
otomatis, tergantung pada konteks dan sifat data yang dihadapi. Pendekatan manual
melibatkan keterlibatan ahli domain atau pemilik pengetahuan manusia untuk memilih
fitur-fitur yang dianggap relevan berdasarkan pemahaman mendalam mereka tentang data.
Sedangkan pendekatan otomatis menggunakan metode statistik seperti uji chi-squared atau
analisis varians, algoritma machine learning seperti Random Forest, dan teknik reduksi
dimensi seperti Principal Component Analysis (PCA).
ii. Jumlah Data : Algoritma dalam ML dapat bekerja dengan jumlah data yang sedikit ataupun
banyak. Tetapi, performance suatu model ML biasanya berkembang dengan jumlah data
yang lebih banyak. Tetapi jumlah data yang diperlukan biasanya tergantung pada
kompleksitas masalah, algoritma yang digunakan, dan akurasi yang dituju.
iii. Interpretability : Interpretability dalam ML tergantung pada algoritma yang digunakan.
Untuk algoritma statistikal yang cukup simpel mungkin masih mudah untuk diinterpretasi.
Tetapi, untuk algoritma yang kompleks atau pun semi-kompleks sudah tidak mudah untuk di
interpretasi lagi.
i. Supervised Learning : Supervised Learning mengunakan data berlabel. Hal ini berarti supervised
learning membutuhkan data yang memiliki suatu kolom untuk menjadi target output. Supervised
learning digunakan untuk dapat memprediksi atau menklasifikasi suatu variable independen
berdasarkan variable-variable yang bersifat dependen terhadap variable independent terebut.
Prediksi atau klasifikasi variable independent tersebut bergantung pada pola yang ada dalam data
training. Contoh modelnya adalah Regresi Logistik, Random Forest, Support Vector Machines (SVM),
Neural Networks, dan KNN.
ii. Unsupervised Learning : Unsupervised Learning menggunakan data tidak berlabel. Hal ini berarti
unsupervised learning tidak membutuhkan suatu kolom untuk menjadi target output. Melainkan,
unsupervised learning mencari pola-pola dalam data dengan tujuan untuk mengelompokan
objek-objek yang hampir sama. Contoh modelnya adalah K-Means Clustering, Hierarchical Clustering,
dan Principal Component Analysis (PCA).
b. Berikan beberapa tantangan utama yang dihadapi dalam supervised learning dan
unsupervised learning. Bagaimana tantangan ini mempengaruhi kinerja model?
c. Menurut Anda, dalam konteks aplikasi tertentu, kapan tepatnya untuk menggunakan
supervised learning dan kapan lebih tepat untuk menggunakan unsupervised
learning? Jelaskan mengapa.
Supervised learning: Digunakan ketika tujuan kita adalah untuk mengklasifikasikan atau memprediksi
nilai numerik dari suatu data karena supervised learning memiliki pendekatan yang kuat dan jelas.
Supervised learning dapat digunakan dalam mendeteksi anomali yang memiliki label karena
supervised learning dapat mengajarkan model mengenai data normal dan kemudian
mengidentifikasi data yang tidak sesuai.
Unsupervised learning: Digunakan ketika kita ingin melakukan clustering karena dapat memberikan
wawasan tentang struktur data. Dapat digunakan dalam melakukan dimension reduction untuk
meningkatkan efisiensi pemrosesan data. Unsupervised learning juga dapat digunakan dalam
mendeteksi anomali tanpa label untuk menemukan pola dari data tersebut.
10 50
15 60
20 70
25 80
30 90
b. Jika seorang Pokémon memiliki level pengalaman 18, perkiraan berapa kekuatan
serangannya berdasarkan model regresi yang telah Anda hitung?
4. Diketahui sebuah data training sebuah machine learning dalam kasus klasifikasi adalah
sebagai berikut:
c. Bagaimana menentukan nilai “K” yang baik dan mengapa nilai “K” ganjil lebih
diutamakan daripada nilai genap pada Algoritma KNN?
Untuk menentukan nilai “K” yang baik kita dapat memperhatikan beberapa hal
berikut:
- Apabila data memiliki outlier / noise yang tinggi disarankan menggunakan nilai K
yang besar. Hal ini dikarenakan data dengan lebih banyak outlier atau noise
kemungkinan akan berkinerja lebih baik dengan nilai k yang lebih tinggi.
- Apabila data berjumlah genap, sebaiknya nilai K ganjil. Sebaliknya, jika data
berjumlah ganjil, maka kita sebaiknya kita memilih nilai K genap.
Nilai “K” ganjil lebih diutamakan karena dapat menghindari adanya kesamaan jarak
dalam pemilihan mayoritas pada KNN. Apabila nilai “K” genap, akan ada potensi
terdapat 2 kelas mempunyai jumlah tetangga yang sama. Hal ini menyebabkan
ketidakpastian dalam menentukan kelas dari suatu data.
b. Mengapa penting untuk memiliki set data latihan dan pengujian dalam klasifikasi?
Karena pada klasifikasi terdapat ‘label’ jadi diperlukan set data latihan dan pengujian
untuk mengetahui apakah model dapat mengklasifikasi data yang baru maupun
unseen data dan pengujian digunakan sebagai tolak ukur evaluasi dari performa
model yang digunakan.
c. Dalam situasi apa Anda akan memilih menggunakan klasifikasi, dan dalam situasi apa
Anda akan lebih memilih klastering? Jelaskan pemikiran Anda.
Menurut saya, saya akan menggunakan clustering pada saat saya ingin mengetahui
ada kelompok apa saja dari data saya dan selanjutnya saya akan menggunakan
klasifikasi untuk mengetahui data mana saja yang masuk ke kelompok tersebut atau
6. William adalah seorang penggemar film anime yang ingin mengelompokkan beberapa film
anime berdasarkan data yang diperoleh.
Film Anime X Y
Attack on Titan 9 8
My Hero Academia 8 7
Demon Slayer 9 9
One Piece 6 8
Naruto 7 6
Spy x Family 8 9
Pluto 7 8
Gridman Universe 9 9
Iterasi ke-3
Centroid cluster 1 = ((9+9+8+9)/4,(8+9+9+9)/4) = {8.75,8.75}
Centroid cluster 2 = ((8+7+7+6+7+7)/6,(7+8+6+8+6+8)/6) = {7,7.17}
Nilai centroid tidak berubah dan masih sama dengan nilai centroid pada iterasi ke-2
sehingga hasil akhir dari k-means clustering adalah:
Cluster 1: Attack on Titan, Demon Slayer, Spy x Family, Gridman Universe
Cluster 2: My Hero Academia, Kotaro Lives Alone, Sword Art Online, One Piece,
Naruto, Pluto
Kemudian, Anda diminta untuk mendesain sebuah sistem peramalan cuaca menggunakan
Multi Layer Perceptron (MLP) yang dapat menentukan (memprediksi) cuaca yang terdiri dari
2 kelas/ kategori, yakni: ”No Rain” : Tidak hujan ”Rain” : Hujan
a. Gambarkanlah arsitektur MLP yang menurut Anda paling tepat untuk menyelesaikan
masalah prediksi cuaca di atas!
X1_H2 =0.6
X1_ H1=-0.6
X2_H1 = 0.8
X2_H2=0.8
Н1_Н3 =0.9
H1_H4 =0.2
H1_H5 = 0.4
H2_H3 =0.9
H2_H4 =0.2
Jawablah :
a) Gambarkan arsitektur neural network diatas dengan notasi beserta bobotnya!.
b) Lakukan iterasi dengan menggunakan Backpropagation dengan learning rate 0.7, hingga
mencapai kriteria:
- Iterasi maksimum adalah 5, atau
- Mencapai MSE Los yang lebih kecil atau sama dengan 0.1.
c) Berdasarkan hasil iterasi dari poin B, Gambarkan kembali arsitektur neural network dengan
notasi beserta bobotnya yang terbaru.
d) Berdasarkan hasil bobot terbaru dari poin B, tentukan nilai outputnya jika diketahui nilai
fitur X1 = 0 dan X2 = .1
e) Berdasarkan hasil bobot terbaru dari poin B, tentukan nilai outputnya jika diketahui nilai
fitur X1 = 0.9 dan X2 = 0.8.
Mean Square Error
𝑛
1 2
𝑀𝑆𝐸 = 𝑛
∑ (𝑡𝑎𝑟𝑔𝑒𝑡𝑖–𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖𝑖)
𝑖=1
Aktivasi Sigmoid
1
σ(𝑥) = −𝑥
1+𝑒
Secara general perbedaan yang mencolok dari fungsi-fungsi ini adalah penggunaan fungsi untuk
memecahkan sebuah masalah dan nilai dari output yang dihasilkan oleh fungsi tersebut. Misal ada
problem dengan nilainya bersifat linear sehingga kita dapat menggunakan fungsi linear untuk
menyelesaikan masalah tersebut.
- Fungsi aktivasi pada ANN(Artificial Neural Network) berguna sebagai fungsi transfer yang dapat
digunakan untuk mencapai output yang diinginkan terdapat beberapa fungsi aktivasi yang dapat kita
gunakan sesuai dengan masalah yang ingin diselesaikan. Pertama fungsi linear ini digunakan untuk
menghasilkan output yang sama dengan hasil kombinasi linear. Kedua fungsi sigmoid ini digunakan
untuk menghasilkan nilai output antara 0 dan 1 dan biasanya digunakan pada masalah classification
biner karena nilai yang dihasilkan adalah probabilitas. Ketiga ada fungsi ReLu digunakan untuk
menghasilkan output 0 jika inputnya negatif atau 0 dan output nya akan sama dengan input nya jika
inputnya positif biasanya ReLu ini juga digunakan untuk menyelesaikan masalah nonlinear. Keempat
ada fungsi softmax biasanya digunakan untuk menyelesaikan masalah multiclass classification.
Terakhir fungsi Tanh ini mirip dengan fungsi sigmoid namun pada tanh ini nilai outputnya antara -1
hingga 1.
10. Dalam era teknologi modern, penggunaan robot dalam dunia medis, khususnya dalam
bidang robotic surgery semakin menjadi perhatian utama. Robotik telah memberikan
kontribusi signifikan dalam meningkatkan presisi dan efisiensi prosedur operasi. Namun,
penerapan teknologi ini juga memunculkan sejumlah isu etika yang kompleks.
Dalam konteks penerapan robotic surgery tersebut, identifikasi dan analisis implikasi etika
yang terkait dengan keputusan otomatisasi yang dibuat oleh sistem Al selama operasi bedah.
Pertimbangkan faktor-faktor seperti tanggung jawab ahli bedah, otonomi pasien, dan
dampak jangka panjang terhadap praktik medis. Kemudian analisis juga peran regulasi dalam
mengelola aspek etika pada pengembangan dan penggunaan teknologi robotic surgery.