Sempro M. Dika Saputra 201820101010 Slide
Sempro M. Dika Saputra 201820101010 Slide
Seminar Proposal
M. Dika Saputra
NIM 201820101010
MAGISTER MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
BAB 1.
PENDAHULUAN
Latar Belakang Interpretasi Machine Learning
Machine learning : Support vector machine merupakan metode Shapley Additive Explanations (SHAP)
• Supervised ML Supervised ML. • Berdasarkan teori permainan optimal.
• Unsupervised ML. • Menemukan hyperplane • Estimasi nilai shapley berbeda pada data
• Memaksimalkan jarak antar kelas sampel yang berbeda
Masalah pada SVM :
• Kompleksitas yang tinggi
Metode bootstrap:
• SVM nonlinier kontribusi peubah menjadi
• Tanpa distribusi tertentu
lebih sulit dijelaskan
• Pendugaan Selang kepercayaan
Rumusan Masalah Tujuan
Kerawanan Pangan
Machine Learning
Gaussian
Sigmoid
Balancing Data
Data tidak seimbang merupakan keadaan dimana distribusi kelas
tidak seimbang, yaitu jumlah kelas data (instance) yang satu lebih
sedikit atau lebih banyak dibanding dengan jumlah kelas lainnya.
• Synthetic Minority Over-samping Technique (SMOTE)
• metode random undersampling
Sumber :
https://towardsdatascience.com/
TINJAUAN PUSTAKA
Nilai Prediksi
1. Confusion matrix Confusion
2. Nilai Area Under Curve (AUC)
matrix TRUE FALSE
TP (True FP (False
TRUE
Positive) Positive)
F1-Score
Nilai
Riil
FN (False TN (True
FALSE
Negative) Negative)
TINJAUAN PUSTAKA
Evaluasi Model
Cross Validation (CV) : Konsep kerja dari metode ini
adalah dengan membagi data menjadi himpunan bagian k
dengan ukuran yang hampir sama, data dilatih dan diuji
sebanyak k. setiap pengulangan, salah satu himpunan
bagian akan digunakan sebagai data pengujian dan
himpunan data k lainnya berfungsi sebagai data pelatihan.
Proses splitting pada 10-Cross Validation
sumber : Berrar, 2018
TINJAUAN PUSTAKA
Pada tahun 1953, Lyold Shapley memperkenalkan Shapley Value yang mendeskripsikan
payoff dari setiap pemain pada coalitional games secara proposional dengan
mempertimbangkan kontribusi pemain terhadap nilai yang dikumpulkan.
Nilai Shapley memenuhi sifat:
1. Efficiency
2. Symmetry
3. Dummy
4. Additivity.
SHAP juga memenuhi ini, karena menghitung nilai Shapley. Selain itu, dalam interpretasi
SHAP menjelaskan tiga sifat yakni Local accuracy, Missingness, Konsistensi.
TINJAUAN PUSTAKA
Metode Bootstrap
Bootstrap merupakan metode komputasi yang digunakan untuk menentukan akurasi penduga statistika dengan teknik
pengambilan sample ulang secara acak dengan pengembalian (rahmawati, 2019). Tujuan dari metode bootstrap untuk
menghasilkan penduga statistik yang tebaik dengan data yang minimal. Metode bootstrap dapat digunakan untuk
menduga selang kepercayaan meskipun data tidak memiliki distribusi tertentu. Bootstrap persentil merupakan salah satu
metode pendugaan selang kepercayaan dengan menetapkan batas bawah dan atas selang berdasarkan persentase dari replikasi
bootstrap yang dilakukan.
BAB 3.
METODOLOGI
PENELITIAN
METODOLOGI PENELITIAN
Sumber Data
Skala yang dapat menggambarkan ketidakmampuan rumah
FIES tangga atau individu dalam mengakses makanan yang
dibutuhkan secara reguler.
The Global Reference Scale
METODOLOGI PENELITIAN
Variabel Penelitian
Variabel yang digunakan pada penelitian ini
terdiri dari variabel numerik dan ketegorik.
Variabel respon yang digunakan adalah ukuran
Food Insecurity Experience Scale (FIES) pada
SUSENAS. Variabel penjelas menggunkan data
SUSENAS 2019 dan PrADa 2019 sebanyak 4
variabel.
19
FIES pada Survei Sosial Ekonomi Nasional (SUSENAS)
FIES pada
Blok XVII
Susenas
2020
20
Pengukuran FIES pada Rumah Tangga (SUSENAS 2020)
Tahapan Penelitian
Review Plot SHAP