Anda di halaman 1dari 24

SUPPORT VECTOR MACHINE (SVM) DAN SHAPLEY

ADDITIVE EXPLANATIONS (SHAP) UNTUK ANALISIS


KEJADIAN RAWAN PANGAN DI JAWA TIMUR

Seminar Proposal
M. Dika Saputra
NIM 201820101010

Dosen Pembimbing Utama : Dr. Alfian Futuhul Hadi, S.Si., M.Si

Dosen Pembimbing Anggota : Dr. Bagus Sartono, S.Si., M.Si

Dosen Penguji Utama : Prof. Drs. I Made Tirta, M.Sc., Ph. D.

Dosen Penguji Anggota : Dr. Firdaus Ubaidillah, S.Si., M.Si.

MAGISTER MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
BAB 1.
PENDAHULUAN
Latar Belakang Interpretasi Machine Learning

Machine learning : Support vector machine merupakan metode Shapley Additive Explanations (SHAP)
• Supervised ML Supervised ML. • Berdasarkan teori permainan optimal.
• Unsupervised ML. • Menemukan hyperplane • Estimasi nilai shapley berbeda pada data
• Memaksimalkan jarak antar kelas sampel yang berbeda
Masalah pada SVM :
• Kompleksitas yang tinggi
Metode bootstrap:
• SVM nonlinier kontribusi peubah menjadi
• Tanpa distribusi tertentu
lebih sulit dijelaskan
• Pendugaan Selang kepercayaan
Rumusan Masalah Tujuan

1. Bagaimana menjelaskakn model SVM 1. Mampu menjelaskakn model SVM


Nonlinier menggunakan Shapley Nonlinier menggunakan Shapley Additive
Additive Explanations. Explanations.
2. Bagaimana peran variabel prediktor 2. Mengetahui peran setiap variabel
dari SUSENAS dan PrADa terhadap prediktor dari SUSENAS dan PrADa
kejadian kerawanan pangan. terhadap kejadian kerawanan pangan.
3. Bagaimana pengaruh (interpretasi) dari 3. Mengkaji pengaruh dari setiap prediktor
setiap prediktor pada kejadian pada kejadian kerawanan pangan
kerawanan pangan. menggunakan Shapley Additive
Explanations.
BAB 2. TINJAUAN PUSTAKA
TINJAUAN PUSTAKA

Kerawanan Pangan

Menurut BKP (2019) kerawanan pangan dapat didefinisikan sebagai suatu


kondisi ketidakmampuan individu atau sekumpulan individu di suatu
wilayah untuk memperoleh pangan yang cukup dan sesuai untuk hidup
sehat dan aktif. Secara umum kerawanan pangan dipengaruhi oleh:
1. ketersediaan (food availibility)
2. keterjangkauan (access to supplies) dan
3. konsumsi pangan (food utilization)
TINJAUAN PUSTAKA

Machine Learning

Aplikasi kecerdasan buatan menggunakan


teknik statistika. Metode dalam mechine
learning terdiri dari dua pendekatan yaitu:
1. Supervised machine learning.
2. Unsupervised machine learning.
Sumber : https://becominghuman.ai/
TINJAUAN PUSTAKA

Support Vector Machine


Hyperplane klasifikasi linier SVM dinotasikan
Support Verctor Machine (SVM)
(1)
merupakan salah satu metode
Pertidaksamaan pada kelas negatif
pembelajaran terawasi yang biasa
digunakan untuk klasifikasi (Suppor
Pertidaksamaan pada kelas positif
Vector Classification) dan regresi (Support
Vector Regression) (Samsudiney, 2019).
Tujuan dari SVM adalah menemukan
Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak
hyperplane terbaik dengan
antara hyperplane dan titik terdekatnya, yaitu ( adalah norm dari
memaksimalkan jarak antar kelas.
vektor w).
• SVM Linier
• SVM Nonlinier
TINJAUAN PUSTAKA

Support Vector Machine

Jenis Kernel Definisi

Polynomial Gambar.2.2 ilustrasi hyperplane


Sumber : Meirista, 2015

Gaussian

Sigmoid

gambar 2.3 Ilustrasi transformasi data


dari input space ke feature space
sumber : Putra, 2020
TINJAUAN PUSTAKA

Balancing Data
Data tidak seimbang merupakan keadaan dimana distribusi kelas
tidak seimbang, yaitu jumlah kelas data (instance) yang satu lebih
sedikit atau lebih banyak dibanding dengan jumlah kelas lainnya.
• Synthetic Minority Over-samping Technique (SMOTE)
• metode random undersampling

Sumber :
https://towardsdatascience.com/
TINJAUAN PUSTAKA

Evaluasi Model Tabel 1. Confusion Matrix

Nilai Prediksi
1. Confusion matrix Confusion
2. Nilai Area Under Curve (AUC)
matrix TRUE FALSE

TP (True FP (False
TRUE
Positive) Positive)
F1-Score
Nilai
Riil
FN (False TN (True
FALSE
Negative) Negative)
TINJAUAN PUSTAKA

Evaluasi Model
Cross Validation (CV) : Konsep kerja dari metode ini
adalah dengan membagi data menjadi himpunan bagian k
dengan ukuran yang hampir sama, data dilatih dan diuji
sebanyak k. setiap pengulangan, salah satu himpunan
bagian akan digunakan sebagai data pengujian dan
himpunan data k lainnya berfungsi sebagai data pelatihan.
Proses splitting pada 10-Cross Validation
sumber : Berrar, 2018
TINJAUAN PUSTAKA

Shapley Value dan Shapley Additive Explainations (SHAP)

Pada tahun 1953, Lyold Shapley memperkenalkan Shapley Value yang mendeskripsikan
payoff dari setiap pemain pada coalitional games secara proposional dengan
mempertimbangkan kontribusi pemain terhadap nilai yang dikumpulkan.
Nilai Shapley memenuhi sifat:
1. Efficiency
2. Symmetry
3. Dummy
4. Additivity.
SHAP juga memenuhi ini, karena menghitung nilai Shapley. Selain itu, dalam interpretasi
SHAP menjelaskan tiga sifat yakni Local accuracy, Missingness, Konsistensi.
TINJAUAN PUSTAKA

Metode Bootstrap

Bootstrap merupakan metode komputasi yang digunakan untuk menentukan akurasi penduga statistika dengan teknik
pengambilan sample ulang secara acak dengan pengembalian (rahmawati, 2019). Tujuan dari metode bootstrap untuk
menghasilkan penduga statistik yang tebaik dengan data yang minimal. Metode bootstrap dapat digunakan untuk
menduga selang kepercayaan meskipun data tidak memiliki distribusi tertentu. Bootstrap persentil merupakan salah satu
metode pendugaan selang kepercayaan dengan menetapkan batas bawah dan atas selang berdasarkan persentase dari replikasi
bootstrap yang dilakukan.
BAB 3.
METODOLOGI
PENELITIAN
METODOLOGI PENELITIAN

Sumber Data
Skala yang dapat menggambarkan ketidakmampuan rumah
FIES tangga atau individu dalam mengakses makanan yang
dibutuhkan secara reguler.
The Global Reference Scale
METODOLOGI PENELITIAN

Sumber Data dan Variabel Penelian


Data yang digunakan dalam penelitian ini
adalah data Survei Sosial Ekonomi
Nasional (SUSENAS) tahun 2019 dan
Profil dan Analisis Daerah Provinsi Jawa
Timur Tahun 2019. Pengumpulan data
dilakukan sesuai dengan framework
disamping.
METODOLOGI PENELITIAN

Variabel Penelitian
Variabel yang digunakan pada penelitian ini
terdiri dari variabel numerik dan ketegorik.
Variabel respon yang digunakan adalah ukuran
Food Insecurity Experience Scale (FIES) pada
SUSENAS. Variabel penjelas menggunkan data
SUSENAS 2019 dan PrADa 2019 sebanyak 4
variabel.
19
FIES pada Survei Sosial Ekonomi Nasional (SUSENAS)

FIES pada
Blok XVII
Susenas
2020

 
20
Pengukuran FIES pada Rumah Tangga (SUSENAS 2020)

Kondisi rumah tangga selama setahun terakhir

r1701 - KHAWATIR Tidak Akan Memiliki Cukup Makanan


Pilihan Jawaban
r1702 - Tidak Dapat Menyantap Makanan SEHAT DAN BERGIZI
r1703 - Menyantap SEDIKIT JENIS Makanan 1. Ya ……………………….1
r1704 - MELEWATKAN Satu Waktu Makan Pada Suatu Hari Tertentu 2. Tidak ……………………5
r1705 - Makan LEBIH SEDIKIT Daripada Seharusnya 3. Tidak Tahu ……………..8

r1706 - KEHABISAN Makanan 4. Menolak menjawab ……9

r1707 - Merasa LAPAR Tapi TIDAK MAKAN


r1708 - TIDAK MAKAN Seharian
21
Pengukuran FIES pada Rumah Tangga (SUSENAS 2020)

Rawan Pangan Rawan Pangan Jumlah Tingkat


Ringan Parah Jawaban
“Ya”
Kerawanan
Pangan
0 Tidak Rawan
Khawatir, lalu Lapar dan 1-8 Parah
menyesuiakan kualitas dan tidak makan
jenis makanan

Ilustrasi FIES pada Sampel Rumah Tangga


sampel r1701 r1702 r1703 r1704 r1705 r1706 r1707 r1708 Skala FIES
1 5 5 5 5 5 5 5 5 tidak
2 5 5 5 5 5 5 5 5 tidak
3 1 1 1 1 1 1 1 9 parah
4 1 1 1 1 5 5 5 8 Parah
5 5 5 5 5 5 5 5 5 Parah
6 1 1 1 5 5 5 5 5 Parah
7 1 1 1 5 5 5 5 5 Parah
8 5 5 5 5 5 5 5 5 tidak
9 1 1 1 1 1 5 5 5 Parah
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
dst dst dst dst dst dst dst dst dst dst
METODOLOGI PENELITIAN

Tahapan Penelitian
Review Plot SHAP

Predicting and Interpreting Student Performance


Using Ensemble Models and Shapley Additive Explanations
Oleh : Hayat Sahlaoui, dkk.
Terima Kasih

Anda mungkin juga menyukai