Bab Iii
Bab Iii
METODOLOGI PENELITIAN
3.2. Dataset
Dalam penelitian ini, peneliti menciptakan dua skenario menggunakan dua
dataset. Set pertama (imbalance) adalah set data dengan jumlah sampel keseluruhan
sebanyak 9.029 sampel gambar yang tersebar tidak merata di dalam 25 kelas, dan
datset kedua (balance) adalah dataset dengan sampel keseluruhan sebanyak 2.000
sampel gambar yang tersebar merata di dalam 25 kelas. Bentuk gambar ini adalah
bentuk konversi dari malware yang telah dirubah menjadi bytemap dengan warna
abu-abu. Akurasi pada tingkat kesamaan dataset yang tinggi pada setiap skenario
membuat tingkat kesulitan dalam mengklasifikasikan setiap kategori malware yang
ada menjadi cukup tinggi.
𝑇𝑟𝑢𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 =
𝑇𝑟𝑢𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒 + 𝐹𝑎𝑙𝑠𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒
𝑇𝑟𝑢𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒
𝑅𝑒𝑐𝑎𝑙𝑙 =
𝑇𝑟𝑢𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒 + 𝐹𝑎𝑙𝑠𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒
2 𝑥 𝑃𝑟𝑒𝑠𝑖𝑠𝑖 𝑥 𝑅𝑒𝑐𝑎𝑙𝑙
𝐹1 − 𝑆𝑐𝑜𝑟𝑒 =
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 + 𝑅𝑒𝑐𝑎𝑙𝑙