1
min || ω ||2 ) (2.1)
2
Dengan memperhatikan
yi(wxi + b) ≥ 1, i = 1, . . . , λ (2.2)
λ
X
min12||ω||2 + C ti (2.3)
i=1
Dengan memperhatikan
yi(wxi + b) + ti ≥ 1 (2.4)
ti ≥ 0, i = 1, . . . , λ (2.5)
Dimana ti adalah variabel slack. Dalam formulasi ini, kita ingin memak-
simalkan margin antara dua kelas dengan meminimalkan ||w||2. Selain itu,
upaya dilakukan untuk meminimalkan kesalahan klasifikasi (misclassifica-
14
tion error), yang dinyatakan melalui penggunaan variabel slack ti. Pada saat
yang sama, kita juga berupaya memaksimalkan margin yaitu ||w||2. Peng-
gunaan variabel slack t1 adalah untuk mengatasi kasus ketidaklayakan (infe-
asibility) dari pembatas (constraints) yi (wxi + b) ≥ 1 dengan cara memberi
pinalti untuk data yang tidak memenuhi pembatas tersebut. Untuk memini-
malkan nilai ti ini, kita berikan pinalti dengan menerapkan konstanta ongkos
C. Vektor w tegak lurus terhadap fungsi pemisah: wx + b = 0. Konstanta b
menentukan lokasi fungsi pemisah relatif terhadap titik asal (origin).
2.6 Python
Python adalah bahasa pemrograman interpretatif multiguna dengan filosofi
perancangan yang berfokus pada tingkat keterbacaan kode. Python diklaim
sebagai bahasa yang menggabungkan kapabilitas, kemampuan, dengan sin-
taksis kode yang sangat jelas, dan dilengkapi dengan fungsionalitas pustaka
jelas, dan standar yang besar serta komprehensif (Syahrudin & Kurniaw-
an, 2018). Python mendukung multi paradigma pemrograman, utamanya,
namun tidak dibatasi, pada pemrograman berorientasi objek, pemrogram-
an imperatif, dan pemrograman fungsional. Salah satu fitur yang tersedia
pada python adalah sebagai bahasa pemrograman dinamis yang dilengkapi
dengan manajemen memori otomatis. Seperti halnya pada baha ati halnya
pada bahasa pemrograman dinamis lainnya, python umumnya digunakan
sebagai bahasa script meski pada praktiknya penggunaan bahasa ini lebih
luas mencakup konteks pemanfaatan yang umumnya tidak dilakukan de-
ngan menggunakan bahasa script. Python dapat digunakan untuk berbagai
keperluan pengembangan perangkat lunak dan dapat berjalan di berbagai
platform sistem operasi. Salah satu notebook yang berbasis dalam bahasa
16
2.7 TF-IDF
Metode TF-IDF adalah suatu cara yang digunakan untuk memberikan bobot
hubungan pada suatu term (kata) terhadap suatu dokumen, yang merupak-
an sebuah gabungan dari dua konsep perhitungan bobot yaitu gabungan dari
metode term frequency (tf)/frekuensi kemunculan dari sebuah kata pada se-
buah dokumen tertentu dan metode inverse document frequency (idf)/inverse
dari frekuensi dokumen yang mengandung kata tersebut (Karmayasa, 2012).
Pembobotan dasar yang dilakukan dalam melakukan term weighting
(pembobotan kata) yaitu menghitung frekuensi kemunculan kata dalam do-
kumen. Frekuensi kemuculan (TF) yaitu menunjukkan sejauh mana kata
tersebut mewakili dari isi dokumen. Kemudian semakin besar dari kemun-
culan suatu kata (term) pada dokumen maka akan memberikan nilai kese-
suaian yang semakin besar. Pada pembobotan juga akan memperhitungkan
faktor dari kebalikan frekuensi dokumen yang mengandung suatu kata (IDF)
(Karmayasa, 2012).
Pada Term Frequency terbagi menjadi beberapa jenis algoritma yaitu (Yo-
ren, 2018):
1. Raw Term Frequency (TF Murni), yaitu nilai TF yang didapatkan dengan
menghitung frekuensi kemunculan suatu term pada dokumen. Jika
muncul kata sebanyak 4 kali maka kata tersebut akan bernilai 4.
TF
TF = 0.5 + 0.5 x M axT F
D
IDFj = ln DF j
Keterangan :
D : jumlah semua dokumen yang ada dalam koleksi
DFj : jumlah dokumen yang mengandung term (j)
Rumus pada metode TF dan IDF merupakan gabungan dari formula perhi-
tungan row TF dan Formula IDF. Pada penelitian ini jenis formula tf yang
digunakan yaitu Raw Term Frequency (TF Murni), Sehingga jika digunakan
dalam setiap kata pada setiap dokumen akan dihitung bobotnya dengan
menggunakan rumus sebagai berikut:
Keterangan :
i = dokumen ke-d
j = kata ke-t dari kata kunci
Wi,j = bobot term (j) terhadap dokumen (i)
TFi,j = jumlah kemunculan term (j) dalam dokumen (i)
Dapat dilihat pada persamaan, didapatkan hasil bahwa berapapun
besarnya nilai TFi,j jika nilai D = DFj maka akan didapatkan hasil 0 pada
perhitungan IDF. Dengan begitu akan ditambahkan 1 pada sisi IDF, Sehingga
perhitungan bobotnya dirumuskan menjadi sebagai berikut:
D
Wi,j = T Fi,j × ln +1 (2.6)
DFj