LAPORAN AKHIR
PENELITIAN DOSEN PEMULA
TIM PENGUSUL
DAFTAR ISI
DAFTAR GAMBAR
Gambar 1. Tahap Pemilihan Account ................................................................... 21
Gambar 2. Identifikasi Email Address .................................................................. 21
Gambar 3. Informasi Server.................................................................................. 22
5
RINGKASAN
peneliti berencana merancang suatu plug-in anti spam yang dipasang pada email
client khusus menyaring spam saja dari inbox pengguna dengan menggunakan
metode Naive Bayes Classifier. Plug-in tersebut nantinya akan digunakan oleh
pengguna yang akan bermanfaat dalam menyaring dan memisahkan email spam
dan email ham secara otomatis setelah dilakukan pelatihan. Sehingga apabila si
pengguna mengganti PC atau laptop yang bersistem operasi berbeda dari
sebelumnya, tidak akan mempengaruhi kualitas dari plug-in anti spam yang telah
diinstal selama email yang digunakan berdomain sama dengan sebelumnya.
Kata Kunci : email client, email spam, plug-in, Naive Bayes Classifier
PRAKATA
Alhamdulillahirobbil’aalamiin, peneliti panjatkan kehadirat Allah SWT atas
segala rahmat dan karunia yang telah dilimpahkan-Nya kepada peneliti sehingga
dapat menyelesaikan penelitian ini. Peneliti juga memanjatkan sholawat dan
salam kepada tauladan nabi besar kami Muhammad SAW. Selama proses
penyelesaian penelitian ini, suami tercinta, Dedi Jufri, S. Ag. yang senantiasa
mendoakan dan mendukung peneliti untuk terus berusaha tanpa kenal waktu agar
bisa dengan tepat waktu menyelesaikan tujuan penelitian ini. Terkirim do’a untuk
ayahanda tercinta Alm. Drs. H. M. Yulis Palewai, yang telah mendahului orang-
orang tercintanya dan ibunda tersayang Hj. Murni yang setiap saat mendorong
peneliti untuk tetap berkarya, memberikan bantuan, harapan dan do’a agar
semuanya berjalan lancar, serta kasih sayang mereka yang mengalir terus menerus
hingga peneliti dapat menyelesaikan penelitian ini. Kakak Yumiarni, SS beserta
suaminya dr. Edi Suharman dan adik-adik yang peneliti sayangi, drg. Nurlinda
beserta suaminya Muhammad Muchlis, ANT III, Nur Astrid, SKM beserta
suaminya Muhammad Iqbal, ST serta seluruh keluarga besar yang selalu
mendoakan keberhasilan peneliti. Banyak pihak pula telah memberikan bantuan
yang sangat berarti kepada peneliti, baik dalam bentuk materil maupun
nonmateril. Oleh karena itu, dengan segala kerendahan hati, peneliti
menyampaikan Jazakumullaahu Khair dan ucapan terima kasih yang sebesar-
besarnya kepada :
7
Peneliti
BAB I
PENDAHULUAN
A. Latar Belakang
Perkembangan teknologi sekarang berkembang secara pesat. Khususnya di
bidang internet, karena informasi dapat menciptakan dunia baru, membawa
beragam dinamika dari dunia nyata. Seiring dengan perkembangan teknologi
banyak bentuk – bentuk penyerangan terhadap sebuah situs web site, baik itu
dilakukan oleh hacker, cracker, ataupun virus. Dengan makin banyaknya virus,
kenyamanan saat berinternet-an pun ikut berkurang. Salah satu fasilitas internet
8
yang sering kita gunakan adalah email. Akhir-akhir ini email merupakan hal yang
sangat penting bagi kita, manfaatnya sering kita rasakan. Kita dapat menerima
informasi atau bertukar pesan dengan cepat dan mudah. Karena fasilitas ini
mengharuskan kita terhubung ke internet (sebagian besar penggunaan email
terhubung ke internet kecuali dalam jaringan LAN/intranet) membuat resiko
terserang virus semakin tinggi. Salah satu bentuk varian virus atau malware
tersebut adalah spam. Spam yang berarti email sampah atau email yang tidak kita
butuhkan, merupakan kata yang sering didengar. Kata spam konon berasal dari
zaman viking dan tak ada sangkut pautnya dalam email (surat elektronik) yang
biasa kita gunakan. Sebenarnya email yang dianggap spam itu tergantung dari
sudut pandang masing-masing (sudut pandang subyektif secara individu). Contoh
misalnya,Alex yang seorang perancang busana mendapatkan email yang berisi
penawaran produk mode meskipun dia tidak menginginkannya tetapi dia tidak
menganggap hal itu sebagai spam tetapi lain halnya jika yang menerimanya
adalah Yusuf seorang tenaga IT disamping dia tidak menginginkannya dia juga
akan merasa terganggu dengan penawaran tersebut karena tidak berhubungan
sama sekali dengan dunia yang ia geluti (IT). Dampak buruk yang nyata atau
langsung dapat dirasakan dari pengguna email dari spam ini adalah waktu yang
terbuang sia-sia. Saat mengecek email yang ada pada inbox umumya pengguna
email memilah mana email yang benar-benar email (penting) mana yang spam,
tentu saja pengguna akan langsung menghapus spam saat menemukannya hal ini
akan menghabiskan waktu terkadang tak jarang email yang penting pun turut ikut
terhapus, hal ini tentu saja sangat merugikan. Bagi orang-orang yang tidak dapat
leluasa koneksi ke internet, bandwidth yang dibatasi oleh quota, juga quota pada
inbox email akan sangat merugikan jika terkena dari spam ini. Spam juga dapat
memborbardir mailing list dengan membuat copy-an suatu artikel yang sama . Di
lain pihak, spam adalah sebuah masalah yang multidimensional. Sebagai masalah
teknis, spammer menyalahgunakan atau menghabiskan resource jaringan.
Komunitas milis Spam Brigade menjuluki spam sebagai “the biggest waste of
bandwidth on the Internet and Usenet”. Spam bisa memenuhi mailbox,
9
disebabkan oleh suatu hal, maka otomatis plug-in tersebut juga akan dapat
langsung diinstalnya pada email client yang digunakan. Jadi otomatis plug-in
tersebut juga sama dengan backup data yang mempermudah setiap user dalam
mengamankan emailnya dari spam ataupun ham.
B. Rumusan Masalah
1. Bagaimana menganalisis hasil pengklasifikasian email ham dan email spam
dengan menggunakan plug-in pada email client ?
Pengklasifikasian dilakukan dengan menggunakan teknik memperkenalkan
account email uji coba untuk mendapatkan respon langsung dari para
spammer dan mengirimkan input beberapa email dari sumber email lain yang
sudah berstatus ham dan spam
2. Bagaimana plug-in anti spam metode Naive Bayes Classifier di sisi email
client mampu mengklasifikasikan email ham dan email spam ?
Pada sistem ini, sejumlah sampel email ham dan email spam akan dikirimkan
untuk mengenali parameter-parameter dalam men-training plug-in anti spam
metode Naive Bayes Classifier, parameter tersebut digunakan sebagai
pengenalan cerdas bagi sistem untuk menyaring email. Dalam hal ini sistem
akan mengenali email tersebut berdasarkan apa yang sudah di-training-kan
pada plug-in anti spam dan akan mengklasifikasikan langsung ke dalam
masing-masing folder yang sudah ditentukan.
3. Bagaimana plug-in anti spam mampu melakukan pengenalan email klasifikasi
dengan data email secara acak?
Plug-in anti spam dikirimkan input email spam dan email ham yang pernah
ditraining dengan email yang belum pernah ditraining secara acak. Outputnya
berupa pengenalan terhadap email ham atau email spam tersebut berdasarkan
nilai yang ditraining dari email sebelumnya.
4. Berapa tingkat akurasi dan error dari plug-in anti spam metode Naive Bayes
Classifier dalam mengenali email ham dan email spam ?
Menghitung persentasi akurasi plug-in anti spam dalam mengenali setiap
email ham dan email spam yang ditraining maupun yang tidak ditraining.
11
C. Batasan Penelitian
Menganalisa hasil klasifikasi email spam dan email ham dengan hanya
memperhatikan header dan body dari email, dan mengklasifikasikan email spam
dan email ham menggunakan metode Naive Bayes Classifier pada plug-in email
client yang tidak dapat melakukan pengecekan terhadap sebuah attachment atau
file.
BAB II
TINJAUAN PUSTAKA
A. Email Client
Email Client adalah tool atau software untuk mempermudah dalam mengatur atau
mengelola email secara offline (tidak terhubung koneksi internet). Dengan adanya
software email client, pesan email yang ada pada server email didownload
terlebih dahulu ke dalam komputer anda dan setelah semua email di download,
pesan email tersebut bisa anda kelola secara offline kapan saja tanpa harus
terhubung ke internet. Contoh software email client : Microsoft Outlook,
Thunderbird, Windows Live mail, dan lain-lain.Ada juga browser internet yang
sudah langsung terintegrasi dengan layanan email client, contoh web browser
tersebut adalah browser internet opera.
B. Email Spam
Email Spam adalah pesan email yang bersifat menyalahi aturan dan biasanya
berisi iklan ataupun yang lainnya sehingga mengakibatkan ketidak nyamanan
pengguna email. Spam email biasanya dikirim dalam jumlah yang banyak atau
secara terus-menerus sehingga akan memenuhi inbox penerima email. Selain itu
Spam email seringkali menggunakan software pengirim otomatis sehingga pesan
yang dikirimkan bisa dalam jumlah yang banyak dan terus menerus. Banyak dari
penyedia email membuat sistem untuk menangkal terhadap adanya email spam.
12
C. Plug-in
Pengertian plug-in harus disamakan dulu plug-in untuk apa dan dimana
dipakainya, karena plug-in itu bisa berarti macam macam, plug-in ada juga di
industri, di spare part dan sebagainya. Dalam dunia komputasi, plug-in yang juga
disebut plug-in, addin, add-in, addon, add-on, snap-in, snapin, mirip juga dengan
file extension, terdiri dari program computer yang berinteraksi dengan aplikasi
host ( suatu web browser atau email klien misalnya) untuk menyediakan hal
khusus, biasanya sangat spesifik fungsi yang diinginkan. Seringkali add-on
dianggap sebagai batasan umum dalam uraian plug-in, extensions dan theme
sebagai sub kategori. Suatu aplikasi didukung oleh plug-in ditujukan untuk
berbagai alasan, antara lain adalah memungkinkan buat pihak ketiga membuat
kemampuan tambahan pada aplikasi, mendukung fitur yang tidak terlihat,
menurunkan ukuran aplikasi dan memisah kode sumber karena tidak kompatibel
dengan software yang berlisensi. Contoh aplikasi termasuk dengan plug-innya
adalah Microsoft Office, Rockbox, Firmware untuk Digital Audio Players, Email
Client, Software Graphic, Media Player, Paket Sniffer, Aplikasi Sensing Remote,
Web Browser, beberapa Digital Mixing Console, Web Contain Management
Systems, menggunakan plug-in untuk meningkatkan fungsinya. Dengan kata lain,
Plug-in adalah sebuah program komputer yang menambah fungsionalitas sebuah
program utama. Program utama biasanya memberikan semacam antarmuka
(interface) agar plug-in dapat berinteraksi dengan program utama.
Email Client, untuk mengakses layanan email diperlukan aplikasi di sisi klien
sehingga pengguna dapat mendownload email. Aplikasi ini menghubungi email
server dengan mengirimkan informasi account user dan password. Apabila server
menerima account dan password tersebut maka email untuk suatu account akan
didownload ke klien, biasanya menggunakan protokol POP3. Apabila seorang
user mengirimkan email maka email server akan mendownload email tersebut
menggunakan protokol SMTP.
D. Naïve Bayes Classifier
Metode Bayesian Plugining merupakan metode anti spam plugin yang handal.
Metode ini mengenali spam berdasarkan kata-kata (token) yang terkandung pada
13
sebuah email. Metode plugin ini pertama kali perlu di-“training” menggunakan
dua koleksi email, satu koleksi merupakan spam-mail, dan koleksi yang lain
merupakan legitimate mail. Dengan cara seperti ini, pada setiap email baru yang
diterima, Bayesian Plugin dapat memperkirakan probabilitas spam berdasarkan
kata-kata yang sering muncul di koleksi spam-mail atau di koleksi legitimate mail.
Bayesian Plugin efektif untuk mem-blok spam karena plugin ini dapat secara
otomatis mengkategorikan spam-mail atau legitimate mail.
Naive Bayes Classifier, merupakan klasifikasi yang bersifat statistik, yang dapat
memprediksi peluang-peluang keanggotaan kelas, seperti peluang bahwa suatu
sampel yang diberikan termasuk kelas tertentu. Klasifikasi Naive Bayes Classifier
didasarkan pada teorema Bayes [Han. 2011].
Teorema Bayes, algoritma Naive Bayes Classifier dinamai sesuai nama
Thomas Bayes (1702-1761) yang pertama kali mengajukan persoalan statistik
yang kini dikenal sebagai teorema Bayes. Istilah Naive Bayes Classifier sendiri
baru muncul sekitar tahun 1950-an. Sebelumnya, teorema Bayes banyak dipakai
dalam berbagai bidang, mulai dari perhitungan matematis orbit benda langit,
statistika medis, hingga bidang hukum [Rachli. 2007].
Misalkan X merupakan sampel data yang tidak diketahui label kelasnya
dan Y melambangkan variabel kelas, untuk masalah klasifikasi akan dihitung
P Y X , yaitu peluang kelas Y jika diberikan sampel data X . Peluang bersyarat
ini juga dikenal dengan peluang posterior untuk Y dengan syarat X . Peluang
posterior P Y X didasarkan pada informasi sebelumnya yaitu peluang prior PY
PX Y . PY
PY X (1)
P X
Plugin Naive Bayes Classifier, bekerja dengan algoritma Naive Bayes
Classifier yang mendeteksi spam dengan cara menghitung probabilitas dari suatu
email berdasarkan isinya. Probabilitas ini dapat dihitung dengan terlebih dahulu
membuat suatu database email spam dan database email ham. Database tersebut
14
berisi kata-kata yang telah diekstraksi yang terdapat dalam email-email sampel.
Kemudian dengan suatu metode training, plugin anti-spam yang menggunakan
algoritma Naive Bayes Classifier dapat dilatih untuk melihat kata-kata yang sering
digunakan pada email spam, sehingga pada akhirnya dihasilkan plugin anti-spam
yang akurat dengan sekecil mungkin kesalahan [Han. 2011].
Teorema Bayes dalam konteks spam, menyatakan bahwa peluang sebuah
email adalah spam, ditunjukkan oleh keberadaan beberapa kata (selanjutnya
disebut atribut) tertentu didalamnya, adalah sama dengan peluang untuk
menemukan atribut yang sama dalam sebuah email spam, dikalikan dengan
peluang bahwa sebuah email adalah spam, dibagi dengan peluang untuk
menemukan atribut yang sama dalam sembarang email [Rachli. 2007].
Pr kata spam . Pr spam
Pr spam kata ( 2)
Pr kata
3. Peluang total adalah konstan untuk setiap kelas sehingga hanya perlu dihitung
P C c . P X x C c . Peluang prior P C c dapat dihitung dengan
sc
P C c , di mana s c merupakan jumlah email kelas c dalam sampel
s
training dan s merupakan jumlah seluruh email dalam sampel training.
15
4. Jika diberikan banyak atribut, maka akan sangat sulit untuk menghitung
Untuk mengurangi perhitungan dalam mengevaluasi
P X xC c .
yang satu dengan atribut yang lain atau yang biasa disebut kebebasan
bersyarat (conditional independence). Asumsi ini dibuat untuk
menyederhanakan perhitungan dan inilah sebabnya disebut ”naive” [Han.
2011].
Kebebasan Bersyarat, misal X , Y , dan Z melambangkan tiga variabel acak.
Variabel X dikatakan bebas secara bersyarat Y , yang diberikan Z , jika
sesuai kondisi berikut :
PX Y , Z PX Z (4)
P X , Y , Z
P X , Y Z
P Z
P X , Y , Z P Y , Z
.
P Y , Z P Z
P X Y , Z . P Y Z
P X Z . P Y Z (5 )
Kebebasan bersyarat antara X dan Y juga dapat ditulis dalam bentuk berikut :
Persamaan (4) digunakan untuk memperoleh baris terakhir persamaan di atas.
P X C c PX i C c
k
( 6)
i 1
mana sic adalah jumlah email dalam kelas c dalam sampel training yang
mengandung atribut ke-i.
5. Email X termasuk kelas email spam jika dan hanya jika
16
P C spam . P X x C spam P C ham . P X x C ham
Dengan kata lain, email X merupakan kelas dengan peluang posterior
P C c X x maksimum.
Karena dianggap lebih beresiko maka dipilih nilai tertentu untuk memperkecil
kemungkinan terjadinya false positive.
Keterangan :
17
BAB III
METODE PENELITIAN
A. Tujuan Penelitian
Plug-in tersebut akan bermanfaat dan membantu pihak user dalam
mengelola email mereka dari serangan para spammer dan tidak akan mengulangi
pelatihan/training lagi bila user mengganti perangkat keras yang digunakan
sebelumnya, karena plug-in tersebut akan merekam pelatihan / training yang telah
dilakukan sehingga user tidak akan menunggu setahun lebih dalam mengulangi
penggunaan anti spam pada email client tersebut.
1. Untuk menganalisis hasil pengklasifikasian email ham dan email spam dengan
menggunakan metode Naive Bayes Classifier
2. Untuk mengklasifikasikan email ham dan email spam pada anti spam pada
plug-in anti spam metode Naive Bayes Classifier pada email client.
3. Untuk mengetahui tingkat akurasi plug-in anti spam dalam mengenali email
ham dan email spam.
4. Untuk membuat plug-in terhadap email spam dan email ham berdasarkan data
email yang ditraining ke dalam database secara otomatis dengan menerapkan
metode Naive Bayes Classifier
18
B. Manfaat Penelitian
1. Bagi penulis sendiri, dapat membantu pemahaman dan melatih diri dalam
menganalisa masalah, merancang dan memahami perancangan sistem plug in
berdasarkan metode naive bayes classifier.
2. Bagi pembaca, dapat digunakan sebagai alat bantu dalam bertransaksi email
dan menambah ilmu pengetahuan khususnya kepada dunia Informatika bahwa
email client sebagai email yang dapat diakses secara offline, lebih banyak
keunggulannya dibanding menggunakan koneksi internet dalam mengaktifkan
inbox email user, yang akan mengeluarkan biaya dalam memeriksa dan
membacanya setiap hari, begitu pun dengan pemisahan email spam dan email
ham, tentu memakan waktu yang tidak sedikit dalam memilah dan menghapus
satu per satu email yang ada dalam inbox user.
BAB IV
METODE PENELITIAN
A. Jenis Penelitian
1. Studi Literatur (Literature Study). Sumber data yang didapatkan dengan
mengkaji literatur-literatur, buku-buku pustaka yang berkaitan dengan
masalah yang dibahas dan juga melalui artikel-artikel dari internet yang
relevan dengan permasalahan yang dibahas dalam penelitian ini.
2. Metode Pengambilan Data, yaitu Penelitian Lapangan (Field Research). Yaitu
dengan cara mengadakan pengamatan langsung terhadap obyek yang diteliti.
Untuk mendapatkan data di lapangan maka digunakan teknik observasi tanpa
wawancara langsung.
Bahan Penelitian
Yang menjadi parameter atau sebagai bahan penelitian adalah sebagai berikut :
1. Parameter input yaitu email spam dan email ham
2. Parameter output yaitu false positive dan false negative atau akurasi dan error.
D. Metode Pengujian
Metode pengujian yang digunakan adalah metode Naïve Bayes Classifier. Dalam
pengklasifikasian, dua ukuran yang biasa digunakan adalah keakuratan (accuracy)
dan tingkat kesalahan (error rate).
E. Tahap-Tahap Penelitian
Terdapat beberapa tahapan yang dilaksanakan dalam penelitian ini sebagai
berikut :
1. Persiapan sebuah email baru dengan domain yahoo.com
2. Pengumpulan dan mempersiapkan data-data berupa : email spam dan email
ham dengan melakukan subscribe pada milis account yahoogroups
3. Persiapan data penyelidikan lapangan dengan menerapkan observasi untuk
mengetahui email ham, email spam, false positive dan false negative sehingga
didapatkan akurasi dan errornya.
4. Plug-in pada email client untuk training dan testing dengan menggunakan
algoritma Naive Bayes Classifier yang diharapkan hasil kegiatan akhir ini
email client / user tidak dipenuhi oleh banyaknya email spam dan dapat
menerima semua email ham sesuai yang diharapkan.
20
BAB V
HASIL DAN PEMBAHASAN
5. Nama ini nanti akan tampil sebagai nama pengirim email yang dikirimkan.
Jika sudah mengisi nama dan alamat email, klik Next.
6. Selanjutnya akan muncul tampilan seting incoming (POP/IMAP) dan outgoing
server (SMTP). Pilih POP dan masukkan nama domain sebagai incoming
maupun outgoing server.
22
7. Pastikan nama domain yang diisikan sudah betul, penulisan tidak disertai
dengan http:// maupun www, jadi hanya nama domain saja, misalnya
tokopesawat.com (sesuai nama domain Anda). Klik Next.
8. Langkah berikutnya adalah mengisi alamat email dengan lengkap, termasuk
nama domain.
9. Pada Account Name, bebas mengisikan nama untuk account ini. Penamaan
ini sangat bermanfaat ketika kita menggunakan beberapa email sekaligus di
Thunderbird. Misalnya email untuk pekerjaan, email untuk Facebook, email
untuk mailing list dan lain-lain.
10. Setelah memberi nama pada account ini, klik Next.
11. Proses seting Thunderbird telah selesai. Akan muncul detail seting yang telah
dimasukkan.
23
12. Jika belum yakin dengan seting yang ada, maka bisa mengeditnya dengan
mengeklik tombol Back agar kembali ke halaman pengaturan-pengaturan
sebelumnya. Pilihan Download message now boleh tidak dipilih jika belum
ingin membaca email. Jika sudah yakin dengan setingnya, klik Finish.
13. Jika pilihan Download message now dipilih (dicontreng) maka Thunderbird
akan langsung mendownload email dari server, dan muncul dialog yang
meminta password email.
14. Jika ingin Thunderbird mengingat password sehingga tidak muncul dialog
permintaan password, cukup klik pada pilihan Use Password Manager to
remember this password. Tetapi jika lebih suka untuk mengetik password
setiap memeriksa email, jangan contreng pilihan tersebut.
Pengaturan terhadap Plugin dilakukan setelah try and error implementasi dari
perancangan dan programming plugin tersebut, dengan alur tasking sebagai
berikut :
1. Jalankan Thunderbird versi 1.x atau 2.x
2. Setelah terbuka (asumsi Thunderbird telah di setting sebagai mail-client) klik
menu Tools -> Add-ons. Pilih tab Extensions kemudian klik Install…
Tunjukkan letak file spamku-0.01.1_tes1.xpi. Restart Thunderbird.
3. Setelah Thunderbird di-restart, lagkah selanjutnya adalah setting toolbar untuk
Spamku dengan memilih menu View -> Toolbars -> Customizes…
25
4. Temukan toolbar Spam, Not Spam dan Stastictic (ada diagram batangnya),
pilih satu persatu kemudian drag & drop di tempat yang kosong pada lokasi
toolbar di Thunderbird (biasanya tempat kosong). Akan tampak seperti ini :
5. Kemudian pilih menu Tools -> Spamku -> Configure Extension, klik tab Java,
tentukan lokasi Java dengan klik Browse, contohnya di C:\Program
Files\Java\jdk1.6.0_16\bin\javaw.exe. Klik OK.
6. Jika tidak ada alert-alert yang muncul berarti instalasi Spamku telah selesai
dan siap digunakan.
C. Pengimplementasian Plugin
Sampai saat Gambar 10 diambil telah terkumpul email spam dan email ham
secara bertahap setelah diadakan pelatihan (training) beberapa kali sesuai dengan
jumlah data Training untuk pengujian pertama hingga pengujian ke sebelas (11)
berturut-turut sebanyak 70, 110, 150, 190, 230, 270, 310, 350, 390, 455 dan 490
28
email, sedangkan jumlah data uji untuk pengujian pertama hinggá pengujian ke
sepuluh adalah sebanyak 102 email dan pengujian ke sebelas sebanyak 118 email.
False
Data False Nilai
Uji Data Positif Nilai
Training Jumlah Negatif False Akur
Uji (Ham False Error
Data (Spam Nega asi
ke- sp diang Positif (%)
spa Training ha terlewat tif (%)
ham a gap (%)
m m Plugin) (%)
m Spam)
1 40 30 70 35 25 6 10.0 6 10.0 80.0 20.0
2 65 45 110 35 25 5 8.3 4 6.7 85.0 15.0
3 90 60 150 35 25 4 6.7 4 6.7 86.7 13.3
4 115 75 190 35 25 4 6.7 3 5.0 88.3 11.7
5 140 90 230 35 25 3 5.0 3 5.0 90.0 10.0
6 165 105 270 35 25 3 5.0 3 5.0 90.0 10.0
7 190 120 310 35 25 2 3.3 3 5.0 91.7 8.3
8 215 135 350 35 25 2 3.3 2 3.3 93.3 6.7
9 240 150 390 59 43 1 1.0 2 2.0 97.1 2.9
10 270 185 455 59 43 1 1.0 2 2.0 97.1 2.9
11 285 205 490 63 55 0 0.0 1 0.8% 99.2 0.8
1. False Positive
False positive terjadi apabila email ham terhalangi oleh plugin anti-spam atau
- Pada pengujian VII dan VIII terdapat 2 email ham yang diklasifikasikan
Pada Gambar 11 terlihat bahwa kesalahan plugin dalam menghalangi email ham
terdapat 6 email ham yang diklasifikasi sebagai email spam dan jumlah ini
2. False Negative
False negative terjadi apabila email spam yang melewati plugin anti-spam.
- Pada pengujian I terdapat 6 email spam yang melewati plugin. Nilai false
- Pada pengujian II dan III terdapat 4 email spam yang melewati plugin.
- Pada pengujian IV, V, VI dan VII terdapat 3 email spam yang melewati
- Pada pengujian IV, V, VI dan VII terdapat 3 email spam yang melewati
- Pada pengujian XI terdapat 1 email spam yang melewati plugin. Nilai false
Pada Gambar 12 terlihat bahwa dengan bertambahnya jumlah email dalam proses
training maka kesalahan plugin sehingga email spam melewatinya akan semakin
70 sample terdapat 6 email spam yang melewati plugin dan jumlah ini menurun
3. Akurasi
Nilai akurasi dapat diperoleh dari jumlah email ham yang melewati plugin dan
- Pada pengujian I terdapat 35 email ham yang melewati plugin dan 25 email
- Pada pengujian II terdapat 35 email ham yang melewati plugin dan 25 email
- Pada pengujian III terdapat 35 email ham yang melewati plugin dan 25 email
spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 86,7 %
- Pada pengujian IV terdapat 35 email ham yang melewati plugin dan 25 email
spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 88,3 %
- Pada pengujian V dan VI terdapat 35 email ham yang melewati plugin dan 25
email spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 90 %
- Pada pengujian VII terdapat 35 email ham yang melewati plugin dan 25 email
spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 91,7 %
- Pada pengujian VIII terdapat 35 email ham yang melewati plugin dan 25
email spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 93,3
- Pada pengujian VIII, IX dan X terdapat 59 email ham yang melewati plugin
dan 43 email spam yang tersaring oleh plugin, sehingga nilai akurasinya
adalah 97,1 %
- Pada pengujian VIII, IX dan X terdapat 59 email ham yang melewati plugin
dan 43 email spam yang tersaring oleh plugin, sehingga nilai akurasinya
adalah 97,1 %
- Pada pengujian XI terdapat 63 email ham yang melewati plugin dan 55 email
spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 99,2 %
33
Pada Gambar 13 terlihat bahwa kinerja dari plugin anti spam akan semakin
Dengan bertambahnya nilai akurasi dari plugin, maka tingkat kesalahan atau
nilai Error akan semakin berkurang. Error merupakan jumlah dari nilai false
positive dan nilai false negative. Error pada pengujian pertama hingga
Pada Gambar 14 terlihat bahwa kesalahan (Error) dari plugin anti spam akan
sample memberikan nilai Error sebesar 20 % dan nilai ini menurun menjadi
0,8 % pada proses training dengan 490 sample. Jika training sample terus
angka 0.
semakin banyak jumlah email yang ditraining berarti semakin banyak pula daftar
kata dalam database, maka dengan kata lain daftar kata merupakan faktor yang
sangat mempengaruhi akurasi dan kesalahan plugin. Kesalahan plugin sehingga
email spam melewatinya terjadi akibat plugin belum mengenal kata-kata dalam
email spam tersebut. Kata-kata tersebut kemungkinan tidak terdapat dalam
database spam atau memiliki peluang yang lebih kecil dalam proses training,
sehingga perlu ditambah training sample agar peluang kata-kata tersebut menjadi
lebih besar.
Setelah perhitungan hasil uji data training, plugin anti spam akan dicoba
pemanfaatannya pada laptop yang berbeda. Email yang menjadi object penelitian
Setiap email ham dan email spam yang dilatih, akan nampak seperti pada Gambar
15. Hasil pelatihan email akan tersimpan dalam database sebagai token yang
dikenali oleh Filters Bayesianito dengan menekan tombol Save. Email yang
menjadi Kontak akan otomatis dikenali sebagai Trust Email Addreess seperti pada
Gambar 16,
37
Pelatihan akan disimpan bila peneliti tidak lupa menekan selalu tombol Save bila
selesai dalam aktifitas training email spam dan email ham. File pelatihan tersebut
akan digunakan pada laptop berbeda tetapi dengan email user yang sama.
BAB VI
RENCANA TAHAPAN BERIKUTNYA
BAB VII
KESIMPULAN DAN SARAN
A. Kesimpulan
Dari hasil pengujian dengan metode Naïve Bayes Classifier dapat ditarik
kesimpulan bahwa penggunaan plug-in anti spam pada mail client
Thunderbird tersebut, lebih efektif, hemat dan efisien dalam mengatur sendiri
email-emailnya yang akan di blacklist maupun yang whitelist tanpa biaya
online berlama-lama lagi. Selain itu, apabila notebook/laptop/personal
computer(PC) dari user yang telah menggunakan plug-in tersebut mengalami
trouble dan harus menginstal ulang sistem operasinya, maka user hanya
menambahkan penginstalan Bahasa Java dan mail client Thunderbirdnya saja
tanpa harus melatih dan menguji lagi emailnya dari email spam dan email
ham.
B. Saran
Dari hasil penelitian, tidak akan ada kata berhenti sampai disitu saja,
sebenarnya masih banyak yang bisa dikembangkan yakni peneliti dapat
membandingkan hasil pengujian dari plug-in metode Naïve Bayes Classifier
tersebut dengan hasil pengujian anti spam yang sudah terintegrasi default pada
mail client Thunderbird tersebut dengan metode yang sama.
39
DAFTAR PUSTAKA
http://tutorialisme.students.uii.ac.id/cara-setting-popimap-dan-smtp-gmail-pada-
thunderbird-30/ Diakses tanggal 29 Maret 2015 pukul 12:30 AM
39
40
LAMPIRAN 1
JUSTIFIKASI ANGGARAN PENELITIAN
1. Honor
Waktu
Honor/Jam Honor per
Honor (jam/minggu) Minggu
(Rp) Tahun (Rp)
4
Ketua 6,250 6 48 1,800,000
Anggota 5,000 5 48 1,200,000
SUB TOTAL (Rp) 3,000,000
2. Peralatan Penunjang
Harga
Harga Peralatan
Justifikasi
Material Kuantitas Satuan Penunjang
Pemakaian
(Rp) per Tahun
(Rp)
Menangkap Signal
Modem 1 300,000,- 300,000
Provider
Pulsa Kartu Mengakses
12 bulan 150.000,- 1,800,000
Modem Internet
SUB TOTAL (Rp) 2,100,000
40
41
Bahan pencetak
Kertas A4 80 gr 4 40,000 160,000
proposal, laporan,dll
Harga Biaya per
Justifikasi
Material Kuantitas Satuan Tahun
Pemakaian
(Rp) (Rp)
Jepitan kertas Menjepit kertas 12 2,000 24,000
Bahan cetak
Tinta Printer 4
proposal, laporan, 8 25,000 200,000
warna 100 ml
dll
SUB TOTAL (Rp) 684,000
4. Perjalanan
6. Administrasi
41
42
Penyusunan Laporan
5 exp @ Rp 50,000 250,000
Akhir
SUB TOTAL (Rp) 351,000
42
43
LAMPIRAN 2
SUSUNAN ORGANISASI TIM PENELITI
DAN PEMBAGIAN TUGAS
Alokasi
Bidang Waktu
NO Nama NIDN Uraian Tugas
Ilmu (jam/
minggu)
1. Nurlina, S. 0929027601 Sistem 6 Jam/ Ketua Bertugas:
Kom., M.T Informasi Minggu 1. Sebagai koordinator selama
pelaksanaan penelitian
berlangsung.
2. Menganalisis penanganan
email.
3. Merancang konsep sistem.
4. Merancang dan membuat
perangkat keras sistem.
5. Merancang dan membuat
perangkat lunak sistem.
6. Mengevaluasi pengujian
sistem.
7. Mengimplementasikan
sistem.
43
44
LAMPIRAN 3
A. Identitas Diri
B. Riwayat Pendidikan
S-1 S-2
Nama Perguruan STMIK Dipanegara Univ. Hasanuddin
Tinggi Makassar Makassar
Bidang Ilmu Manajemen Informatika Teknik Informatika
44
45
Pendahuluan
No. Tahun Judul Penelitian
Sumber* Jml (Juta Rp)
Negeri 4 Bantimurung
Kab. Maros
Perancangan Sistem Yayasan
Informasi Akademik STMIK
3 2012 6.000.000,00
Berbasis Client Server Dipanegara
Pada LP3I Cab. Mks
45
46
Volume/
No Judul Artikel Ilmiah Nama Jurnal
Nomor/Tahun
Perancangan Sistem Informasi Volume 08 - Jurnal IT
1 Kesiswaan Pada SMU Negeri 1 September 2012 STMIK
Marioriawa Kab. Soppeng ISSN : 2087-6505. Handayani
46
47
Hal.: 69-80
Pengawasan Aktivitas dan
Volume 09,
Pembatasan Hak Akses User Jurnal IT
Desember 2012
2 Pada Sistem Operasi Windows di STMIK
ISSN : 2087-6505.
Bagian Divisi Keuangan PT. Handayani
Hal.: 96- 107
(Persero) Angkasa Pura I Mks
47
48
Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan
dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata
dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya
Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu
persyaratan dalam pengajuan Penelitian Dosen Pemula.
Pengusul,
48
49
LAMPIRAN 3
BIODATA ANGGOTA PENELITI
A. Riwayat Pendidikan
S1 S2
Nama Perguruan STMIK Dipanegara Universitas Hasanuddin
Tinggi Makassar Makassar
Bidang Ilmu Sistem Informasi Teknik Elektro Konsentrasi
Teknik Informatika
Tahun Masuk – Tahun 2002 – 2007 2008 – 2010
Lulus
Judul Skripsi/Thesis Perancangan Sistem Sistem Pengambilan
Informasi Retribusi Parkir Keputusan dalam
Pada PD Parkir Makassar Menentukan Jurusan di SMA
Raya Kota Makassar Negeri Makassar
Menggunakan Algoritma
Naïve Bayesian
49
50
Volume/Nomor/ Nama
No. Judul Artikel Ilmiah Tahun Jurnal
Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan
dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata
dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya
Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu
persyaratan dalam pengajuan Penelitian Dosen Pemula.
Pengusul,
51
52
52