Anda di halaman 1dari 52

Kode/Nama Rumpun Ilmu : 461/Sistem Informasi

LAPORAN AKHIR
PENELITIAN DOSEN PEMULA

IMPLEMENTASI PLUG-IN ANTI SPAM EMAIL CLIENT DENGAN


METODE NAIVE BAYES CLASSIFIER

TIM PENGUSUL

Nurlina, S. Kom., M.T (0929027601)


Nurlindasari Thamsir, S. Kom., M. T (0920038502)

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN


KOMPUTER (STMIK DIPANEGARA) MAKASSAR
November 2016
2
3
4

DAFTAR ISI

HALAMAN JUDUL .............................................................................................. i


HALAMAN PENGESAHAN............................................................................... ii
BERITA ACARA SERAH TERIMA LAPORAN KEMAJUAN ..............iii
DAFTAR ISI......................................................................................................... iv
DAFTAR GAMBAR............................................................................................ iv
RINGKASAN ........................................................................................................ v
PRAKATA............................................................................................................ vi
BAB I PENDAHULUAN...................................................................................... 7
A. Latar Belakang ................................................................................... 7
B. Rumusan Masalah ............................................................................ 10
C. Batasan Penelitian ............................................................................ 11
BAB II TINJAUAN PUSTAKA ........................................................................ 11
BAB III TUJUAN DAN MANFAAT PENELITIAN ...................................... 17
BAB IV METODE PENELITIAN .................................................................... 18
A. Jenis Penelitian................................................................................. 18
B. Teknik Pengumpulan Data.............................................................. `18
C. Alat dan Bahan Penelitian................................................................ 19
D. Metode Pengujian ............................................................................ 19
E. Tahap-Tahap Penelitian ................................................................... 19
BAB V HASIL DAN PEMBAHASAN.............................................................. 20
BAB VI RENCANA TAHAPAN BERIKUTNYA ........................................... 38
BAB VII KESIMPULAN DAN SARAN........................................................... 39
DAFTAR PUSTAKA
LAMPIRAN

DAFTAR GAMBAR
Gambar 1. Tahap Pemilihan Account ................................................................... 21
Gambar 2. Identifikasi Email Address .................................................................. 21
Gambar 3. Informasi Server.................................................................................. 22
5

Gambar 4. Nama Pengguna .................................................................................. 23


Gambar 5. Nama Account ..................................................................................... 23
Gambar 6. Setting Thunderbird Sukses ................................................................ 23
Gambar 7. Password Sesuai Accountnya.............................................................. 24
Gambar 8. Plugin Spam, Ham, Statistik ............................................................... 25
Gambar 9. Penyettingan Junk ............................................................................... 26
Gambar 10. Data Training ................................................................................... 27
Gambar 11. Perubahan False Positif Terhadap Pertambahan Jumlah Data Training
............................................................................................................................... 29
Gambar 12. Perubahan Nilai False Negatif terhadap Penambahan Jumlah Data
Training............................................................................................. 31
Gambar 13. Perubahan Nilai Akurasi terhadap Penambahan Jumlah Data \
Training............................................................................................. 33
Gambar 14. Perubahan Nilai Error terhadap Penambahan Jumlah Data Training
............................................................................................................................... 34
Gambar 15. Setting Email di Thunderbird............................................................ 35
Gambar 16. Pelatihan Plugin Tersimpan Dalam Database................................... 36
Gambar 17. Trust Email Address.......................................................................... 37

RINGKASAN

Sebagai pengguna email, tentunya sudah banyak pengalaman yang didapatkan


dalam bertransaksi via email tersebut. dari tahun ke tahun pengguna teknologi
email terus meningkat. Di samping sebagai pengguna dituntut juga adanya
penanganan dalam keamanan data yang cukup memakan waktu dan biaya.
Misalkan, antisipasi terhadap email yang bervirus, atau email yang berisikan
sekedar iklan atau spam semata yang membuat inbox email pengguna menjadi
melebihi kapasitas dan membuang banyak biaya maupun waktu dalam mendeteksi
virus dari email yang masuk secara manual ataupun otomatis tergantung dari
fasilitas email client yang digunakan oleh pengguna ataupun menyingkirkan email
yang tidak berguna (spam) dari inbox pengguna tersebut. Dari penelitian-
penelitian sebelumnya, email clientlah yang dilatih saja sehingga apabila
pengguna mengganti PC ataupun laptopnya, maka akan tidak efisien dan tidak
efektif lagi penggunaan email clientnya, karena otomatis pelatihan yang telah
dilakukan, hilang dengan sendirinya. Berangkat dari permasalahan tersebut, maka
6

peneliti berencana merancang suatu plug-in anti spam yang dipasang pada email
client khusus menyaring spam saja dari inbox pengguna dengan menggunakan
metode Naive Bayes Classifier. Plug-in tersebut nantinya akan digunakan oleh
pengguna yang akan bermanfaat dalam menyaring dan memisahkan email spam
dan email ham secara otomatis setelah dilakukan pelatihan. Sehingga apabila si
pengguna mengganti PC atau laptop yang bersistem operasi berbeda dari
sebelumnya, tidak akan mempengaruhi kualitas dari plug-in anti spam yang telah
diinstal selama email yang digunakan berdomain sama dengan sebelumnya.

Kata Kunci : email client, email spam, plug-in, Naive Bayes Classifier

PRAKATA
Alhamdulillahirobbil’aalamiin, peneliti panjatkan kehadirat Allah SWT atas
segala rahmat dan karunia yang telah dilimpahkan-Nya kepada peneliti sehingga
dapat menyelesaikan penelitian ini. Peneliti juga memanjatkan sholawat dan
salam kepada tauladan nabi besar kami Muhammad SAW. Selama proses
penyelesaian penelitian ini, suami tercinta, Dedi Jufri, S. Ag. yang senantiasa
mendoakan dan mendukung peneliti untuk terus berusaha tanpa kenal waktu agar
bisa dengan tepat waktu menyelesaikan tujuan penelitian ini. Terkirim do’a untuk
ayahanda tercinta Alm. Drs. H. M. Yulis Palewai, yang telah mendahului orang-
orang tercintanya dan ibunda tersayang Hj. Murni yang setiap saat mendorong
peneliti untuk tetap berkarya, memberikan bantuan, harapan dan do’a agar
semuanya berjalan lancar, serta kasih sayang mereka yang mengalir terus menerus
hingga peneliti dapat menyelesaikan penelitian ini. Kakak Yumiarni, SS beserta
suaminya dr. Edi Suharman dan adik-adik yang peneliti sayangi, drg. Nurlinda
beserta suaminya Muhammad Muchlis, ANT III, Nur Astrid, SKM beserta
suaminya Muhammad Iqbal, ST serta seluruh keluarga besar yang selalu
mendoakan keberhasilan peneliti. Banyak pihak pula telah memberikan bantuan
yang sangat berarti kepada peneliti, baik dalam bentuk materil maupun
nonmateril. Oleh karena itu, dengan segala kerendahan hati, peneliti
menyampaikan Jazakumullaahu Khair dan ucapan terima kasih yang sebesar-
besarnya kepada :
7

1. Dikti cq Kopertis Wilayah IX Sulawesi Selatan yang memberikan kesempatan


kepada peneliti untuk berkarya dalam hal pengembangan kemampuan yang
dimiliki oleh personel/praktisi akademis.
2. Bapak DR. Cucut Susanto, S. Kom., M. Si. selaku ketua P4M STMIK
Dipanegara yang senantiasa memberikan dukungan dan arahan kepada peneliti
dalam menyelesaikan penelitiannya.
3. Semua pihak yang telah ikut membantu peneliti yang pada kesempatan ini
tidak dapat disebutkan satu persatu.

Akhirnya, kehadirat Allah SWT jualah peneliti menyembah dan memohon,


semoga apa yang telah diberikan oleh bapak dan ibu sekalian menjadi amal ibadah
yang bermanfaat bagi kita semua serta mendapat balasan yang berlipat ganda dari-
Nya. Tak lupa peneliti mengharapkan kritik dan saran yang konstruktif dari
pembaca demi terciptanya penelitian yang lebih baik di masa mendatang. Semoga
penelitian ini dapat memberikan manfaat bagi kita semua. Aamiin yaa Robbal
’aalamiin.
Makassar, 2016

Peneliti

BAB I
PENDAHULUAN
A. Latar Belakang
Perkembangan teknologi sekarang berkembang secara pesat. Khususnya di
bidang internet, karena informasi dapat menciptakan dunia baru, membawa
beragam dinamika dari dunia nyata. Seiring dengan perkembangan teknologi
banyak bentuk – bentuk penyerangan terhadap sebuah situs web site, baik itu
dilakukan oleh hacker, cracker, ataupun virus. Dengan makin banyaknya virus,
kenyamanan saat berinternet-an pun ikut berkurang. Salah satu fasilitas internet
8

yang sering kita gunakan adalah email. Akhir-akhir ini email merupakan hal yang
sangat penting bagi kita, manfaatnya sering kita rasakan. Kita dapat menerima
informasi atau bertukar pesan dengan cepat dan mudah. Karena fasilitas ini
mengharuskan kita terhubung ke internet (sebagian besar penggunaan email
terhubung ke internet kecuali dalam jaringan LAN/intranet) membuat resiko
terserang virus semakin tinggi. Salah satu bentuk varian virus atau malware
tersebut adalah spam. Spam yang berarti email sampah atau email yang tidak kita
butuhkan, merupakan kata yang sering didengar. Kata spam konon berasal dari
zaman viking dan tak ada sangkut pautnya dalam email (surat elektronik) yang
biasa kita gunakan. Sebenarnya email yang dianggap spam itu tergantung dari
sudut pandang masing-masing (sudut pandang subyektif secara individu). Contoh
misalnya,Alex yang seorang perancang busana mendapatkan email yang berisi
penawaran produk mode meskipun dia tidak menginginkannya tetapi dia tidak
menganggap hal itu sebagai spam tetapi lain halnya jika yang menerimanya
adalah Yusuf seorang tenaga IT disamping dia tidak menginginkannya dia juga
akan merasa terganggu dengan penawaran tersebut karena tidak berhubungan
sama sekali dengan dunia yang ia geluti (IT). Dampak buruk yang nyata atau
langsung dapat dirasakan dari pengguna email dari spam ini adalah waktu yang
terbuang sia-sia. Saat mengecek email yang ada pada inbox umumya pengguna
email memilah mana email yang benar-benar email (penting) mana yang spam,
tentu saja pengguna akan langsung menghapus spam saat menemukannya hal ini
akan menghabiskan waktu terkadang tak jarang email yang penting pun turut ikut
terhapus, hal ini tentu saja sangat merugikan. Bagi orang-orang yang tidak dapat
leluasa koneksi ke internet, bandwidth yang dibatasi oleh quota, juga quota pada
inbox email akan sangat merugikan jika terkena dari spam ini. Spam juga dapat
memborbardir mailing list dengan membuat copy-an suatu artikel yang sama . Di
lain pihak, spam adalah sebuah masalah yang multidimensional. Sebagai masalah
teknis, spammer menyalahgunakan atau menghabiskan resource jaringan.
Komunitas milis Spam Brigade menjuluki spam sebagai “the biggest waste of
bandwidth on the Internet and Usenet”. Spam bisa memenuhi mailbox,
9

mengakibatkan mailserver sibuk, dan memperlambat layanan lainnya. Sebagai


masalah bisnis, kegiatan spammer perlu dilawan karena banyak yang
mempraktikkan penipuan. Dan terakhir, seperti ditekankan oleh narasumber P. Y.
Adi Prasaja, spam juga sebuah masalah sosial: tindakan sebagian orang yang
seenaknya menyalahgunakan sebuah fasilitas publik seperti Internet. Padahal agar
fasilitas berjalan lancar diperlukan kerjasama dan sikap saling menjaga dari
semua penggunanya. Karena fasilitas email yang murah dan kemudahan untuk
mengirimkan ke berapapun jumlah penerima, maka spam mail menjadi semakin
merajalela. Pada survey yang dilakukan oleh Cranor & La Macchia (1998),
ditemukan bahwa 10% dari mail yang diterima oleh suatu perusahaan adalah
spam-mail atau spammer.
Tidak ada satupun cara yang benar-benar dapat mengatasi spam. Dari segi teknis
untuk mengurangi spam, yaitu plugining. Telah terdapat beberapa metode
plugining yang dapat digunakan untuk mencegah spam diantaranya : Keyword
plugining, Signature –Based Plugining, Bayesian (Statistical) Plugining, Rule-
based (heuristic) plugining, atau Challenge-response plugining. Plugin anti spam
yang cukup handal untuk menghalau spam adalah Bayesian Plugining atau plugin
Bayesian yang menggunakan algoritma Naive Bayes Classifier. Algoritma ini
bekerja memanfaatkan metode statistika Bayesian untuk mengklasifikasikan
dokumen dalam kategori tertentu berdasarkan tingkat kepercayaannya. Oleh
sebab itu, tulisan ini akan membahas bagaimana cara suatu plug-in anti spam
untuk memisahkan antara email spam dan email ham dengan algoritma Naive
Bayes Classifier.
Algoritma Naive Bayes Classifier akan digunakan oleh peneliti untuk
membuat atau merancang suatu plug-in. Plug-in ini yang akan menyimpan hasil
training terhadap data email spam dan email ham pada email client Thunderbird.
Plug-in dirancang oleh peneliti dengan tujuan agar user yang telah melatih / men-
training emailnya terhadap email spam dan email ham pada PC atau laptopnya,
tidak akan kewalahan dalam mendapatkan lagi aplikasi anti spam tersebut karena
apabila user mengganti atau menginstal ulang PC atau laptopnya karena
10

disebabkan oleh suatu hal, maka otomatis plug-in tersebut juga akan dapat
langsung diinstalnya pada email client yang digunakan. Jadi otomatis plug-in
tersebut juga sama dengan backup data yang mempermudah setiap user dalam
mengamankan emailnya dari spam ataupun ham.

B. Rumusan Masalah
1. Bagaimana menganalisis hasil pengklasifikasian email ham dan email spam
dengan menggunakan plug-in pada email client ?
Pengklasifikasian dilakukan dengan menggunakan teknik memperkenalkan
account email uji coba untuk mendapatkan respon langsung dari para
spammer dan mengirimkan input beberapa email dari sumber email lain yang
sudah berstatus ham dan spam
2. Bagaimana plug-in anti spam metode Naive Bayes Classifier di sisi email
client mampu mengklasifikasikan email ham dan email spam ?
Pada sistem ini, sejumlah sampel email ham dan email spam akan dikirimkan
untuk mengenali parameter-parameter dalam men-training plug-in anti spam
metode Naive Bayes Classifier, parameter tersebut digunakan sebagai
pengenalan cerdas bagi sistem untuk menyaring email. Dalam hal ini sistem
akan mengenali email tersebut berdasarkan apa yang sudah di-training-kan
pada plug-in anti spam dan akan mengklasifikasikan langsung ke dalam
masing-masing folder yang sudah ditentukan.
3. Bagaimana plug-in anti spam mampu melakukan pengenalan email klasifikasi
dengan data email secara acak?
Plug-in anti spam dikirimkan input email spam dan email ham yang pernah
ditraining dengan email yang belum pernah ditraining secara acak. Outputnya
berupa pengenalan terhadap email ham atau email spam tersebut berdasarkan
nilai yang ditraining dari email sebelumnya.
4. Berapa tingkat akurasi dan error dari plug-in anti spam metode Naive Bayes
Classifier dalam mengenali email ham dan email spam ?
Menghitung persentasi akurasi plug-in anti spam dalam mengenali setiap
email ham dan email spam yang ditraining maupun yang tidak ditraining.
11

C. Batasan Penelitian
Menganalisa hasil klasifikasi email spam dan email ham dengan hanya
memperhatikan header dan body dari email, dan mengklasifikasikan email spam
dan email ham menggunakan metode Naive Bayes Classifier pada plug-in email
client yang tidak dapat melakukan pengecekan terhadap sebuah attachment atau
file.
BAB II
TINJAUAN PUSTAKA

A. Email Client

Email Client adalah tool atau software untuk mempermudah dalam mengatur atau
mengelola email secara offline (tidak terhubung koneksi internet). Dengan adanya
software email client, pesan email yang ada pada server email didownload
terlebih dahulu ke dalam komputer anda dan setelah semua email di download,
pesan email tersebut bisa anda kelola secara offline kapan saja tanpa harus
terhubung ke internet. Contoh software email client : Microsoft Outlook,
Thunderbird, Windows Live mail, dan lain-lain.Ada juga browser internet yang
sudah langsung terintegrasi dengan layanan email client, contoh web browser
tersebut adalah browser internet opera.

B. Email Spam
Email Spam adalah pesan email yang bersifat menyalahi aturan dan biasanya
berisi iklan ataupun yang lainnya sehingga mengakibatkan ketidak nyamanan
pengguna email. Spam email biasanya dikirim dalam jumlah yang banyak atau
secara terus-menerus sehingga akan memenuhi inbox penerima email. Selain itu
Spam email seringkali menggunakan software pengirim otomatis sehingga pesan
yang dikirimkan bisa dalam jumlah yang banyak dan terus menerus. Banyak dari
penyedia email membuat sistem untuk menangkal terhadap adanya email spam.
12

C. Plug-in
Pengertian plug-in harus disamakan dulu plug-in untuk apa dan dimana
dipakainya, karena plug-in itu bisa berarti macam macam, plug-in ada juga di
industri, di spare part dan sebagainya. Dalam dunia komputasi, plug-in yang juga
disebut plug-in, addin, add-in, addon, add-on, snap-in, snapin, mirip juga dengan
file extension, terdiri dari program computer yang berinteraksi dengan aplikasi
host ( suatu web browser atau email klien misalnya) untuk menyediakan hal
khusus, biasanya sangat spesifik fungsi yang diinginkan. Seringkali add-on
dianggap sebagai batasan umum dalam uraian plug-in, extensions dan theme
sebagai sub kategori. Suatu aplikasi didukung oleh plug-in ditujukan untuk
berbagai alasan, antara lain adalah memungkinkan buat pihak ketiga membuat
kemampuan tambahan pada aplikasi, mendukung fitur yang tidak terlihat,
menurunkan ukuran aplikasi dan memisah kode sumber karena tidak kompatibel
dengan software yang berlisensi. Contoh aplikasi termasuk dengan plug-innya
adalah Microsoft Office, Rockbox, Firmware untuk Digital Audio Players, Email
Client, Software Graphic, Media Player, Paket Sniffer, Aplikasi Sensing Remote,
Web Browser, beberapa Digital Mixing Console, Web Contain Management
Systems, menggunakan plug-in untuk meningkatkan fungsinya. Dengan kata lain,
Plug-in adalah sebuah program komputer yang menambah fungsionalitas sebuah
program utama. Program utama biasanya memberikan semacam antarmuka
(interface) agar plug-in dapat berinteraksi dengan program utama.
Email Client, untuk mengakses layanan email diperlukan aplikasi di sisi klien
sehingga pengguna dapat mendownload email. Aplikasi ini menghubungi email
server dengan mengirimkan informasi account user dan password. Apabila server
menerima account dan password tersebut maka email untuk suatu account akan
didownload ke klien, biasanya menggunakan protokol POP3. Apabila seorang
user mengirimkan email maka email server akan mendownload email tersebut
menggunakan protokol SMTP.
D. Naïve Bayes Classifier
Metode Bayesian Plugining merupakan metode anti spam plugin yang handal.
Metode ini mengenali spam berdasarkan kata-kata (token) yang terkandung pada
13

sebuah email. Metode plugin ini pertama kali perlu di-“training” menggunakan
dua koleksi email, satu koleksi merupakan spam-mail, dan koleksi yang lain
merupakan legitimate mail. Dengan cara seperti ini, pada setiap email baru yang
diterima, Bayesian Plugin dapat memperkirakan probabilitas spam berdasarkan
kata-kata yang sering muncul di koleksi spam-mail atau di koleksi legitimate mail.
Bayesian Plugin efektif untuk mem-blok spam karena plugin ini dapat secara
otomatis mengkategorikan spam-mail atau legitimate mail.
Naive Bayes Classifier, merupakan klasifikasi yang bersifat statistik, yang dapat
memprediksi peluang-peluang keanggotaan kelas, seperti peluang bahwa suatu
sampel yang diberikan termasuk kelas tertentu. Klasifikasi Naive Bayes Classifier
didasarkan pada teorema Bayes [Han. 2011].
Teorema Bayes, algoritma Naive Bayes Classifier dinamai sesuai nama
Thomas Bayes (1702-1761) yang pertama kali mengajukan persoalan statistik
yang kini dikenal sebagai teorema Bayes. Istilah Naive Bayes Classifier sendiri
baru muncul sekitar tahun 1950-an. Sebelumnya, teorema Bayes banyak dipakai
dalam berbagai bidang, mulai dari perhitungan matematis orbit benda langit,
statistika medis, hingga bidang hukum [Rachli. 2007].
Misalkan X merupakan sampel data yang tidak diketahui label kelasnya
dan Y melambangkan variabel kelas, untuk masalah klasifikasi akan dihitung
P Y X  , yaitu peluang kelas Y jika diberikan sampel data X . Peluang bersyarat

ini juga dikenal dengan peluang posterior untuk Y dengan syarat X . Peluang
posterior P Y X  didasarkan pada informasi sebelumnya yaitu peluang prior PY 

yang bebas terhadap X . Teorema Bayes digunakan untuk menghitung peluang


posterior P Y X  , dari PY  , P X  dan P  X Y  .

PX Y . PY 
PY X   (1)
P X 
Plugin Naive Bayes Classifier, bekerja dengan algoritma Naive Bayes
Classifier yang mendeteksi spam dengan cara menghitung probabilitas dari suatu
email berdasarkan isinya. Probabilitas ini dapat dihitung dengan terlebih dahulu
membuat suatu database email spam dan database email ham. Database tersebut
14

berisi kata-kata yang telah diekstraksi yang terdapat dalam email-email sampel.
Kemudian dengan suatu metode training, plugin anti-spam yang menggunakan
algoritma Naive Bayes Classifier dapat dilatih untuk melihat kata-kata yang sering
digunakan pada email spam, sehingga pada akhirnya dihasilkan plugin anti-spam
yang akurat dengan sekecil mungkin kesalahan [Han. 2011].
Teorema Bayes dalam konteks spam, menyatakan bahwa peluang sebuah
email adalah spam, ditunjukkan oleh keberadaan beberapa kata (selanjutnya
disebut atribut) tertentu didalamnya, adalah sama dengan peluang untuk
menemukan atribut yang sama dalam sebuah email spam, dikalikan dengan
peluang bahwa sebuah email adalah spam, dibagi dengan peluang untuk
menemukan atribut yang sama dalam sembarang email [Rachli. 2007].
Pr kata spam . Pr spam 
Pr spam kata   ( 2)
Pr kata 

Plugin Naive Bayes Classifier merupakan penggolong Naive Bayes


Classifier yang sederhana dengan cara kerja sebagai berikut :

1. Setiap email diwakili oleh suatu vektor x   x1 , x2 ,..., xn , dimana

x1 , x2 ,..., xn merupakan nilai dari atribut X 1 , X 2 ,...X n .


2. Menghitung peluang posterior untuk kelas email spam dan email ham dengan

syarat X . Dari teorema Bayes dan teorema peluang total, diberikan vektor

x   x1 , x2 ,..., xn  pada suatu email, peluang bahwa email tersebut merupakan
milik kelas c yaitu :
 
 
P C  c . P X  x C  c
  
PC cX  x    
  (3)
 P C  k . P X  x C  k
k  spam , ham 

3. Peluang total adalah konstan untuk setiap kelas sehingga hanya perlu dihitung
 
 
P C  c . P X  x C  c . Peluang prior P C  c  dapat dihitung dengan

sc
P C  c   , di mana s c merupakan jumlah email kelas c dalam sampel
s
training dan s merupakan jumlah seluruh email dalam sampel training.
15

4. Jika diberikan banyak atribut, maka akan sangat sulit untuk menghitung
  Untuk mengurangi perhitungan dalam mengevaluasi
 
P X  xC c .

P X  x C  c  , dibuat asumsi bahwa tidak ada ketergantungan antara atribut


 

yang satu dengan atribut yang lain atau yang biasa disebut kebebasan
bersyarat (conditional independence). Asumsi ini dibuat untuk
menyederhanakan perhitungan dan inilah sebabnya disebut ”naive” [Han.
2011].
Kebebasan Bersyarat, misal X , Y , dan Z melambangkan tiga variabel acak.
Variabel X dikatakan bebas secara bersyarat Y , yang diberikan Z , jika
sesuai kondisi berikut :
PX Y , Z   PX Z  (4)

P X , Y , Z 
P X , Y Z  
P Z 
P  X , Y , Z  P Y , Z 
 .
P Y , Z  P Z 

 P  X Y , Z . P Y Z 

 P  X Z . P Y Z  (5 )

Kebebasan bersyarat antara X dan Y juga dapat ditulis dalam bentuk berikut :
Persamaan (4) digunakan untuk memperoleh baris terakhir persamaan di atas.




P X C  c   PX i C  c 
k
( 6)
i 1

Peluang P X i C  c  dapat dihitung dari data training yaitu P X i C  c  


sic
, di
sc

mana sic adalah jumlah email dalam kelas c dalam sampel training yang
mengandung atribut ke-i.

5. Email X termasuk kelas email spam jika dan hanya jika
16

   
   
P C  spam . P X  x C  spam  P C  ham . P X  x C  ham

Dengan kata lain, email X merupakan kelas dengan peluang posterior

  

P C  c X  x maksimum.

Keakuratan dan Tingkat Kesalahan, probabilitas tiap kata adalah unik


untuk setiap user, dan dapat berubah sewaktu-waktu dengan adanya koreksi
apabila plugin keliru melakukan klasifikasi terhadap sebuah email. Hasilnya,
akurasi plugin anti-spam akan terus meningkat dari waktu ke waktu. Kemampuan
ini sangat membantu untuk menghindari terjadinya false positives, ketika plugin
keliru mengidentifikasi email ham sebagai spam [Rachli. 2007]. False positives
adalah email ham yang ditujukan kepada penerima, tetapi karena kesalahan dari
plugin anti-spam, dikategorikan menjadi email spam. Kesalahan dalam
menghambat email-email ham H  S  pada umumnya lebih berat dibandingkan

dengan membiarkan email-email spam melewati plugin begitu saja S  H 


[Androutsopoulus. 2004]. Misalkan bahwa menghambat satu email ham sama
buruknya dengan membiarkan email spam sebanyak  melewati plugin
H  S    S  H  , plugin dapat ditraining untuk mengkategorikan email
sebagai spam jika :
 
P C  spam X  x


 
 
P C  ham X  x  (7 )

Karena dianggap lebih beresiko maka dipilih nilai  tertentu untuk memperkecil
kemungkinan terjadinya false positive.

Dalam pengklasifikasian, dua ukuran yang biasa digunakan adalah


keakuratan (accuracy) dan tingkat kesalahan (error rate).
n H  H  nS S n H S  nS  H
Acc  Err 
NH  NS NH  NS

Err  1  Acc (8)

Keterangan :
17

Acc : tingkat keakuratan


Err : tingkat kesalahan
nH S : jumlah email ham yang dihalangi plugin

nSH : jumlah email spam yang melewati plugin

n H H : jumlah email ham yang melewati plugin

nS S : jumlah email spam yang dihalangi plugin

NH : jumlah seluruh email ham yang diklasifikasikan

NS : jumlah seluruh email spam yang diklasifikasikan

BAB III
METODE PENELITIAN

A. Tujuan Penelitian
Plug-in tersebut akan bermanfaat dan membantu pihak user dalam
mengelola email mereka dari serangan para spammer dan tidak akan mengulangi
pelatihan/training lagi bila user mengganti perangkat keras yang digunakan
sebelumnya, karena plug-in tersebut akan merekam pelatihan / training yang telah
dilakukan sehingga user tidak akan menunggu setahun lebih dalam mengulangi
penggunaan anti spam pada email client tersebut.
1. Untuk menganalisis hasil pengklasifikasian email ham dan email spam dengan
menggunakan metode Naive Bayes Classifier
2. Untuk mengklasifikasikan email ham dan email spam pada anti spam pada
plug-in anti spam metode Naive Bayes Classifier pada email client.
3. Untuk mengetahui tingkat akurasi plug-in anti spam dalam mengenali email
ham dan email spam.
4. Untuk membuat plug-in terhadap email spam dan email ham berdasarkan data
email yang ditraining ke dalam database secara otomatis dengan menerapkan
metode Naive Bayes Classifier
18

B. Manfaat Penelitian

Manfaat dari penyusunan penelitian ini yaitu :

1. Bagi penulis sendiri, dapat membantu pemahaman dan melatih diri dalam
menganalisa masalah, merancang dan memahami perancangan sistem plug in
berdasarkan metode naive bayes classifier.
2. Bagi pembaca, dapat digunakan sebagai alat bantu dalam bertransaksi email
dan menambah ilmu pengetahuan khususnya kepada dunia Informatika bahwa
email client sebagai email yang dapat diakses secara offline, lebih banyak
keunggulannya dibanding menggunakan koneksi internet dalam mengaktifkan
inbox email user, yang akan mengeluarkan biaya dalam memeriksa dan
membacanya setiap hari, begitu pun dengan pemisahan email spam dan email
ham, tentu memakan waktu yang tidak sedikit dalam memilah dan menghapus
satu per satu email yang ada dalam inbox user.

BAB IV
METODE PENELITIAN

A. Jenis Penelitian
1. Studi Literatur (Literature Study). Sumber data yang didapatkan dengan
mengkaji literatur-literatur, buku-buku pustaka yang berkaitan dengan
masalah yang dibahas dan juga melalui artikel-artikel dari internet yang
relevan dengan permasalahan yang dibahas dalam penelitian ini.
2. Metode Pengambilan Data, yaitu Penelitian Lapangan (Field Research). Yaitu
dengan cara mengadakan pengamatan langsung terhadap obyek yang diteliti.
Untuk mendapatkan data di lapangan maka digunakan teknik observasi tanpa
wawancara langsung.

B. Teknik Pengumpulan Data


Sumber data dalam penelitian ini adalah keseluruhan email spam dan
email ham yang masuk dalam inbox account try@yahoo.com.
19

C. Alat Dan Bahan Penelitian


Alat Penelitian
1. Software, terdiri dari Windows 7, Thunderbird 2.0, Java
2. Hardware, terdiri dari Notebook Asus Intel @tom

Bahan Penelitian
Yang menjadi parameter atau sebagai bahan penelitian adalah sebagai berikut :
1. Parameter input yaitu email spam dan email ham
2. Parameter output yaitu false positive dan false negative atau akurasi dan error.

D. Metode Pengujian
Metode pengujian yang digunakan adalah metode Naïve Bayes Classifier. Dalam
pengklasifikasian, dua ukuran yang biasa digunakan adalah keakuratan (accuracy)
dan tingkat kesalahan (error rate).
E. Tahap-Tahap Penelitian
Terdapat beberapa tahapan yang dilaksanakan dalam penelitian ini sebagai
berikut :
1. Persiapan sebuah email baru dengan domain yahoo.com
2. Pengumpulan dan mempersiapkan data-data berupa : email spam dan email
ham dengan melakukan subscribe pada milis account yahoogroups
3. Persiapan data penyelidikan lapangan dengan menerapkan observasi untuk
mengetahui email ham, email spam, false positive dan false negative sehingga
didapatkan akurasi dan errornya.
4. Plug-in pada email client untuk training dan testing dengan menggunakan
algoritma Naive Bayes Classifier yang diharapkan hasil kegiatan akhir ini
email client / user tidak dipenuhi oleh banyaknya email spam dan dapat
menerima semua email ham sesuai yang diharapkan.
20

BAB V
HASIL DAN PEMBAHASAN

A. Setting Thunderbird Mail Client

Keuntungan menggunakan Thunderbird antara lain adalah kemudahan mengelola


beberapa account email sekaligus, keamanan yang lebih bagus, file inbox bisa
dipindah-pindah antar komputer, mudah dalam penggunaan, update otomatis dan
spam filter yang cukup bagus. Setelah Thunderbird diinstal di komputer, begitu
dibuka akan langsung muncul dialog seting email. Berikut ini langkah-langkah
seting Thunderbird untuk membaca dan mengirimkan email.

1. Ketika membuka Thunderbird untuk pertama kali, akan langsung muncul


tampilan seperti gambar 1.
2. Karena kita akan menyeting Thunderbird untuk membaca dan mengirim
email, maka pilih Email Accounts lalu klik Next.
3. Akan muncul kotak dialog baru yang meminta kita memasukkan nama dan
email.
Karena kita akan menyeting Thunderbird untuk membaca dan mengirim
email, maka pilih Email Accounts lalu klik Next.
4. Akan muncul kotak dialog baru yang meminta kita memasukkan nama dan
email.
21

Gambar 1. Tahap Pemilihan Account

Gambar 2. Identifikasi Email Address

5. Nama ini nanti akan tampil sebagai nama pengirim email yang dikirimkan.
Jika sudah mengisi nama dan alamat email, klik Next.
6. Selanjutnya akan muncul tampilan seting incoming (POP/IMAP) dan outgoing
server (SMTP). Pilih POP dan masukkan nama domain sebagai incoming
maupun outgoing server.
22

Gambar 3. Informasi Server

7. Pastikan nama domain yang diisikan sudah betul, penulisan tidak disertai
dengan http:// maupun www, jadi hanya nama domain saja, misalnya
tokopesawat.com (sesuai nama domain Anda). Klik Next.
8. Langkah berikutnya adalah mengisi alamat email dengan lengkap, termasuk
nama domain.
9. Pada Account Name, bebas mengisikan nama untuk account ini. Penamaan
ini sangat bermanfaat ketika kita menggunakan beberapa email sekaligus di
Thunderbird. Misalnya email untuk pekerjaan, email untuk Facebook, email
untuk mailing list dan lain-lain.
10. Setelah memberi nama pada account ini, klik Next.
11. Proses seting Thunderbird telah selesai. Akan muncul detail seting yang telah
dimasukkan.
23

Gambar 4. Nama Pengguna

Gambar 5. Nama Account

Gambar 6. Setting Thunderbird SUkses


24

12. Jika belum yakin dengan seting yang ada, maka bisa mengeditnya dengan
mengeklik tombol Back agar kembali ke halaman pengaturan-pengaturan
sebelumnya. Pilihan Download message now boleh tidak dipilih jika belum
ingin membaca email. Jika sudah yakin dengan setingnya, klik Finish.
13. Jika pilihan Download message now dipilih (dicontreng) maka Thunderbird
akan langsung mendownload email dari server, dan muncul dialog yang
meminta password email.

Gambar 7. Password Sesuai Accountnya

14. Jika ingin Thunderbird mengingat password sehingga tidak muncul dialog
permintaan password, cukup klik pada pilihan Use Password Manager to
remember this password. Tetapi jika lebih suka untuk mengetik password
setiap memeriksa email, jangan contreng pilihan tersebut.

B. Penyettingan dan Instalasi Plugin

Pengaturan terhadap Plugin dilakukan setelah try and error implementasi dari
perancangan dan programming plugin tersebut, dengan alur tasking sebagai
berikut :
1. Jalankan Thunderbird versi 1.x atau 2.x
2. Setelah terbuka (asumsi Thunderbird telah di setting sebagai mail-client) klik
menu Tools -> Add-ons. Pilih tab Extensions kemudian klik Install…
Tunjukkan letak file spamku-0.01.1_tes1.xpi. Restart Thunderbird.
3. Setelah Thunderbird di-restart, lagkah selanjutnya adalah setting toolbar untuk
Spamku dengan memilih menu View -> Toolbars -> Customizes…
25

4. Temukan toolbar Spam, Not Spam dan Stastictic (ada diagram batangnya),
pilih satu persatu kemudian drag & drop di tempat yang kosong pada lokasi
toolbar di Thunderbird (biasanya tempat kosong). Akan tampak seperti ini :

Gambar 8. Plugin Spam, Not Spam dan Statistic Pada Toolbar

5. Kemudian pilih menu Tools -> Spamku -> Configure Extension, klik tab Java,
tentukan lokasi Java dengan klik Browse, contohnya di C:\Program
Files\Java\jdk1.6.0_16\bin\javaw.exe. Klik OK.
6. Jika tidak ada alert-alert yang muncul berarti instalasi Spamku telah selesai
dan siap digunakan.

C. Pengimplementasian Plugin

Sebelum menggunakan Plugin yang telah diinstalasi, peneliti akan melakukan


pelatihan/training dengan alur tasking berikut :
1. Pada awalnya diperlukan training minimal menggunakan 100 email spam dan
100 email ham, semakin banyak training akan semakin bagus penentuan
status spam atau ham sebuah email. Cara menandainya adalah dengan
memilih pesan kemudian klik toolbar Spam atau Not Spam sesuai dengan
statusnya.
2. Supaya email yang ditandai spam tadi berpindah tempat ke folder lain, bukan
di inbox maka perlu di-setting di Tools -> Account Settings, pilih Junk
Settings, kemudian pilih :
26

Gambar 9. Penyettingan Junk

3. Untuk penggunaan Spamku bisa dikombinasikan dengan


SpamAssassin/SpamPal yang built-in pada Thunderbird dengan mencontreng
pilihan “Trust junk mail header set by:” dan divariasikan dengan pilihan “Do
not mark mail as junk if the sender is in:”.
4. Untuk mengkonfigurasi Spamku/Bayesian melalui web browser silakan pilih
menu Tools -> Spamku, pilih Configure Spamku on http://localhost:8574 pilih
pada side-menu Filters untuk melihat preview hasil trainingnya dan pilih
Bayesianato untuk melihat detil hasil training Bayesian Spam Filter.
5. Klik Options untuk mengatur setting filter Bayesian, butuh berapa email spam
dan ham untuk training, berapa token yang diambil dan panjang tiap token,
divariasikan sendiri dan tekan tombol Save. Butuh sekitar 5-10 menit untuk
refresh ke Thunderbird-nya.

D. Pengumpulan Data Training Email Ham dan Email Spam

Sampai saat Gambar 10 diambil telah terkumpul email spam dan email ham

sebanyak 1332 email


27

Gambar 10. Data Training Sebelum Dilatih

E. Pengujian Data Menggunakan Plugin

Analisis hasil pengujian terhadap plugin anti-spam Bayesian dilakukan

pada sebuah account email pribadi linanoer888@yahoo.com dengan

menggunakan aplikasi pengelola email Thunderbird. Pengujian akan dilakukan

secara bertahap setelah diadakan pelatihan (training) beberapa kali sesuai dengan

data yang telah terkumpul dengan menggunakan Metode Bayesian.

Dalam pengklasifikasian, dua ukuran yang biasa digunakan adalah keakuratan

(accuracy) dan tingkat kesalahan (error rate).

Pengujian terhadap plugin anti-spam Bayesian dilakukan pada sebuah account

email pribadi linanoer888@yahoo.com dengan menggunakan aplikasi pengelola

email Thunderbird. Pengujian dilakukan sebanyak sebelas (11) kali dengan

jumlah data Training untuk pengujian pertama hingga pengujian ke sebelas (11)

berturut-turut sebanyak 70, 110, 150, 190, 230, 270, 310, 350, 390, 455 dan 490
28

email, sedangkan jumlah data uji untuk pengujian pertama hinggá pengujian ke

delapan adalah sama yaitu sebanyak 70 email, pengujian ke sembilan hingga ke

sepuluh adalah sebanyak 102 email dan pengujian ke sebelas sebanyak 118 email.

Hasil pengujian selengkapnya dapat dilihat pada Tabel 1.

Tabel 1. Hasil Pengujian dengan Plugn

False
Data False Nilai
Uji Data Positif Nilai
Training Jumlah Negatif False Akur
Uji (Ham False Error
Data (Spam Nega asi
ke- sp diang Positif (%)
spa Training ha terlewat tif (%)
ham a gap (%)
m m Plugin) (%)
m Spam)
1 40 30 70 35 25 6 10.0 6 10.0 80.0 20.0
2 65 45 110 35 25 5 8.3 4 6.7 85.0 15.0
3 90 60 150 35 25 4 6.7 4 6.7 86.7 13.3
4 115 75 190 35 25 4 6.7 3 5.0 88.3 11.7
5 140 90 230 35 25 3 5.0 3 5.0 90.0 10.0
6 165 105 270 35 25 3 5.0 3 5.0 90.0 10.0
7 190 120 310 35 25 2 3.3 3 5.0 91.7 8.3
8 215 135 350 35 25 2 3.3 2 3.3 93.3 6.7
9 240 150 390 59 43 1 1.0 2 2.0 97.1 2.9
10 270 185 455 59 43 1 1.0 2 2.0 97.1 2.9
11 285 205 490 63 55 0 0.0 1 0.8% 99.2 0.8

Analisis Hasil Pengujian

1. False Positive

False positive terjadi apabila email ham terhalangi oleh plugin anti-spam atau

dengan kata lain dianggap sebagai spam.

- Pada pengujian I terdapat 6 email ham yang diklasifikasikan sebagai email

spam. Nilai false positivenya adalah 10 %

- Pada pengujian II terdapat 5 email ham yang diklasifikasikan sebagai

email spam. Nilai false positivenya adalah 8,3 %


29

- Pada pengujian III dan IV terdapat 4 email ham yang diklasifikasikan

sebagai email spam. Nilai false positivenya adalah 6,7 %

- Pada pengujian V dan VI terdapat 3 email ham yang diklasifikasikan

sebagai email spam. Nilai false positivenya adalah 5 %.

- Pada pengujian VII dan VIII terdapat 2 email ham yang diklasifikasikan

sebagai email spam. Nilai false positivenya adalah 3,3 %.

- Pada pengujian IX dan X terdapat 1 email ham yang diklasifikasikan

sebagai email spam. Nilai false positivenya adalah 1 %.

- Pada pengujian XI tidak terdapat lagi email ham yang diklasifikasi

sebagai email spam.

Gambar 11. Perubahan False Positif Terhadap Pertambahan Jumlah Data


Training
30

Pada Gambar 11 terlihat bahwa kesalahan plugin dalam menghalangi email ham

semakin berkurang dengan bertambahnya jumlah email dalam proses training.

Hasil pengujian memperlihatkan bahwa pada proses training dengan 70 sample

terdapat 6 email ham yang diklasifikasi sebagai email spam dan jumlah ini

menurun hingga menjadi 0 pada proses training dengan 490 sample.

2. False Negative

False negative terjadi apabila email spam yang melewati plugin anti-spam.

- Pada pengujian I terdapat 6 email spam yang melewati plugin. Nilai false

negativenya adalah 10%

- Pada pengujian II dan III terdapat 4 email spam yang melewati plugin.

Nilai false negativenya adalah 6,7 %

- Pada pengujian IV, V, VI dan VII terdapat 3 email spam yang melewati

plugin. Nilai false negativenya adalah 5 %

- Pada pengujian IV, V, VI dan VII terdapat 3 email spam yang melewati

plugin. Nilai false negativenya adalah 5 %

- Pada pengujian VIII, IX dan X terdapat 2 email spam yang melewati

plugin. Nilai false negativenya adalah 2,5 %

- Pada pengujian XI terdapat 1 email spam yang melewati plugin. Nilai false

negativenya adalah 0,8 %


31

Gambar 12. Perubahan Nilai False Negatif terhadap Penambahan Jumlah


Data Training

Pada Gambar 12 terlihat bahwa dengan bertambahnya jumlah email dalam proses

training maka kesalahan plugin sehingga email spam melewatinya akan semakin

berkurang. Hasil pengujian memperlihatkan bahwa pada proses training dengan

70 sample terdapat 6 email spam yang melewati plugin dan jumlah ini menurun

menjadi 1 pada proses training dengan 490 sample.

3. Akurasi

Nilai akurasi dapat diperoleh dari jumlah email ham yang melewati plugin dan

jumlah email spam yang terhalangi oleh plugin.

- Pada pengujian I terdapat 35 email ham yang melewati plugin dan 25 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 80 %


32

- Pada pengujian II terdapat 35 email ham yang melewati plugin dan 25 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 85 %

- Pada pengujian III terdapat 35 email ham yang melewati plugin dan 25 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 86,7 %

- Pada pengujian IV terdapat 35 email ham yang melewati plugin dan 25 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 88,3 %

- Pada pengujian V dan VI terdapat 35 email ham yang melewati plugin dan 25

email spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 90 %

- Pada pengujian VII terdapat 35 email ham yang melewati plugin dan 25 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 91,7 %

- Pada pengujian VIII terdapat 35 email ham yang melewati plugin dan 25

email spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 93,3

- Pada pengujian VIII, IX dan X terdapat 59 email ham yang melewati plugin

dan 43 email spam yang tersaring oleh plugin, sehingga nilai akurasinya

adalah 97,1 %

- Pada pengujian VIII, IX dan X terdapat 59 email ham yang melewati plugin

dan 43 email spam yang tersaring oleh plugin, sehingga nilai akurasinya

adalah 97,1 %

- Pada pengujian XI terdapat 63 email ham yang melewati plugin dan 55 email

spam yang tersaring oleh plugin, sehingga nilai akurasinya adalah 99,2 %
33

Pada Gambar 13 terlihat bahwa kinerja dari plugin anti spam akan semakin

akurat dengan bertambahnya jumlah email dalam proses trainingi. Hasil

pengujian memperlihatkan bahwa pada proses training dengan 70 sample

memberikan nilai akurasi sebesar 75 % dan nilai ini bertambah menjadi

98,8 % pada proses training dengan 490 sample.

Gambar 13. Perubahan Nilai Akurasi terhadap Penambahan Jumlah Data


\Training

4. Tingkat Kesalahan (Error)

Dengan bertambahnya nilai akurasi dari plugin, maka tingkat kesalahan atau

nilai Error akan semakin berkurang. Error merupakan jumlah dari nilai false

positive dan nilai false negative. Error pada pengujian pertama hingga

pengujian ke delapan berturut-turut adalah 20 %, 15 %, 13,3 %, 11,7 %, 10 %,


34

10 %, 8,3 %, 6,7 %, 2,9%, 2,9% dan 0,8%.

Pada Gambar 14 terlihat bahwa kesalahan (Error) dari plugin anti spam akan

semakin berkurang dengan bertambahnya jumlah email dalam proses training.

Hasil pengujian memperlihatkan bahwa pada proses training dengan 70

sample memberikan nilai Error sebesar 20 % dan nilai ini menurun menjadi

0,8 % pada proses training dengan 490 sample. Jika training sample terus

ditambah, kemungkinan nilai Error akan semakin mengecil hingga mendekati

angka 0.

Gambar 14. Perubahan Nilai Error terhadap Penambahan Jumlah Data


Training

Secara keseluruhan, analisis terhadap hasil pengujian menunjukan bahwa semakin


banyak jumlah email pada proses training maka plugin akan semakin akurat dan
Error akan semakin mengecil, baik false positive maupun false negative. Karena
35

semakin banyak jumlah email yang ditraining berarti semakin banyak pula daftar
kata dalam database, maka dengan kata lain daftar kata merupakan faktor yang
sangat mempengaruhi akurasi dan kesalahan plugin. Kesalahan plugin sehingga
email spam melewatinya terjadi akibat plugin belum mengenal kata-kata dalam
email spam tersebut. Kata-kata tersebut kemungkinan tidak terdapat dalam
database spam atau memiliki peluang yang lebih kecil dalam proses training,
sehingga perlu ditambah training sample agar peluang kata-kata tersebut menjadi
lebih besar.

F. Percobaan Plugin Pada Laptop Berbeda

Setelah perhitungan hasil uji data training, plugin anti spam akan dicoba

pemanfaatannya pada laptop yang berbeda. Email yang menjadi object penelitian

sebaiknya disetting menjadi POP Mail Server seperti Gambar 15.


36

Gambar 15. Setting \Email di Thunderbird

Gambar 16. Pelatihan Plugin Tersimpan Dalam Database

Setiap email ham dan email spam yang dilatih, akan nampak seperti pada Gambar

15. Hasil pelatihan email akan tersimpan dalam database sebagai token yang

dikenali oleh Filters Bayesianito dengan menekan tombol Save. Email yang

menjadi Kontak akan otomatis dikenali sebagai Trust Email Addreess seperti pada

Gambar 16,
37

Gambar 17. Trust Email Address

Pelatihan akan disimpan bila peneliti tidak lupa menekan selalu tombol Save bila

selesai dalam aktifitas training email spam dan email ham. File pelatihan tersebut

akan digunakan pada laptop berbeda tetapi dengan email user yang sama.

BAB VI
RENCANA TAHAPAN BERIKUTNYA

Rencana tahapan berikutnya adalah mengikuti Seminar Nasional Komunikasi dan


Informatika (SNKI) pada tanggal 30 Nopember sampai dengan tanggal 01
Desember 2016. Format makalah sudah dikirim tetapi belum ada informasi dari
pihak reviewer ataupun informasi bahwa paper kami telah diterima atau belum.
Untuk itu kami juga berencana memasukkan paper kami dengan biaya sendiri
pada The 2nd International Conference on Education, Science, and Technology
38

Makassar, Indonesia, tanggal 11 - 12 Maret 2017. Demikian rencana yang akan


kami laksanakan dengan memohon ridho dari Allah SWT, semoga dimudahkan
dan dilancarkan. Aamiin yaa Rabbal `aalamiin.

BAB VII
KESIMPULAN DAN SARAN
A. Kesimpulan
Dari hasil pengujian dengan metode Naïve Bayes Classifier dapat ditarik
kesimpulan bahwa penggunaan plug-in anti spam pada mail client
Thunderbird tersebut, lebih efektif, hemat dan efisien dalam mengatur sendiri
email-emailnya yang akan di blacklist maupun yang whitelist tanpa biaya
online berlama-lama lagi. Selain itu, apabila notebook/laptop/personal
computer(PC) dari user yang telah menggunakan plug-in tersebut mengalami
trouble dan harus menginstal ulang sistem operasinya, maka user hanya
menambahkan penginstalan Bahasa Java dan mail client Thunderbirdnya saja
tanpa harus melatih dan menguji lagi emailnya dari email spam dan email
ham.
B. Saran

Dari hasil penelitian, tidak akan ada kata berhenti sampai disitu saja,
sebenarnya masih banyak yang bisa dikembangkan yakni peneliti dapat
membandingkan hasil pengujian dari plug-in metode Naïve Bayes Classifier
tersebut dengan hasil pengujian anti spam yang sudah terintegrasi default pada
mail client Thunderbird tersebut dengan metode yang sama.
39

DAFTAR PUSTAKA

Graham, Paul. 2002. A Plan for Spam. http://www.paulgraham.com/spam.html.


Diakses tanggal 20 Agustus 2011 pukul 3.56 PM
Han, Jiawei and M. Kamber. 2011. "Data Mining: Concepts and Techniques".
USA: Academic Press.

Ian Androutsopoulos, John Koutsias, V. Chandrinos, George Paliouras, and C.


Spyropoulos. 2004. An evaluation of naive Naive Bayes Classifier anti-
spam plugining. In Workshop on Machine Learning in the New
Information Age.
Lambert, Anselm, Analysis of Spam, A dissertation in Computer Science at
University of Dublin, 2003. (Defiyanti, Sofi., D. L. Crispina Pardede.
“Perbandingan Kinerja Algoritma ID3 dan C4.5 Dalam Klasifikasi Spam
Mail”. Universitas Gunadarma). Diakses tanggal 26 Januari 2012 pukul
8.05 PM
O’Brien, . Cormac & Vogel, Carl “Comparing SpamAssassin with CBDF
email plugining”
Rachli, Muhamad, 2007. Email Plugining menggunakan Naïve Naive Bayes
Classifier. Bandung : Tugas Akhir Jurusan Teknik Elektro Institut
Teknologi Bandung
Schwartz, Alan. 2004. eBook “SpamAssassin” [Online]United States of America :
O'Reilly Media, Inc.Diakses tanggal 19 juli 2011 pukul 9:36 AM
http://kompas.health-tips-diseases.com/2009/06/definisi-
plugin.htmlhttp://kompas.health-tips-diseases.com/2009/06/definisi-
plugin.html Diakses tanggal 29 Maret 2015 pukul 12:30 AM

http://tutorialisme.students.uii.ac.id/cara-setting-popimap-dan-smtp-gmail-pada-
thunderbird-30/ Diakses tanggal 29 Maret 2015 pukul 12:30 AM

www.ilmukomputer.com Diakses tanggal 29 Maret 2015 pukul 12:30 AM


http://www.rumahweb.com/tutorial/panduan-setting-thunderbird-mail-client.html

39
40

LAMPIRAN 1
JUSTIFIKASI ANGGARAN PENELITIAN

1. Honor

Waktu
Honor/Jam Honor per
Honor (jam/minggu) Minggu
(Rp) Tahun (Rp)
4
Ketua 6,250 6 48 1,800,000
Anggota 5,000 5 48 1,200,000
SUB TOTAL (Rp) 3,000,000

2. Peralatan Penunjang

Harga
Harga Peralatan
Justifikasi
Material Kuantitas Satuan Penunjang
Pemakaian
(Rp) per Tahun
(Rp)
Menangkap Signal
Modem 1 300,000,- 300,000
Provider
Pulsa Kartu Mengakses
12 bulan 150.000,- 1,800,000
Modem Internet
SUB TOTAL (Rp) 2,100,000

3. Bahan Habis Pakai

Harga Biaya per


Justifikasi
Material Kuantitas Satuan Tahun
Pemakaian
(Rp) (Rp)
Catridge printer
Mencetak proposal,
Canon MP 258 1 150,000 150,000
laporan,angket, dll
(Hitam)
Catridge printer
Mencetak proposal,
Canon MP 258 1 161,000 161,000
laporan,dll
(Warna)

40
41

Bahan pencetak
Kertas A4 80 gr 4 40,000 160,000
proposal, laporan,dll
Harga Biaya per
Justifikasi
Material Kuantitas Satuan Tahun
Pemakaian
(Rp) (Rp)
Jepitan kertas Menjepit kertas 12 2,000 24,000
Bahan cetak
Tinta Printer 4
proposal, laporan, 8 25,000 200,000
warna 100 ml
dll
SUB TOTAL (Rp) 684,000

4. Perjalanan

Harga Biaya per


Justifikasi
Material Kuantitas Satuan Tahun
Pemakaian
(Rp) (Rp)
Perjalanan dari Untuk membayar
rumah (kampus) pasca bayar kartu 12 10,000 120,000
ke toko modem
Perjalanan dari
Mencari referensi
rumah ke
sesuai kasus yang 12 32,000 384,000
perpustakaan/to
terkait
ko buku
SUB TOTAL (Rp) 504,000

5. Biaya Perancangan dan Pembuatan

Harga Biaya per


Justifikasi
Material Kuantitas Satuan Tahun
Pemakaian
(Rp) (Rp)
Biaya perancangan Untuk merancang
1 1,800,000 1,800,000
perangkat keras perangkat keras
Biaya perancangan Untuk merancang
2 2,000,000 4,000,000
perangkat lunak perangkat lunak
SUB TOTAL (Rp) 5,800,000

6. Administrasi

Nama Kegiatan Satuan Jumlah (Rp)


Penyusunan Proposal 4 exp @ Rp 25.250 101,000

41
42

Penyusunan Laporan
5 exp @ Rp 50,000 250,000
Akhir
SUB TOTAL (Rp) 351,000

7. Publikasi Ilmiah dan Seminar

Nama Kegiatan Satuan Jumlah (Rp)


Seminar penelitian Satu kali 50 peserta @
2,500,000
Rp. 50.000
SUB TOTAL (Rp) 2.500,000

TOTAL ANGGARAN YANG DIPERLUKAN


15,000,000
SELAMA 1 TAHUN (Rp)

42
43

LAMPIRAN 2
SUSUNAN ORGANISASI TIM PENELITI
DAN PEMBAGIAN TUGAS

Alokasi
Bidang Waktu
NO Nama NIDN Uraian Tugas
Ilmu (jam/
minggu)
1. Nurlina, S. 0929027601 Sistem 6 Jam/ Ketua Bertugas:
Kom., M.T Informasi Minggu 1. Sebagai koordinator selama
pelaksanaan penelitian
berlangsung.
2. Menganalisis penanganan
email.
3. Merancang konsep sistem.
4. Merancang dan membuat
perangkat keras sistem.
5. Merancang dan membuat
perangkat lunak sistem.
6. Mengevaluasi pengujian
sistem.
7. Mengimplementasikan
sistem.

2. Nurlindasari 0920038502 Manajemen 5 Jam/ Anggota Bertugas :


Thamsir Informatika Minggu 1. Mengumpulkan alat dan
bahan untuk penelitian.
2. Mengumpulkan literatur dan
data.
3. Membuat perangkat keras
sistem.
4. Membuat perangkat lunak
sistem.
5. Melakukan pengujian sistem
dengan menggunakan
metode black box.
6. Melakukan pengujian sistem
dengan menggunakan
metode statistik.
7. Mengimplementasikan
sistem

43
44

LAMPIRAN 3

BIODATA KETUA PENELITI

A. Identitas Diri

1. Nama Lengkap (dengan gelar) Nurlina, S.Kom., M.T


2. Jenis Kelamin P
3. Jabatan Fungsional Asisten Ahli
4. NIP/NIK/ Identitas Lainya - / - / 737111 690276 0005
5. NIDN 0929027601
6. Tempat dan Tanggal Lahir Ujung Pandang / 29 Februari 1976
7. Email linanoer888@yahoo.com
8. Nomor Telepon/HP - / 085242092888
9. Alamat Kantor Jl. Perintis Kemerdekaan Km.9
10. Nomor Telepon/Faks 0411 (587194) / 0411 (588284)
11. Lulusan yang telah diselesaikan S-1=1000 Orang

12. Mata Kuliah yang Diampu 1. Interaksi Manusia dan Komputer


2. Pemodelan dan Simulasi Sistem
3. Praktikum Pemodelan dan
Simulasi Sistem
4. Praktikum Perangkat Lunak
Aplikasi

B. Riwayat Pendidikan

S-1 S-2
Nama Perguruan STMIK Dipanegara Univ. Hasanuddin
Tinggi Makassar Makassar
Bidang Ilmu Manajemen Informatika Teknik Informatika

44
45

Tahun Masuk- 1995 – 2000 2008 – 2012


Lulus
Perancangan Sistem Studi Banding Spam-
Judul Informasi Pelayanan Wesel Assassin Dengan dan
Skripsi/Thesis/ Pos Dalam Negeri Pada Tanpa Anti Spam di Sisi
Disertasi POSINDO Kantor Cabang Client
Makassar
DR. Ir. Rhiza S. Sadjaad,
Nama
Drs. I Wayan Simpen, M.SI
Pembimbing/ MSEE dan DR. Armin
dan Drs. Badu Ahmad, MM
Promotor Lawi, MEng

C. Pengalaman Penelitian Dalam 5 Tahun Terakhir

Pendahuluan
No. Tahun Judul Penelitian
Sumber* Jml (Juta Rp)

Perancangan Aplikasi Yayasan


1 2009 Pemasaran Rumah Pada STMIK 3.000.000,00

PT. Pajaiang Indah Mks Dipanegara


Perancangan Sistem Yayasan
Informasi Akademik STMIK
2 2011 Berbasis Web Pada SMA Dipanegara 5.000.000,00

Negeri 4 Bantimurung
Kab. Maros
Perancangan Sistem Yayasan
Informasi Akademik STMIK
3 2012 6.000.000,00
Berbasis Client Server Dipanegara
Pada LP3I Cab. Mks

45
46

D. Pengalaman Pengabdian Kepada Masyarakat Dalam 5 Tahun Terakhir

Judul Pengabdian Kepada Pendanaan


No Tahun
Masyarakat Sumber* Jml (Juta Rp)
Pelatihan Multimedia Yayasan
1 2009 Tingkat Dasar Pada CV. Dipanegara 3.000.000,00
Media Ilmu Makassar Makassar
Pelatihan Software Dasar Yayasan
Micr. Excel Pada Dipanegara
2 2010 Penginputan Pemasukan Makassar 1.000.000,00
dan Pengeluaran Dana
Masjid Djabal Thariq
Pelatihan Internet I Pada Yayasan
3 2011 CV. Media Ilmu Makassar Dipanegara 5.000.000,00
Makassar
Pelatihan Jaringan Yayasan
Komputer di Kelurahan Dipanegara
4 2011 3.000.000,00
Gunung Sari Kec. Makassar
Rappocini Mks
Pelatihan Multimedia Pada Yayasan
5 2012 Kantor CV. Fika Karya Dipanegara 3.000.000,00
Mandiri Mks Makassar

E. Publikasi Artikel Ilmiah Dalam Jurnal Dalam 5 Tahun Terakhir

Volume/
No Judul Artikel Ilmiah Nama Jurnal
Nomor/Tahun
Perancangan Sistem Informasi Volume 08 - Jurnal IT
1 Kesiswaan Pada SMU Negeri 1 September 2012 STMIK
Marioriawa Kab. Soppeng ISSN : 2087-6505. Handayani

46
47

Hal.: 69-80
Pengawasan Aktivitas dan
Volume 09,
Pembatasan Hak Akses User Jurnal IT
Desember 2012
2 Pada Sistem Operasi Windows di STMIK
ISSN : 2087-6505.
Bagian Divisi Keuangan PT. Handayani
Hal.: 96- 107
(Persero) Angkasa Pura I Mks

F. Pemakalah Seminar Ilmiah (Oral Presentation) Dalam 5 Tahun Terakhir

Nama Pertemuan Waktu dan


No Judul Artikel Ilmiah
Ilmiah/Seminar Tempat
Perancangan Sistem Informasi
Akademik Berbasis Client Server
1.
Prosiding Pada Lembaga Pendidikan Dan
Pengembangan Profesi Indonesia
(LP3I) Cabang Makassar
Perancangan Sistem Komputerisasi
Tes Masuk Calon Mahasiswa Baru
2. Prosiding Pada Sekolah Tinggi Manajemen
Informatika dan Komputer (STMIK)
Dipanegara Makassar

G. Karya Buku dalam 5 Tahun Terakhir

No Judul Buku Tahun Jumlah Penerbit


Halaman

H. Perolehan HKI Dalam 5 – 10 Tahun Terakhir

No Judul/Tema HKI Tahun Jenis Nomor P/ID

47
48

I. Pengalaman Merumuskan Kebijakan Publik/Rekayasa Sosial


Lainnya Dalam 5 Tahun Terakhir

No. Judul/Tema/Jenis Rekayasa Sosial Tahun Tempat Respons


Lainnya yang Telah Diterapkan Penerapan Masyarakat

J. Penghargaan Yang Pernah Diraih Dalam 10 Tahun Terakhir (dari


pemerintah, asosiasi atau institusi lainnya)

No. Jenis Penghargaan Institusi Pemberi Penghargaan Tahun

Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan
dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata
dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya
Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu
persyaratan dalam pengajuan Penelitian Dosen Pemula.

Makassar, 01 Mei 2015

Pengusul,

(Nurlina, S. Kom., M.T)

48
49

LAMPIRAN 3
BIODATA ANGGOTA PENELITI

3.1 Identitas Diri

1 Nama Lengkap Nurlindasari Tamsir, S.Kom.,MT


2 Jenis Kelamin Perempuan
3 Jabatan Fungsional Asisten Ahli
4 NIK 05211153
5 NIDN 0920038502
6 Tempat Tanggal Lahir Makassar, 20 maret 1985
7 e-mail Stmik14@gmail.com
8 Alamat Rumah Jl. Komp PU Malllengkeri BTN Tabaria Blok N.9
Kelurahan : Mangasa
Kecamatan : Tamalate
Kota : Makassar
Provinsi : Sulawesi Selatan
Kode Pos : 90221
9 Nomor Telepon Hp 085255013331
10 Alamat Kantor STMIK Dipanegara Makassar
Jl. Perintis Kemerdekaan Km. 9 Tamalanrea
11 Nomor Telepon 0411-587194
12 Lulusan yang telah S1 : 10.000 orang, S2 : -, S3 : -
dihasilkan
13 Mata kuliah yang diampu Pemrograman Terstruktur
Analisis dan Perancangan Sistem
Manajemen Proyek Sistem Informasi

A. Riwayat Pendidikan

S1 S2
Nama Perguruan STMIK Dipanegara Universitas Hasanuddin
Tinggi Makassar Makassar
Bidang Ilmu Sistem Informasi Teknik Elektro Konsentrasi
Teknik Informatika
Tahun Masuk – Tahun 2002 – 2007 2008 – 2010
Lulus
Judul Skripsi/Thesis Perancangan Sistem Sistem Pengambilan
Informasi Retribusi Parkir Keputusan dalam
Pada PD Parkir Makassar Menentukan Jurusan di SMA
Raya Kota Makassar Negeri Makassar
Menggunakan Algoritma
Naïve Bayesian
49
50

Nama Indra Samsie, M.Kom Prof. Dr. Ir. H.Muh. Arief,


Pembimbing/Promotor Marsellus O.Kadang, Dipl.Ing
Dr. Armin Lawi, M. Eng
S.Kom

3.2 Pengalaman Penelitian Dalam 5 Tahun Terakhir


Pendanaan
No. Tahun Judul Penelitian
Sumber * Jumlah (Juta Rp)

3.3 Pengalaman Pengabdian Kepada Masyarakat Dalam 5 Tahun Terakhir


Pendanaan
No. Tahun Judul Penelitian
Sumber * Jumlah (Juta Rp)

3.4 Publikasi Artikel Ilmiah Dalam Jurnal Dalam 5 Tahun Terakhir

Volume/Nomor/ Nama
No. Judul Artikel Ilmiah Tahun Jurnal

3.5 Pemakalah Seminar Ilmiah (Oral Presentation) Dalam 5 Tahun Terakhir

No. Nama Pertemuan Ilmiah / Judul Artikel Ilmiah Waktu dan


Seminar Tempat

3.6 Karya Buku dalam 5 Tahun Terakhir

No. Judul Buku Tahun Jumlah Halaman Penerbit

3.7 Perolehan HKI Dalam 5 – 10 Tahun Terakhir

No. Judul/Tema HKI Tahun Jenis Nomor P/ID

3.8 Pengalaman Merumuskan Kebijakan Publik/Rekayasa Sosial Lainnya


Dalam 5 Tahun Terakhir

No. Judul/Tema/Jenis Rekayasa Sosial Tahun Tempat Respons


Lainnya yang Telah Diterapkan Penerapan Masyarakat
50
51

3.9 Penghargaan Yang Pernah Diraih Dalam 10 Tahun Terakhir (dari


pemerintah, asosiasi atau institusi lainnya)

No. Jenis Penghargaan Institusi Pemberi Penghargaan Tahun

Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan
dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata
dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya
Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu
persyaratan dalam pengajuan Penelitian Dosen Pemula.

Makassar, 01 Mei 2015

Pengusul,

(Nurlindasari Thamsir, S. Kom., M.T)

51
52

52

Anda mungkin juga menyukai