Anda di halaman 1dari 6

Ketentuan Umum

Bahasa Indonesia, 6-10 halaman, A4, Times New Roman, spasi single.
Margin: Top 3cm, Inside 3cm, Outside 2,5cm, Bottom 2,5cm
Naskah disimpan dalam format Microsoft Word 2017 atau setelahnya (*docx)
Judul artikel:
Times New Roman, 14, Bold
Capitalized Each Word.
Spasi Single

Supervised Learning Naïve Bayes Untuk Deteksi Emosi Pembuat artikel:


Times New Roman, 12,
Data SMS (Short Message Service) Centre, Bold.
Spasi Single, After 6pt Spasi Single
Institusi pembuat artikel:
Times New Roman, 12,
Alun Sujjada1), Ranap Sitorus2) Centre.
Spasi Single
Teknik Informatika, STT Atlas Nusantara Malang
1) Email pembuat artikel:
alun.sujjada@gmail.com, 2)ranap_natalinas@gmail.com Times New Roman, 12,
Spasi Single, After 6pt Centre.
Spasi Single
Judul Abstrak:
ABSTRAK Times New Roman, 12,
Centre, Bold, UPPER CASE
Pesan teks yang berupa SMS (Short Message Service) adalah layanan yang paling Spasi Single, After 6pt
sering
digunakan seseorang untuk saling berkomunikasi dikarenakan harga yang relatif Paragraf Abstrak:
Times New Roman, 12.
murah.Namun hal tersebut mempunyai juga kekurangan dan celah untuk menimbukan First line 0, Justified.
Spasi Single, After 6pt
masalah baru yaitu seperti penulisan SMS yang disingkat yang mengakibatkan pengguna
susah untuk memahami tiap-tiap karakter yang diterimanya, dengan menggunakan SMS
seseorang tidak akan pernah dapat mengetahui kondisi psikologi dari orang yang diajak
berkomunikasi. Mengerti kondisi seseorang adalah hal yang sangat penting ketika
berkomunikasi, komunikasi akan berjalan dengan baik jika dilakukan dalam keadaan yang
stabil, tidak marah, sehat, tidak mengantuk, sehingga apa yang disampaikan akan
mendapatkan respon yang positif.
Melihat permasalahan diatas, perlu sebuah solusi untuk menjembatani agar penggunaan
SMS dapat berjalan optimal.Untuk mengubah teks SMS yang dikirim dapat diubah menjadi
teks utuh dengan menggunakan algoritma C4.5.Kemudian dari teks utuh tersebut dapat
dicari pola kata penulisan untuk mendeteksi emosi seseorang menggunakan metode Naïve
Bayes yang selama ini dikenal memiliki tingkat akurasi yang tinggi dalam hal statistika dan
probabilitas.
Dengan penggabungan antara algoritma C4.5 dan Metode Naïve Bayes maka dengan
murahnya layanan SMS yang dipilih masyarakat sekarang ini akan tetap mudah dibaca oleh
seseorang yang akan diajak berkomunikasi dan dapat mengerti kondisi emosi seseorang,
sehingga seseorang dapat menyikapi bagaimana respon dalam membalas SMS
berikutnya.Dari hasil uji coba diketahui bahwa metode Naïve Bayes memiliki tingkat
keberhasilan mengenali emosi SMS 85%. Judul Kata Kunci:
Times New Roman, 12, Left,
Bold, Capitalized Each Word
Kata Kunci: Naive Bayes, Deteksi Emosi, Supervised Learning, C4.5, SMS
Spasi Single, After 6pt Kata Kunci:
Times New Roman, 12, Left
Judul Bab:
Times New Roman, 12, Left, Spasi Single, After 6pt
Bold, Capitalized Each Word
1. Pendahuluan Spasi Single, After 6pt

SMS(Short Message Service) adalah layanan dari sebuah ponsel untuk mengirim dan Artikel:
Paragraf
Times New Roman, 12.
menerima pesan singkat berbentuk teks dengan harga layanan yang relatif murah. Dengan
First line 1,27, Justified.
kemurahan layanan tersebut maka masyarakat Indonesia lebih memilih layanan SMSSpasi dariSingle, After 6pt

pada telepon ketika akan saling berkomunikasi. Namun pemakaian layanan SMS tersebut
memiliki kelemahan dibandingkan dengan berkomunikasi langsung via telepon. Jika
berkomunikasi lewat telepon maka seorang pengguna telepon akan mengerti kondisi
psikologi lawan bicara, apakah orang yang akan diajak bicara sedang marah, sedih, senang,
ngantuk, sehat, sakit. Hal itu dapat dengan mudah dilakukan dengan mendengar intonasi
suara lawan bicara, sehingga seseorang dapat memutuskan bagaimana sikap untuk bertindak
agar terjalin komunikasi yang baik. Tapi bagaimana hal itu dapat dilakukan jika seseorang
menggunakan layanan SMS yang tidak ada intonasi didalamnya, cara SMS yang banyak
memakai singkatan, belum lagi cara SMS anak muda jaman sekarang yang memakai kata
dan penulisan yang tidak baku sehingga banyak orang yang susah dan salah persepsi
mengartikan sebuah pesan teks.
Dengan banyaknya gaya penulisan SMS yang menggunakan singkatan, maka disini
peneliti ingin menguji Algoritma C4.5 untuk mengubah teks yang berbentuk singkatan
menjadi teks baku. Kemudian dari teks-teks yang sudah baku, maka perlu untuk menemukan
pola dan klasifikasi dari kalimat SMSagar dapat mendeteksi emosi. Konsep penemuan pola
tiap-tiap teks tersebut dapat diterapkan dengan model learning.
Metode Naive Bayes adalah salah satu model supervisedlearning(pembelajaran
terawasi) berbasis statistika dan probabilitas yang mempunyai akurasi tinggi (Kusrini dan
Emha Taufiq Luthfi, 2008). Dengan paparan analisa tersebut diatas, untuk itu penulis
bermaksud melakukan penelitian dengan judul “Supervised Learning Naïve Bayes Untuk
Deteksi Emosi SMS (Short Message Service)”. Judul Bab:
Times New Roman, 12, Left,
Spasi Single, After 6pt Bold, Capitalized Each Word
Spasi Single, After 6pt
Judul Sub Bab:
2. Tijauan Pustaka Times New Roman, 12, Left,
Bold, Capitalized Each Word
Spasi Single, After 6pt
2.1 Data mining
Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan
pengetahuan di dalam database.Data mining adalah proses yang menggunakan teknik
statistic, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan
mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai
database besar [11].
Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang
berarti, pola dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang
tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik
statistic dan matematika [5].Adapun tahapan dari Data Mining adalah seperti gambar 1.

Gambar:
Centre, In Line with Text
Spasi Single, After 6pt

Nomor Gambar:
Times New Roman, 12,
Centre,
Spasi Single, After 6pt

Gambar 1. Tahapan Data Mining


(Sumber) Sumber Gambar:
Times New Roman, 12,
Centre,
Spasi Single, After 6pt Spasi Single, After 6pt

2.2 Naïve Bayes


Bayesian Clasification adalah pengklasifikasian statisitik yang dapat digunakan
untuk memprediksi probabilitas keanggotaan suatu class. Bayesian Clasification didasarkan
pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decison tree dan
neural network. Bayesian Clasification terbukti memiliki akurasi dan kecepatan yang tinggi
saat diaplikasikan ke dalam database dengan data yang besar. Teorema bayes memiliki
bentuk umum sebagai berikut.
𝑷(𝐗/𝐇)𝐏(𝐇)
𝐏(𝐇/𝐗) =
𝑷(𝑿) Equation, Bold
Spasi Single, After 6 pt
Persamaan 1. Teorema Bayes Sumber Gambar:
Times New Roman, 12,
Centre,
Spasi Single, After 6pt

Dalam Hal ini:


X = data dengan class yang belum diketahui.
H = hipotesis data X merupakan class yang spesifik.
P (H/X) = probabilitas hipotesis H berdasar kondisi X (pasteriori probability).
P(H) = probabilitas X berdasar kondisi pada hipotesis H.
P (X) = probabilitas X.

Keuntungan metode Naive Bayes:


1. Relatif mudah untuk diimplemetasikan karena tidak menggunakan optomasi
numerik, perhitungan matriks dan lainnya.
2. Efisien dalam penggunaan dan pelatihannya.
3. Bisa menggunakan data binary atau polinom.
4. Karena diasumsikan independen maka memungkinkan metode ini
diimplementasikan dengan berbagai macam data set.
Sedangkan kerugian metode Naive Bayes adalah karena diasumsikan bahwa metode Naive
Bayes itu bersifat independen maka memiliki konsekuensi diantaranya :
1. Perkiraan kemungkinan kelas yang tidak akurat.
2. Batasan atau treshold harus ditentukan secara manual bukan secara analisis. [4].
Spasi Single, After 6pt

2.3 Decision Tree


Decision tree atau pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat
kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi
pohon keputusan ayng mempresentasikan aturan. Aturan dapat mudah dipahami dengan
bahasa alami. Bahasa alami juga dapat diekspresikan dengan Structured Query Language
untuk mencari record pada kategori tertentu.
Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan yang
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target.
Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi
kumpulan data yang besar menjadi himpunan – himpunan record yang lebih kecil dengan
menerapkan serangkaian aturan keputusan. Dengan masing – masing rangkaian pembagian,
anggota himpunan hasil menjadi mirip satu dengan yang lain [2].
3. Metodologi Penelitian
3.1 Penerapan Algoritma Naive Beyes
Berikut adalah faktor atau atribut yang digunakan dalam pengklasifikasian emosi
pada text SMS dengan menggunakan Klasifikasi Bayes:
1. Kata Dominan
Yang dimaksud dengan kata dominan adalah suatu kata dalam text SMS (umumnya
Kata Predikat pada SPOK) yang secara umum menandakan bahwa kata tersebut
adalah suatu emosi, sebagai contoh:
Point dan Sub Point:
Times New Roman, 12, a. Marah: Kesal, Merah padam, Menggerutu, Mengomel, Mengamuk.
Justified, Spasi Single, b. Takut: Seram, Gemetar, Merinding, Pucat, Bulukuduk.
Judul Point, Keterangan Point c. Senang: Gembira, Tertawa, Sukacita, Bersukaria, Sorak – sorai.
dan Sub Point dibuat sejajar
d. Sedih: Sakit, Kecewa, Menangis, Menderita, Berduka – cita.

2. Kata Pendukung
Yang dimaksud dengan kata pendukung adalah kata yang lebih sebagai pendukung
suatu emosi. Sebagai contoh:
a. Marah: Umumnya kata umpatan.
b. Takut: hiiii..., serem
c. Senang: horai, asik, yup, ok.
d. Sedih: aduh

3. Predikat
Yang dimaksud dengan predikat adalah mengacu pada kata dominan, dimana kata
tersebut bersifat aktif atau pasif.

4. Magic Word
Yang dimaksud dengan magic word adalah adanya penggunaan kata yang
menandakan lawan kata atau kebalikan. Sebagai contoh : tidak, nggak, ga, dll.

5. Emoticon
Emoticon menjadi faktor penting, karena pada text SMS sering ditemukan adanya
suatu penanda emosi atau keadaan seseorang. Secara umum bentuk suatu emoticon
adalah gabungan dari text dengan text atau text dengan tanda baca atau tanda baca
dengan tanda baca. Sebagai contoh : “:(“ menandakan sedih.
3.2 Flowchart Sistem
Adapun Flowchart dari sistem deteksi emosi pada penelitian ini adalah:
START

Input SMS

Scanning Kata

Deteksi
Normalisasi Stop List
Emosi

Pencarian tingkat
kemunculan, kata T Terdapat Pola
yang tidak terdapat
pola

Kalkulasi Hasil
Deteksi

Jumlahkan Hasil
Deteksi 1 & Deteksi 2

Output Hasil

END

Gambar 2. Flowchart Sistem

4. Hasil dan Pembahasan


4.2 Tingkat Keberhasilan Metode Naive Beyes
Dari Form Deteksi Emosi per Satu SMS diperoleh hasil percobaan text SMS sebagai
berikut:
Nomor Tabel:
Times New Roman, 12,
Tabel: Centre,
Times New Roman, 10 Spasi Single, After 6pt
Spasi Single, Tabel 1. Hasil deteksi dengan form deteksi emosi per satu sms
Lokasi Tabel: Centre
Nilai Nilai Nilai Nilai Emosi
No SMS
Senang Sedih Marah Takut
1 q lg ada masalah 0 1 0 0 Sedih
2 Huft, q mau pergi dari semua ini 0 0.73 0 0.27 Sedih
3 q lg sakit 0 1 0 0 Sedih
4 q lg ingin sendiri 0 0.16 0 0.84 Takut
5 q tdk naik kelas 0 0.52 0.17 0.32 Sedih
6 Hahaha akhirnnya, q bisa membalas dia 1 0 0 0 Senang
7 q bisa pergi ke pantai 0.34 0.26 0.17 0.23 Senang
8 Hore tim futsal kampus q menang 1 0 0 0 Senang
9 akhirnya selesai juga tugas q 0.34 0.26 0.17 0.23 Senang
10 ujian q berjalan lancar 0 1 0 0 Sedih
5. Kesimpulan
1. Cara pendeteksian emosi pada teks SMS dengan menggunakan Metode Naive Bayes,
dimana terdapat beberapa faktor yang diperlukan sebagai : Kata dominan, Kata
pendukung, Predikat, Magic Word dan Emoticon. Namun untuk meningkatkan
tingkat keberhasilan pendeteksian emosi ditambahkan suatu metode yaitu pencarian
kata dalam suatu kumpulan data sms yang sudah dikenali emosinya, dan dari hasil
pencarian kata tersebut akan diperoleh bahwa suatu kata akan lebih sering digunakan
pada tipe suatu emosi tertentu. Adapun kata yang digunakan dalam pencarian adalah
kata yang tidak termasuk dalam kata pendukung dan kata dominan. Namun dengan
adanya metode ini, diperlukan data SMS dalam jumlah yang cukup besar (> 1000
SMS) dan beragam.
2. Dari faktor – faktor tersebut dapat kita terapkan metode Naive Bayes dengan
menggunakan rumus – rumus yang telah ditentukan sebelumnya, tentunya dengan
didukung oleh pola serta jumlah data SMS beragam yang dimiliki. Dari rumus inilah
suatu emosi dapat dideteksi dengan baik.
3. Setelah melihat hasil dari ujicoba yang dilakukan sebelumnya, sebenarnya program
sudah dapat mendeteksi dengan baik (dengan tingkat keberhasilan 75 % untuk
deteksi emosi dengan menggunakan Metode Naive Bayes Murni dan 85 % untuk
deteksi emosi dengan menggunaka Metode Naive Bayes yang telah dimodifikasi),
namun deteksi tersebut tergantung dari data pada beberapa faktor penting (sebagai
contoh : faktor kata dominan, faktor kata pendukung, dan emoticon, serta jumlah
data SMS). Jika data tersebut tidak ada atau kurang, maka hasil yang didapat bisa
menjadi salah. Sehingga cara mengukur benar atau tidaknya hasil emosi tentu dengan
melihat data pada faktor – faktor penting. Oleh karena itu, data yang dimasukkan jika
Pustaka diberi nomor sesuai semakin banyak, maka hasilnya akan semakin baik.
urutan kemunculan dalam
artikel

Daftar Pustaka
[1] Atkinson. R. L. dkk, HM. 1987. Pengantar Psikologi I. Jakarta: Erlangga.
[2] Linoff,Berry. 2004. Data Mining Technique. Wiley Computer Publishing
[3] Goleman, Daniel. 2003. Emotional Intelligence. Jakarta: PT Gramedia Pustaka Utama.
[4] Kusrini.,Luthfi, Emha Taufiq. 2008. Algoritma Data Mining. Yogyakarta: Andi Offset.
[5] Larose, Daniel. 2005. Discovering Knowledge in Data: An Introduction to Data Mining.
Jhon Willey & Sons, Inc.
[6] Martin, Anthony Dio. 2003. Emotional Quality Manajement Refleksi, Revisi Dan
Revitalisasi Hidup Melalui Kekuatan Emosi. Jakarta: Arga.

Anda mungkin juga menyukai