Anda di halaman 1dari 7

Seminar Nasional Teknologi Informasi 2016 A6

APLIKASI PENDETEKSI EMOSI MANUSIA


MENGGUNAKAN METODE MFCC DAN DTW
, ,
[1]
Jurusan Teknik Informatika, Fakultas Teknologi Industri, Itenas Bandung
youllia@itenas.ac.id, sangkuriang69@gmail.com, adrianyuki16@gmail.com

ABSTRACT
Classification of sound is one of the fields of
Artificial Intelligent namely on the field of science 1.2. Rumusan Masalah
Pattern Recognition, classification analysis based on Adapun masalah yang dirumuskan dalam penelitian
the emotion was created in order for the computer to ini sebagai berikut:
recognize the sound of angry, sad, happy, disgust and 1. Bagaimana proses Speech Recognition dapat
fear,by using voice as a voice recognition system or menentukan tingkatan emosi dengan
voice matching. This study that was made about the menggunakan algoritma MFCC dan DTW.
recognition of human emotions from the speaker by 2. Bagaimana cara algoritma MFCC untuk
saying that depend on the text and the speaker, in the mengambil ekstraksi suara menjadi tingkatan
process of the recognition, Mel frequency cepstral emosi.
Coefficients (MFCC) algorithm is being used. This 3. Bagaimana cara melakukan pencocokan data
technique is used to perform feature extraction process suara dengan algoritma DTW.
of the speech signal. While the process of matching the
voice signal to be tested is using Dynamic Time 1.3. Tujuan
wraping algorithm (DTW). Dynamic Mechanical Time
wraping (DTW) is intended to make difference Berdasarkan perumusan masalah tujuan dari
accommodations in time between the recording penelitian ini yaitu untuk mengembangkan pengunaan
process when testing with the database that available Voice Recognition dalam mendeteksi emosi melalui
on the reference signal. MFCC process will convert ekstraksi suara dengan menggunakan algoritma MFCC
voice signals into several vectors which are useful for dan pencocokan menggunakan DTW.
voice recognition process. Feature vector of the
MFCC results will then be compared with the feature 1.4. Batasan Masalah
vector which are stored in the database using DTW.
Dalam penelitian ini batasan masalah adalah
Key Word : Definition Of Voice, Emotion, MFCC, DT sebagai berikut:
1. Input yang dikenali adalah suara user yaitu
emosional marah, senang, sedih, bingung atau
ketakutan.
2. Suara analog diubah menjadi digital dengan
1. Pendahuluan format *.wav
3. Menerapkan word dependent dengan
Emosi merupakan suatu kondisi mental seseorang
mengucapkan kalimat tertentu.
yang dapat mendorongnya untuk melakukan suatu
4. Penggunaan aplikasi hanya bisa pada umur
tindakan atau berekspresi yang dapat dipicu dari dalam
tergolong dewasa dengan rentang usia 18-24
atau luar dirinya. Dalam kehidupan sehari-hari sangat
tahun
penting untuk memahami kondisi emosional seseorang
5. Sampling rate yang digunakan adalah 16000Hz
dengan emosi tertentu. Emosi juga merupakan salah
6. Bahasa yang digunakan dalam proses latihan dan
satu aspek penting bagi kehidupan. Emosi seseorang
proses uji adalah Bahasa Indonesia dan diucapkan
dapat diketahui salah satunya dari ekspresi wajah,
oleh orang Indonesia.
namun terkadang ekspresi wajah seseorang tidak
sesuai dengan apa yang sedang dialaminya. Maka dari
itu, untuk mempermudah dalam mengetahui emosi 2. Landasan Teori
yang sedang dialami oleh seseorang, dibuatlah aplikasi
untuk mendeteksi emosi seseorang berdasarkan suara 2.1 Voice Recognition
menggunakan metode Mel Frequency Cepstral Voice Recognition adalah suatu sistem yang dapat
Coefficients (MFCC) dan Dynamic Time Wraping mengidentifikasi seseorang melalui suaranya, pada saat
(DTW). saya mencari pengertiaan dari voice recognition
terdapat juga pengertian Speech Recognition yang

29
A6 Seminar Nasional Teknologi Informasi 2016

hampir sama secara fungsinya. Tapi terdapat normalisasi dari data suara input. Untuk penghitungan
perbedaan antara keduanya, Voice Recognition menggunakan Dc–Removal dapat diperlihatkan pada
mengidentifikasi siapa yang berbicara, tetapi Speech Persamaan (1) sebagai berikut:
Recognition mengidentifikasi apa yang diucapkan.
y[n] = x[n] - , 0 ≤ n ≤ N-1 …………… (1)
2.1.1 Speech Recognition
Keterangan :
Speech Recognition adalah proses identifikasi
y[n]= sampel signal hasil DC removal
suara berdasarkan kata yang diucapkan dengan
x[n]= sampel signal asli
melakukan konversi sebuah sinyal akustik, yang
= nilai rata-rata sampel signal asli.
ditangkap oleh audio device (perangkat input suara).
N = panjang signal
Speech Recognition juga merupakan sistem yang
digunakan untuk mengenali perintah kata dari suara
manusia dan kemudian diterjemahkan menjadi suatu 2. Pre-Emphasize
data yang dimengerti oleh komputer. Pre-emphasize Filtering merupakan salah satu
jenis filter yang sering digunakan sebelum sebuah
2.1.2 Mel Frequency Cepstrum Coefficient signal diproses lebih lanjut. Filter ini mempertahankan
(MFCC) frekuensi-frekuensi tinggi pada sebuah spektrum, yang
MFCC merupakan salah satu metode yang umumnya tereliminasi pada saat proses produksi suara.
digunakan untuk melakukan feature extraction, sebuah Rumus pre-emphasize dapat dilihat pada
proses yang mengkonversikan signal suara menjadi persamaan (2) berikut:
beberapa parameter. Beberapa keunggulan dari y[n] = s[n] – α s[n – 1] ….……… (2)
MFCC,antara lain:
1. Mampu untuk menangkap karakteristik suara yang Keterangan :
sangat penting bagi pengenalan suara, atau dengan y[n] = signal hasil pre-emphasize filter
kata lain dapat menangkap informasi-informasi s[n] = signal sebelum pre-emphasize filter
penting yang terkandung dalam signal suara.
2. Menghasilkan data seminimal mungkin, tanpa 3. Frame Blocking
menghilangkan informasi-informasi penting yang
dikandungnya. Frame diartikan sebagai bingkai, dan Blocking
3. Mereplikasi organ pendengaran manusia dalam diartikan sebagai pembagian menjadi beberapa blok.
melakukan persepsi terhadap signal suara. Jadi frame blocking adalah proses pembagian sinyal
Tahapan Proses Mel Frequency Cepstrum Coefficient menjadi beberapa frame. Tujuan frame blocking adalah
ditunjukan pada Gambar 1. untuk memudahkan untuk melihat titik-titik sample
pada sinyal ketika sinyal tersebut di perbesar. Panjang
frame yang digunakan untuk pemrosesan sinyal adalah
10-30 ms. Untuk nilai default nya adalah 20 ms.
Speech Pre Frame
DC-Removal Rumus untuk menghitung jumlah frame dapat
Emphasize Blocking
dilihat pada persamaan (3) berikut:
Frame
Mel …………………………………… (3)
Fast Fourier Spectrums
Frequency Windowing
Transform
Warping Keterangan:
I = Sample rate
Mel Spectrums
N = Sample Point (Sample rate * waktu framing (s))
Feature
Discrete Mel M = N/2
Cepstral Extraction
Cosine Cepstrums
Filtering 4. Windowing
Transform
Gambar 1 Tahap proses MFCC Proses ini dibutuhkan untuk mengurangi
terjadinya kebocoran spectral atau aliasing pada
sinyal. Proses windowing yang dipakai adalah
1. DC-Removal hamming window, proses tersebut dapat dituliskan
dalam persamaan (4) berikut:
Remove DC Components bertujuan untuk
menghitung rata-rata dari data sampel suara, dan
mengurangkan nilai setiap sampel suara dengan nilai
rata-rata tersebut. Tujuannya adalah mendapat

30
Seminar Nasional Teknologi Informasi 2016 A6

........………(4)

Keterangan : ..(7)
= 0,1,....,M-1 Keterangan:
M = Panjang frame = keluaran dari proses filterbank pada index k
K = jumlah koefisien yang diharapkan
5. FFT
Fast Fourier Transform (FFT), adalah proses 8. Cepstral Liftering
untuk mengubah sinyal suara dari domain waktu Hasil dari proses utama MFCC feature extraction
menjadi domain frekuensi. Hasil sinyal yang telah memiliki beberapa kelemahan. Low order dari cepstral
melalui FFT dinamakan spektogram. coefficients sangat sensitif terhadap spectral slope,
Proses FFT dapat dilihat pada persamaan (5): sedangkan bagian high ordernya sangat sensitif
terhadap noise.
……....(5) Oleh karena itu, cepstral liftering menjadi salah
satu standar teknik yang diterapkan untuk
meminimalisasi sensitifitas tersebut.
Keterangan :
Cepstral liftering dapat dilakukan dengan
Wn = Sinyal hasil FFT
mengimplementasikan fungsi window terhadap
e = Nilai imaginary
N = Jumlah titik sampling sinyal cepstral features seperti pada persamaan (8):

(8)
6. Mel- frequency wrapping
Mel- frequency wrapping umumnya dilakukan Keterangan
dengan menggunakan Filterbank. Filterbank L = jumlah cepstral coefficients
digunakan sebagai pembungkus (wrapping) mel N = index dari cepstral coefficients
frekuensi serta dapat diterapkan baik pada domain
waktu maupun pada domain frekuensi, tetapi untuk 9. DTW
keperluan MFCC, filterbank harus diterapkan dalam
domain frekuensi. Dynamic time warping (DTW) adalah algoritma
Filterbank menggunakan representasi konvolusi yang menghitung warping path yang optimal antara
dalam melakukan filter terhadap signal.Konvolusi dua runtun data sehingga outputnya adalah nilai-nilai
dapat dilakukan dengan melakukan multiplikasi antara warping path dan jarak diantara kedua runtun tersebut.
spektrum signal dengan koefisien filterbank. Algoritma DTW disebut juga sebagai non-linear
Proses Filterbanks dapat dilihat pada persamaan sequence alignment, sehingga algoritma ini lebih
(6) : realistis untuk digunakan dalam mengukur kemiripan
suatu pola (pattern/template matching). Data yang
...(6) diolah selalu berada dalam kawasan waktu, sehingga
rentetan data yang kita punya dianggap bervariasi
Keterangan : terhadap waktu. Ilustrasi pencocokan dengan metode
N = jumlah magnitude spectrum (N N) DTW ditunjukkan pada gambar dibawah ini.
S[j] = magnitude spectrum pada frekuensi j
Hi[j] = koefisien filterbank pada frekuensi j (1 ≤ i ≤ M
)
M = jumlah channel dalam Filterbank

7. Discrete Cosine Transform


Discrete Cosine Transform (DCT) merupakan
langkah terakhir dari proses utama MFCC feature
extraction. Konsep dasar dari DCT adalah
mendekorelasikan mel spectrum sehingga (a) (b)
menghasilkan representasi yang baik dari property Gambar 2. Pencocokan sequence (a) alignment asli dari 2 sequence
spektral local. (b) alignment dengan DTW (Darma Putra, 2009).

Proses DCT dapat dilihat pada persamaan (7) :


Rumus untuk mendapatkan nilai minimum dalam
proses DTW dapat dihitung menggunakan
Persamaan (9) :

31
A6 Seminar Nasional Teknologi Informasi 2016

D= …….. (9) Data Latih Data Uji Keputusan

Keterangan :
X = Sinyal uji
Y = Sinyal Latih
User Melakukan
2.2 Teori Emosi Manusia Perekaman User Melakukan Informasi
Perekaman Emosi
Kata Emosi berasal dari dua bahasa yaitu bahasa
Microfon
perancis emotion yang berarti kegembiraan dan dari
bahasa latin emovere yang berarti bergerak menjauh. Microfon
Emosi adalah perasaan intens yang ditujukan kepada Ekstraksi
MFCC
seseorang atau sesuatu dalam arti lain emosi adalah
reaksi terhadap seseorang atau kejadian. Ekstraksi
Arti kata emosi diatas menyiratkan bahwa MFCC
kecenderungan bertindak merupakan hal yang mutlak
Setelah ditraining
dalam emosi. Kebanyakan ahli yakin bahwa emosi
data disimpan sebagai
lebih cepat berlalu daripada suasana hati. Emosi referensi
merupakan reaksi terhadap rangsangan dari luar dan
Pencocokan
dalam diri individu. Emosi dapat ditunjukkan ketika Referensi DTW
merasa senang mengenai sesuatu, marah kepada Suara Latih
seseorang, ataupun takut terhadap sesuatu. Gambar 3 Workflow Cara kerja Sistem

3. Analisis Dan Perancangan


Gambar umum sistem dapat dilihat pada Gambar 4. Pengujian
2. Pada proses awal yang dilakukan untuk mendeteksi Pada sub bab ini akan dijelaskan tentang
emosi seseorang adalah melakukan proses data latih. pengujian sistem pada aplikasi yang dibuat.
Proses data latih digunakan untuk menyimpan
referensi jenis emosi. Pada proses data latih pertama 4.1 Pengujian Sistem
user melakukan proses perekaman suara menggunakan Pada pembahasan pengujian sistem ini, pengujian
mikrofon kemudian suara yang masuk dilakukan dilakukan dengan dua cara yaitu pengujian secara
ekstraksi ciri menggunakan metode MFCC, setelah itu Tidak Langsung dan pengujian Langsung.
didapat ciri suara dari dari data latih yang akan
disimpan di database data latih. 4.1.1. Pengujian Tidak Langsung
Setelah dibuat data referensi data latih maka
selanjutnya dilakukan data uji (pengujian). Pada data Pengujian ini dilakukan dengan menggunakan 10
data suara menggunakan bahasa Indonesia. Hasil
uji memiliki tahap yang hampir sama seperti proses
pengujian tidak langsung (Tidak Langsung) untuk
pada data latih. Pada proses data uji ini user kembali
deteksi emosi emosi marah pada 1 orang dapat dilihat
melakukan perekaman suara berbentuk .wav. Hasil
dari data rekaman suara tersebut akan menjadi data uji pada Tabel 1.
yang diekstraksi menggunakan MFCC. Setelah Tabel 1 Hasil Pengujian Tidak Langsung Menggunakan
didapatkan ciri suara dari data uji, dilakukan Sample Suara Alfira untuk Deteksi Emosi Marah
pencocokan menggunakan metode DTW. Dengan Data Suara
menghitung jarak dari kedua vektor antara data yang Kalimat Yang
Yang Diuji Hasil Uji
dijui dengan data yang berada di dalam data referensi Diuji
(*.wav)
Marah1 Marah
Marah2 Marah
Marah3 Sedih
Marah4 Marah
Saya Ikut Serta
Marah5 Muak
Dalam
Marah6 Muak
Kegiatan Itu
Marah7 Marah
Marah8 Muak
Marah9 Takut
Marah10 Marah

32
Seminar Nasional Teknologi Informasi 2016 A6

Tingkat keberhasilan dalam (%) untuk deteksi Hasil pengujian Tidak Langsung untuk deteksi
emosi marah dapat dihitung menggunakan emosi sedih dapat dilihat pada tabel 4.
Persamaan (10):
Tabel 4 Hasil Pengujian Tidak Langsung Menggunakan Sample
Suara Alfira untuk Deteksi Emosi muak
(10)
Data Suara
Kalimat Yang
Yang Diuji Hasil Uji
Sehingga dapat diketahui nilai keberhasilan dari Diuji
(*.wav)
deteksi emosi marah adalah:
Muak1 Muak
Muak2 Sedih
Hasil pengujian Tidak Langsung untuk deteksi Muak3 Muak
emosi sedih dapat dilihat pada tabel 2.
Muak4 Sedih
Tabel 2 Hasil Pengujian Tidak Langsung Menggunakan Sample Saya Ikut Serta
Suara Alfira untuk Deteksi Emosi Sedih Muak5 Sedih
Dalam Kegiatan
Data Suara Itu Muak6 Senang
Kalimat
Yang Diuji Hasil Uji Muak7 Muak
Yang Diuji
(*.wav)
Muak8 Muak
Sedih1 Sedih
Sedih2 Muak Muak9 Takut
Sedih3 Muak Muak10 Muak
Sedih4 Muak
Saya Ikut Sedih Presentase keberhasilan deteksi emosi muak
Sedih5
Serta Dalam adalah:
Kegiatan Itu Sedih6 Sedih
Sedih7 Sedih
Sedih8 Sedih Hasil pengujian Tidak Langsung untuk deteksi
Sedih9 Sedih emosi sedih dapat dilihat pada tabel 5.
Sedih10 Sedih
Tabel 5 Hasil Pengujian Tidak Langsung Menggunakan Sample
Suara Alfira untuk Deteksi Emosi Senang
Presentase keberhasilan deteksi emosi sedih
adalah: Data Suara
Kalimat Yang
Yang Diuji Hasil Uji
Diuji
(*.wav)
Senang1 Senang
Hasil pengujian Tidak Langsung untuk deteksi
emosi sedih dapat dilihat pada tabel 3. Senang2 Takut
Senang3 Takut
Tabel 3 Hasil Pengujian Tidak Langsung Menggunakan Sample Senang4 Marah
Suara Alfira untuk Deteksi Emosi Takut Saya Ikut Serta
Senang5 Senang
Dalam Kegiatan
Data Suara Senang6 Senang
Kalimat Yang Itu
Yang Diuji Hasil Uji Senang7 Muak
Diuji Senang8 Senang
(*.wav)
Takut1 Takut Senang9 Senang
Takut2 Sedih Senang10 Senang
Takut3 Muak Presentase keberhasilan deteksi emosi senang
Takut4 Sedih adalah:
Saya Ikut Serta
Takut5 Takut
Dalam Kegiatan
Takut6 Takut
Itu
Takut7 Takut
Takut8 Senang 4.2.1. Pengujian Langsung
Takut9 Takut
Takut10 Takut Pengujian ini dilakukan dengan menggunakan 10
Presentase keberhasilan deteksi emosi takut data suara menggunakan bahasa Indonesia. Hasil
adalah: pengujian langsung (Langsung) untuk deteksi emosi
marah pada 1 orang dapat dilihat pada Tabel 6.

33
A6 Seminar Nasional Teknologi Informasi 2016

Tabel 6 Hasil Pengujian Langsung Menggunakan Sample Suara Presentase keberhasilan dari deteksi emosi takut
Vine untuk Deteksi Emosi Marah
adalah:
Data Suara
Kalimat Yang
Yang Diuji Hasil Uji
Diuji Hasil pengujian Langsung untuk deteksi muak
(*.wav)
Marah1 Marah pada 1 orang dapat dilihat pada Tabel 9.
Marah2 Senang Tabel 9 Hasil Pengujian Langsung Menggunakan Sample Suara
Marah3 Muak Vine untuk Deteksi Emosi Muak
Marah4 Marah Data Suara
Saya Ikut Serta Kalimat Yang
Marah5 Senang Yang Diuji Hasil Uji
Dalam Kegiatan Diuji
Marah6 Marah (*.wav)
Itu Muak1 Muak
Marah7 Senang
Marah8 Senang Muak2 Muak
Marah9 Senang Muak3 Muak
Marah10 Muak Muak4 Muak
Saya Ikut Serta
Presentase keberhasilan deteksi emosi marah Muak5 Marah
Dalam Kegiatan
adalah: Muak6 Marah
Itu
Muak7 Marah
Muak8 Muak
Hasil pengujian Langsung untuk deteksi sedih Muak9 Muak
pada 1 orang dapat dilihat pada Tabel 7. Muak10 Marah
Presentase keberhasilan deteksi emosi muak adalah
Tabel 7 Hasil Pengujian Langsung Menggunakan Sample Suara
Vine untuk Deteksi Emosi Sedih

Data Suara Hasil pengujian Langsung untuk deteksi senang


Kalimat Yang pada 1 orang dapat dilihat pada Tabel 10.
Yang Diuji Hasil Uji
Diuji
(*.wav) Tabel 10 Hasil Pengujian Langsung Menggunakan Sample Suara
Sedih1 Sedih Vine untuk Deteksi Emosi Senang
Sedih2 Takut Data Suara
Kalimat Yang
Sedih3 Takut Yang Diuji Hasil Uji
Diuji
Sedih4 Takut (*.wav)
Saya Ikut Serta Senang1 Senang
Sedih5 Takut
Dalam Kegiatan Senang2 Senang
Sedih6 Takut
Itu Senang3 Senang
Sedih7 Marah
Sedih8 Takut Senang4 Senang
Saya Ikut Serta
Sedih9 Takut Senang5 Senang
Dalam
Sedih10 Sedih Senang6 Sedih
Kegiatan Itu
Presentase keberhasilan deteksi emosi sedih adalah: Senang7 Senang
Senang8 Senang
Senang9 Takut
Senang10 Senang
Hasil pengujian Langsung untuk deteksi takut
pada 1 orang dapat dilihat pada Tabel 8. Presentase keberhasilan deteksi emosi senang adalah:
Tabel 8 Hasil Pengujian Langsung Menggunakan Sample Suara
Vine untuk Deteksi Emosi takut

Data Suara
Kalimat Yang 5. PENUTUP
Yang Diuji Hasil Uji
Diuji
(*.wav)
Takut1 Takut Berdasarkan hasil pengujian terhadap program
Takut2 Takut dan pembahsan sebelumnya, dapat diambil kesimpulan
Takut3 Takut sebagai berikut.
Takut4 Takut 1. Dengan mengacu kepada Tabel 1, Tabel 2,
Saya Ikut Serta
Takut5 Senang Tabel 3, Tabel 4, Tabel 5 Maka
Dalam Kegiatan dapat ditarik kesimpulan bahwa tingkat akurasi
Takut6 Takut
Itu aplikasi pendeteksi emosi bervariasi yaitu tingkat
Takut7 Takut
akurasi untuk emosi Marah sebesar 50%, untuk
Takut8 Takut
emosi Sedih 70%, untuk emosi Takut sebesar
Takut9 Marah
60%, untuk emosi Muak sebesar 50%, dan untuk
Takut10 Marah

34
Seminar Nasional Teknologi Informasi 2016 A6

emosi senang sebesar 60% dengan keputusan [6] Fadhilah Syafira,Agus Buono, dan Bib Paruhum
akhir berdasarkan pencocokan pada database Silalahi, 2014. Pengenalan Suara Paru-Paru dengan
bahwa emosi yang didapat adalah emosi Sedih. MFCC sebagai Ekstraksi Ciri dan Backpropagation
sebagai Classifier. Bogor. Institut Pertanian Bogor.
2. Dengan Mengacu kepada Tabel 1, Tabel 2,
[7] Haryanto,S.Pd.2009. Pengertian Emosi.
Tabel 3, Tabel 4, Tabel 5 maka http://belajarpsikologi.com/pengertian-emosi/ ,
didapatkan nilai rentang frekuensi berdasarkan (Diakses pada 26 September 2015).
ciri – ciri emosi: [8] Jans Hendry. 2012. Dynamic Time Warping
 Marah = 1910 s/d 3.715,7 Algorithm. (Diakses Pada 12 Oktober).
 Sedih = 4173,4 s/d 8718,4 [9] Sri Waluyanti. 2008. Pengertian Sinyal Dasar Audio.
(Diakses Pada 12 Oktober).
 Takut = 1444,8 s/d 2.066,1
[10] Rena Latifa , 2012. Psikologi Emosi:Ekspresi Emosi.
 Muak = 1964 s/d 3212 https://sites.google.com/a/uinjkt.ac.id/renalatifa/article
 Senang = 3857,2 s/d 4881 s/bab-4-psikologi-emosi-ekspresi-emosi (Diakses Pada
3. Dengan mengacu kepada Tabel 6, Tabel 7, 17 November).
Tabel 8, Tabel 9, Tabel 10 Maka [11] Reza Dio Nugraha, Youllia Indrawaty, Rio Korio
dapat ditarik kesimpulan bahwa tingkat akurasi Utoro. 2014. Pengenalan Pola Ucapan Kata
aplikasi pendeteksi emosi bervariasi yaitu tingkat Menggunakan Metode Dynamic Time Warping(DTW)
Berbasis Multimedia Interaktif. Bandung. Institut
akurasi untuk emosi Marah sebesar 30%, untuk Teknologi Nasional.
emosi Sedih 20%, untuk emosi Takut sebesar [12] Reza Rianto, Youllia Indrawaty, Andriana Zulkarnain.
70%, untuk emosi Muak sebesar 60%, dan untuk 2014. Pengembangan Pembelajaran Kata Dalam
emosi senang sebesar 80% dengan keputusan Bahasa Indonesia Mengunakan Multimedia Interaktif
akhir berdasrkan pencocokan pada database Dan Speech Recognition. Bandung. Institut Teknologi
bahwa emosi yang didapat adalah emosi Senang. Nasional.
4. Dengan mengacu kepada Tabel 6, Tabel 7,
Tabel 8, Tabel 9, Tabel 10 maka
didapatkan nilai rentang frekuensi berdasarkan
ciri – ciri emosi:
 Marah = 446 s/d 5.598
 Sedih = 1.357 s/d 2.080,3
 Takut = 2.995,6 s/d 11.990,5
 Muak = 10533 s/d 68274,4
 Senang = 5872,4 s/d 11328,5
5. Pada aplikasi pendeteksi emosi ini perbedaan
kalimat tidak dapat mempengaruhi hasil akurasi
melainkan beberapa faktor eksternal seperti noise
dan emosi yang dibuat-buat oleh user

REFERENSI
[1] Ali Mustofa. 2007. Sistem Pengenalan Penutur
dengan Metode Mel-Frequency Wraping. Malang.
Universitas Brawijaya.
[2] Angga Setiawan, Achmad Hidayatno, R. Rizal Isnanto
. 2011. Aplikasi Pengenalan Ucapan dengan Ekstraksi
Mel-Frequency Cepstrum Coefficients (MFCC)
Melalui Jaringan Syaraf Tiruan (JST) Learning Vector
Quantization (LVQ) Untuk mengoperasikan kursor
computer. Semarang. Universitas Dipenogoro.
[3] Atik Charisma. 2013. Sistem Verifikasi Penutur
Menggunakan Metoda Mel Frequency Cepstral
Coefficeints-Vector Quantisation (MFCC-VQ) Serta
Sum Square Error (SSE) Dan Pengenalan Kata
Menggunakan Metoda Logika Fuzzy. Padang. Institut
Teknologi Padang.
[4] Darma Putra, Adi Resmawan. 2011. Verifikasi
Biometrika Suara Menggunakan Metode MFCC Dan
DTW. Bali. Universitas Udayana.
[5] Ersa Triansyah dan Youllia Indrawaty. 2015.
Implementasi Metode Pattern Recognition Untuk
Pengenalan Ucapan Huruf Hijayah. Bandung. Institut
Teknologi Nasional.

35

Anda mungkin juga menyukai