Faradiba*
Abstract
This research have been designed a structure of artificial neural network (ANN) with using
backpropagation to recognize signal pattern of human voice. The signal should first be processed with
Linear Predictive Coding (LPC). Linear Predictive Coding (LPC) used for extraction characteristic.
Producing matrix with 24 x50 orde which is then becoming input data for Artificial Neural Network
Backpropagation (ANN-BP). There nets consist of 4 layers. Those 4 layers are : 1 input layers with 24
neuron, 2 hidden layers which are devided as 15 neuron at the first hidden layer and 10 neuron at the
second, The last output with 5 neuron.For 5 training data, parameter characteristic value of net such
us: Learning rate value (alpha) = 0,05 and mu value (μ) = 10-3with using by sigmoid bipolar
activation function. The result of the research shows that the nets can recognize as 100 % of 25
trainning data, 74 % of 25 testing data.
PENDAHULUAN
Suara merupakan salah satu sarana Sistem keamanan berbasis suara dapat
untuk mengenali karakter seseorang. diaplikasikan diberbagai bidang kehidupan
Manusia bisa mengenali kondisi seseorang baik untuk kebutuhan industri maupun
dengan mendengar suaranya, sebagai rumah tangga seperti sistem pengecekan
contoh jenis kelamin, identitas pembicara, kehadiran karyawan, sistem keamanan
aksen, gaya bicara, emosi, dan kondisi rumah berbasis suara, password berangkas
kesehatan dari si pembicara (Putra, 2009). menggunakan suara serta masih banyak
Seiring dengan perkembangan teknologi contoh-contoh yang lainnya. Teknologi
muncul fenomena kebutuhan model yang menggunakan komputer berkembang
komputasi untuk pengenalan suara yang dengan pesat, hampir setiap individu di
tidak hanya bermanfaat untuk ilmu dunia memerlukan komputer sebagai alat
pengetahuan tetapi juga untuk aplikasi bantu untuk menyelesaikan masalahnya.
praktis, misalnya pada sistem keamanan Hampir semua sistem analog digantikan
berbasis suara. dengan sistem komputerisasi.
Keunggulannya adalah sistem
komputerisasi lebih mudah dalam
1
Faradiba Jurnal EduMatSains, Juli 2017 | Vol.2| No.1
2
Pengenalan Pola Sinyal Suara Manusia
struktur dan parameter jaringan (jumlah dengan nama lain sinyal analog adalah
node hidden layer, besarnya step size serta sinyal yang belum melalui proses apapun.
momentum) untuk mendapatkan Sedangkan sinyal nilai diskrit atau sinyal
performance jaringan yang optimum. digital adalah sinyal analog yang telah
Pencarian struktur dan parameter ini melalui proses sampling, quantization, dan
bertujuan agar jaringan dapat secara cepat encoding (Tumanan, 2008).
belajar dan dapat mengenali suara dengan Sampling adalah proses mengambil
error sekecil mungkin (Rudi A, 1999). nilai-nilai sinyal pada titik-titik diskrit
Sistem pengenalan suara yang sepanjang variabel waktu dari sinyal waktu
digambarkan pada blok diagram gambar 1. kontinyu, sehingga didapatkan sinyal waktu
Sinyal dapat didefinisikan sebagai kuantitas diskrit. Jumlah titik-titik yang diambil
fisik yang bervariasi seiring waktu atau setiap detik dinamakan sebagai sampling
variabel bebas lainnya yang menyimpan rate. Dalam melakukan sampling, perlu
suatu informasi. Contoh sinyal adalah: diperhatikan kriteria nyquist yang
suara manusia, kode morse, tegangan listrik menyatakan bahwa sebuah sinyal harus
di kabel telepon, variasi intensitas cahaya memiliki sampling rate yang lebih besar
pada sebuah serat optik yang digunakan dari 2 fm, dengan fm adalah frekuensi
pada telepon atau jaringan komputer, dan paling tinggi yang muncul disebuah sinyal.
lain-lainnya (Roberts M, 2004). fs ≥ 2 fm ; fs > 2 fm (1)
Sinyal dapat diklasifikasikan menjadi Quantization adalah proses
beberapa jenis yaitu: sinyal waktu kontinyu, memetakan nilai-nilai dari sinyal nilai
sinyal waktu diskrit, sinyal nilai kontinyu, kontinyu menjadi nilai-nilai yang diskrit,
sinyal nilai diskrit, sinyal random, dan sehingga didapatkan sinyal nilai diskrit.
sinyal non random. Sinyal waktu kontinyu Encoding adalah proses mengubah nilai-
3
Faradiba Jurnal EduMatSains, Juli 2017 | Vol.2| No.1
nilai sinyal menjadi bilangan biner (Roberts mudah daripada sinyal domain waktu. Di
M, 2004). domain frekuensi, sinyal direpresentasikan
2. Linear Predictive Coding (LPC) sebagai serangkaian nilai yang
Analisis sinyal adalah kegiatan menunjukkan banyaknya satuan sinyal yang
melakukan ekstraksi terhadap informasi berada di frekuensi tertentu. Transformasi
yang terdapat disuatu sinyal. Linear Fourier banyak digunakan untuk aplikasi
Predictive Coding (LPC) merupakan salah sains, misalnya: fisika, teori numerik,
satu teknik analisis sinyal percakapan yang pemrosesan sinyal, statistik, akustik, optik,
paling powerful dan menyediakan ekstraksi geometri, dan lain-lainnya (Brigham E,
fitur yang berkualitas baik dan efisien untuk 1988).
digunakan dalam perhitungan. LPC pertama 4. Jaringan Syaraf Tiruan (JST)
kali digunakan pada tahun 1978 untuk Jaringan syaraf tiruan (JST) adalah
membuat alat sintesis sinyal percakapan. sistem pemroses informasi yang
LPC melakukan analisis dengan cara mempunyai karakteristik mirip dengan
memperkirakan formant, memisahkan jaringan syaraf biologi. JST dibentuk
formant dari sinyal, yang dinamakan proses sebagai generalisasi model matematika dari
inverse filtering, lalu mengestimasi jaringan saraf biologi, dengan asumsi
intensitas dan frekuensi dari sinyal bahwa:
percakapan yang tersisa, yang disebut - Pemrosesan informasi terjadi pada banyak
residue. Karena sinyal percakapan elemen sederhana (neuron).
bervariasi seiring waktu, estimasi tersebut - Sinyal dikirimkan di antara neuron-neuron
dilakukan untuk setiap potongan kecil dari melalui penghubung-penghubung.
sinyal, yang dinamakan frame (Mark C. - Penghubung antar neuron memiliki bobot
2005). yang akan memperkuat atau memperlemah
3. Fast Fourier Transform (FFT) sinyal.
Transformasi Fourier merupakan - Untuk menentukan output, setiap neuron
metode untuk mentransformasikan sinyal menggunakan fungsi aktivasi yang
domain waktu menjadi sinyal domain dikenakan pada jumlahan input yang
frekuensi. Transformasi ini penting dalam diterima. Besarnya output ini selanjutnya
analisis sinyal karena karakteristik sinyal dibandingkan dengan suatu batas ambang.
domain frekuensi dapat diamati dengan Jaringan syaraf tiruan ditentukan oleh
lebih jelas dan dimanipulasi dengan lebih 3 hal, yaitu:
4
Pengenalan Pola Sinyal Suara Manusia
1. Pola hubungan antar neuron (disebut dalam pengenalan pola. Kelemahan ini bisa
arsitektur jaringan). ditanggulangi dengan menambahkan satu
2. Metode untuk menentukan bobot atau beberapa lapis tersembunyi diantara
penghubung (disebut metode training/ masukan dan keluaran. Meskipun
learning/ algoritma). penggunaan lebih dari satu lapis
3. Fungsi aktivasi (Siang J. 2005). tersembunyi memiliki kelebihan manfaat
Jaringan Syaraf Tiruan (JST) untuk beberapa kasus, tapi pelatihannya
memiliki kemampuan untuk belajar dan memerlukan waktu yang lama. Maka
beradaptasi terhadap masukan-masukannya. umumnya orang memulai mencoba dengan
Berdasarkan algoritma pelatihannya, JST sebuah lapis tersembunyi lebih dahulu
dapat dibedakan menjadi dua jenis, yaitu: (Siang J, 2005)
pelatihan terbimbing (supervised learning) 6. Back Propagation Neural Network
dan pelatihan tidak terbimbing (BPNN)
(unsupervised learning). Ada beberapa Jaringan Back Propagation Neural
metode yang biasa digunakan pada jaringan Network (BPNN) biasanya digunakan untuk
syaraf tiruan. Salah satunya adalah metode melakukan pengenalan pola, klasifikasi,
backpropagation. Jaringan Syaraf Tiruan pengolahan citra, dan pengambilan
adalah paradigma pemrosesan suatu keputusan. BPNN merupakan JST dengan
informasi yang terinspirasi oleh sistem sel pembelajaran yang supervised, artinya data
syaraf biologi, sama seperti otak yang pembelajaran terdiri dari vektor pasangan
memproses suatu informasi. input dan target (output yang diharapkan).
5. Tingkat Pengenalan Pelatihan suatu jaringan dengan algoritma
Kelemahan JST yang terdiri dari lapis backpropagation pada gambar 2 meliputi
tunggal membuat perkembangan JST dua tahap yaitu perambatan maju dan
menjadi terhenti pada sekitar tahun 1970-an. perambatan mundur. Selama perambatan
Penemuan metode backpropagation yang maju, tiap unit masukan (Xi) menerima
terdiri dari beberapa lapis membuka sebuah masukan sinyal ini ke tiap-tiap
kembali cakrawala. Terlebih setelah lapisan tersembunyi Z1,…..,Zp. Tiap unit
ditemukan berbagai aplikasi yang dapat tersembunyi ini kemudian menghitung
diselesaikan dengan Backpropagation aktivasinya dan mengirimkan sinyalnya (Zj)
membuat JST semakin diminati orang. JST ke tiap unit keluaran.
dengan lapis tunggal memiliki keterbatasan
5
Faradiba Jurnal EduMatSains, Juli 2017 | Vol.2| No.1
Gambar 2 Arsitektur Jaringan Lapis Jamak dengan Satu Lapis Unit Tersembunyi
(Laurene F, 1994)
METODE PENELITIAN
1. Perancangan Sistem dimaksud dengan akuisisi suara. Kemudian
Sistem yang dirancang adalah sebuah dirasakan ada perbedaan suara orang yang
sistem yang dapat mengenali suara baru dikenal dengan suara orang lain,
masukan dengan berbagai macam jenis dan proses inilah yang dinamakan ekstraksi ciri.
variasi masukan suara sesuai dengan Dalam kehidupan sehari-hari jika bertemu
rumusan masalah. Sistem hanya dapat seseorang terkadang lupa siapa orang yang
mengenali suara dari orang yang telah dimaksud, oleh karena itu perlu adanya
dilatih, sehingga jika diberikan suara proses mengingat, proses ini yang
masukan yang tidak tersimpan di dalam dinamakan klasifikasi dengan JST.
database maka tidak dapat dikenali. Namun 2. Suara
diharapkan variasi masukan sinyal suara Masukan suara yang digunakan pada
tidak akan mempengaruhi tingkat penelitian ini diperoleh dari pengambilan
keberhasilan sistem sehingga hasil yang sample suara wanita dewasa, pria dewasa
didapat valid. Sistem yang dirancang akan dan anak-anak dengan pengucapan kata
mengenali suara seseorang setelah melalui “HALO” untuk 5 data latih tiap orangnya.
beberapa proses. Hal ini dapat dianalogikan Suara yang direkam adalah suara dalam
jika pertama kali bertemu seseorang format WAV.
suaranya mulai dikenali, kondisi itulah yang
6
Pengenalan Pola Sinyal Suara Manusia
7
Faradiba Jurnal EduMatSains, Juli 2017 | Vol.2| No.1
menentukan berapa kali atau berapa jumlah 5. Fast Fourier Transform (FFT)
sample yang diinginkan. Fast Fourier Transrorm ini dilakukan
4. Linear Predictive Coding (LPC) untuk meningkatkan unjuk kerja sistem,
1. Preemphasis karena dengan adanya FFT maka perbedaan
Proses preemphasis dilakukan antara pola sinyal suara dengan pola sinyal
terhadap sinyal masukan untuk suara yang lain makin terlihat jelas. dimana
memperkecil daerah perubahan sinyal. data yang dihasilkan FFT merupakan
Sinyal suara dilewatkan pada suatu filter masukan bagi Jaringan Syaraf Tiruan (JST).
digital yang berfungsi untuk meratakan 6. Pelatihan dan Identifikasi dengan JST
spektral sinyal. Dalam proses pengolahan Backpropagation
sinyal wicara preemphasis filter diperlukan Pada tahap ini dilakukan pelatihan
setelah proses sampling. Tujuan dari dan identifikasi suara menggunakan JST
pemfilteran ini adalah untuk mendapatkan Backpropagation. Output dari sistem adalah
bentuk spektral frekuensi sinyal wicara suara yang terdeteksi baik dikenali sebagai
yang lebih halus. Dimana bentuk spektral target maupun tidak dikenali. Proses
yang relatif bernilai tinggi untuk daerah pelatihan dilakukan sampai jaringan
rendah dan cenderung turun secara tajam memperoleh nilai error target sekecil
untuk daerah fekuensi diatas. mungkin. Setelah syarat tersebut tercapai,
2. Reshapes maka dilakukan penyimpanan bobot dari
Proses ini digunakan untuk merubah setiap ruas pada jaringan. Bobot-bobot
ukuran matriks sesuai masukan yang tersebut nantinya akan digunakan pada
diharapkan. proses pengujian. Pelatihan JST
3. Windowing backpropagation melalui 3 fase yaitu fase
Pada langkah ini dilakukan fungsi maju, fase mundur, dan perubahan bobot.
weighting pada setiap frame yang telah Dalam konsep pelatihannya digunakan juga
dibentuk pada langkah sebelumnya. syarat agar pelatihan yang dilakukan
4. Analisis Autokorelasi berjalan dengan benar dan lancar sehingga
Pada tahap ini masing-masing frame mendapatkan keluaran seperti yang
yang telah di windowing diautokorelasikan diinginkan.
dengan nilai autokorelasi yang tertinggi 7. Pengujian Sistem
yaitu orde dari analisa LPC. Pada proses pengujian ini digunakan
beberapa suara uji untuk suara yang sudah
8
Pengenalan Pola Sinyal Suara Manusia
dilatih dan untuk menguji suara yang belum oleh sistem sehingga sistem diharapkan
dilatih sama sekali. Setiap suara yang diuji dapat mengenali dengan baik data yang di
untuk mengetahui apakah suara dapat masukan walaupun sebelumnya belum
dikenali dengan benar ke dalam klasifikasi pernah dilakukan pembelajaran tentang pola
yang sebenarnya, dikenali sebagai orang data masukan. Dari sistem tersebut dapat
lain, atau tidak dikenali sama sekali. dirumuskan sebagai berikut
Keakurasian akan dihitung dalam skala 𝑗𝑢𝑚𝑙𝑎ℎ𝑑𝑎𝑡𝑎𝑠𝑢𝑘𝑠𝑒𝑠
𝑅𝑅𝐷 = (3)
𝐽𝑢𝑚𝑙𝑎ℎ𝑑𝑎𝑡𝑎
persentase.
Dimana data sukses adalah jumlah data uji
8. Persentase Keberhasilan Sistem/Grade
yang berhasil dikenali, dan jumlah data
Success Sistem (GSS)
adalah data uji keseluruhan yang di ujikan
Grade Success Sistem(GSS) adalah
(Inayah N, 2008).
Presentase keberhasilan sistem (Grade
Success System). Dengan GSS dapat
HASIL DAN PEMBAHASAN
diketahui tingkat keberhasilan sistem yang
1. Penentuan Parameter Jaringan untuk
telah dibuat, hasil tersebut dapat
Proses Pelatihan
dirumuskan sebagai berikut:
Sinyal suara latih diperoleh dari 5
𝑅𝑇𝐷+𝑅𝑅𝐷
𝐺𝑆𝑆 = 𝑥100 (2) orang responden yang masing-masing
2
1. Result Training Data (RTD) responden terdiri dari 5 sinyal suara. Sinyal
Result Trainning Data (RTD) adalah suara uji diperoleh dari 5 orang responden
hasil dari uji data yang telah di latih yang masing-masing responden terdiri dari
sebelumnya, apakah sistem tersebut dapat 5 pola sinyal suara. Sinyal suara disimpan
mengenali dengan benar, tidak mengenali dalam bentuk format Waveform Audio
dengan benar, atau tidak mengenali sama (WAV). Pada proses selanjutnya
sekali. Dari sistem tersebut dapat Implementasi sistem dengan memanfaatkan
dirumuskan sebagai berikut toolbox Linear Predictive Coding (LPC)
𝑗𝑢𝑚𝑙𝑎ℎ𝑑𝑎𝑡𝑎𝑠𝑢𝑘𝑠𝑒𝑠
𝑅𝑇𝐷 = (3) dan Artificial Neural Network (ANN)
𝐽𝑢𝑚𝑙𝑎ℎ𝑑𝑎𝑡𝑎
dalam pemograman Matlab versi 7.1.
Dimana sukses adalah jumlah data masukan
Pengenalan pola suara dengan
yang berhasil dikenali, dan jumlah data
backpropagation adalah suatu proses agar
adalah data keseluruhan yang di ujikan.
jaringan dapat mengenali suara masukan
2. Result Random Data (RRD)
dengan benar. Namun, sebelum mengenali
Result Random Data adalah hasil dari
pola suatu masukan tentunya harus
uji data yang sama sekali belum dikenali
9
dilakukan pelatihan dengan nilai Sedangkan nilai parameter sistem yang
parameter yang benar sehingga jaringan diubah-ubah adalah Hidden layer = 1, 2, 3,
dapat mengenali suara dengan baik. Proses dan 4, jumlah neuron tiap hidden layer = 25,
pelatihan pada tugas akhir ini menggunakan 20, 15, 10 dan jumlah data latih = 5.
fungsi aktivasi sigmoid bipolar. Pengubahan nilai-nilai parameter ini
2. Fungsi Aktivasi Sigmoid Bipolar bertujuan untuk mengetahui kombinasi
Penelitian ini dilakukan menggunakan sistem yang memberikan waktu pelatihan
parameter - parameter yang di-set pada nilai yang paling optimal. Proses pelatihan
yang tetap adalah ; Error target = 0, dilakukan sebanyak tiga kali untuk masing-
Learning rate (Alpha) = 0.05, mu (μ) = 10-3. masing kombinasi parameter sistem.
Tabel 1. Hasil Pelatihan Jaringan untuk 5 data latih dengan Fungsi Aktivasi Sigmoid Bipolar
Parameter Pelatihan
Percobaan Mean Square
Hidden Ke- waktu Error (MSE)
Neuron Iterasi
Layer (detik)
1 137 45,844 9,127 x 10-6
2 15,10 2 844 405,58 9,453 x 10-6
3 112 37,27 1,785 x 10-6
Tingkat Keberhasilan pada proses tiap jaringan yang telah diuji yang
pengujian suara latih untuk 5 data latih mempunyai tingkat persentase tertinggi.
sebesar 100%. Sedangkan Tingkat Untuk 5 data latih Dengan perbandingan
keberhasilan pada proses pengujian suara kurva di atas maka jaringan yang memiliki
yang belum dilatih untuk 5 data latih 2 hidden layer lebih efektif digunakan
sebesar 48%. Tingkat keberhasilan ini dibandingkan dengan jaringan yang
diperoleh dari pemilihan masing-masing memiliki 1 atau 3 hidden layer.
12
Pengenalan Pola Sinyal Suara Manusia
14
Pengenalan Pola Sinyal Suara Manusia
15
Faradiba Jurnal EduMatSains, Juli 2017 | Vol.2| No.1
16