TESIS
TESIS
PERSETUJUAN
Komisi Pembimbing
Pembimbing 2 Pembimbing 1
Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,
PERNYATAAN
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan
dan ringkasan yang masing-masing telah disebutkan sumbernya.
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini :
Nama : Abdul Rahman Hakim
Nim : 147038053
Program Studi : Magister Teknik Informatika
Jenis Karya Ilmiah : Tesis
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royaliti Non-
Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
RIWAYAT HIDUP
DATA PRIBADI
DATA PENDIDIKAN
UCAPAN TERIMAKASIH
8. Bapak Prof. Dr. Muhammad Zarlis selaku Pembanding Pertama dan Bapak Dr.
Poltak Sihombing, M.Kom sebagai Pembanding Kedua, yang telah
memberikan saran dan masukan serta arahan yang baik demi penyelesaian
tesis ini.
9. Seluruh staf pegawai Program Studi Magister Teknik Informatika Fasilkom-
TI, serta teman-teman mahasiswa/i Kom A 2014 terutama teman-teman dekat
saya Sudirman, Muhammad Zulfansyuri Siambaton dan Terry Noviar
Panggabean yang telah banyak membantu penulis selama perkuliahan.
10. Dan seluruh pihak yang tidak dapat disebutkan satu persatu dalam tesis ini,
sekali lagi terimakasih atas segala bantuan dan doa yang telah di berikan.
Penulis menyadari bahwa penelitian ini masih jauh dari kata sempurna, ini
dikarenakan oleh keterbatasan, kemampuan dan pengetahuan penulis. Harapan
penulis, semoga penelitian ini bermanfaat bagi penulis khususnya dan pembaca pada
umumnya. Sekali lagi penulis mengucapkan terimakasih, semoga Allah SWT
membalas kebaikan yang telah di berikan.Aamiin.
ABSTRAK
Suara adalah fenomena fisik yang dihasilkan oleh getaran suatu benda yang berupa
sinyal analog dengan amplitudo yang berubah secara kontinu terhadap waktu. Suara
manusia merupakan salah satu sarana komunikasi yang sangat efektif. Pengolahan
suara merupakan konsep yang sangat penting untuk semua jenis sistem yang
membutuhkan interaksi manusia dalam kegiatan sehari-hari. Pengolahan suara dapat
dikategorikan menjadi empat jenis: Isolated Words, Connected Words, Continuous
Speech, Spontaneous Speech. Untuk meminimalkan masalah, maka sinyal suara
dengan format WAV akan ditransformasi ke sinyal frequensi menggunakan
transformasi Wavelet, Discrete Sine Transform dan Discrete fourier Transform.
Berdasarkan hasil penelitian transformasi Wavelet Discrete Sine Transform dan
Discrete fourier Transform memiliki keunikan tersendiri dalam mentransformasi
sinyal suara sehingga memperoleh hasil kinerja yang berbeda-beda. Persentase true
detection untuk transformasi Wavelet mencapai 80.2%, transformasi sinus mencapai
74.7%, sedangkan transformasi fourier mencapai 79.1%.
ABSTRACT
DAFTAR ISI
xiii
Universitas sumatera Utara
xiv
DAFTAR GAMBAR
PENDAHULUAN
84.56% -
4 Wavelet Trivedi, N. & Kumar, V.
90.42%
5 Attention Shift Decoding(ASD) Kalinli, O. & Narayanan. S 83.7%
BAB 2
TINJAUAN PUSTAKA
2.1 Suara
Suara atau gelombang akustik sesungguhnya merupakan kasus khusus dari suatu
gelombang elastik pada medium udara atau fluida. Manusia mulai memperhatikan
suara sejak lama, bahkan alat musik yang menghasilkan suara sudah ada di negara
Mesir, yang kemudian dikembangkan secara terstruktur oleh Al-Farabi, Al-Kindi dan
masyarakat China. Sebuah kenyataan yang cukup unik bahwa pada awalnya, musik
adalah sebuah disiplin ilmu yang mempelajari suara dan bunyi-bunyian, kemudian
oleh Al-Farabi digolongkan ke dalam ilmu hitung dan bukan ilmu seni.
Suara merupakan suatu hal yang unik dan memiliki range frekuensi tertentu
dan intensitas suara yang bisa dan tidak bisa didengar oleh manusia. Satuan untuk
mengukur intensitas suara tersebut adalah desibel (dB) diambil dari nama penemunya
yaitu Alexander Graham Bell yang dikenal sebagai penemu telepon, sedangkan satuan
dari frekuensi suara adalah Hertz, diambil dari nama seorang Fisikawan, Heinrich
Rudolf Hertz untuk menghargai jasa atas kontribusinya dalam bidang elektromagnetik
(Al-Azhar, M.N, 2011).
Menurut (Adler, J. & Azhar, M. 2013), suara dihasilkan melalui dua buah proses
yaitu Generation dan Filtering. Pada proses Generation, suara pertama kali akan
diproduksi melalui bergetarnya pita suara (vocal cord dan vocal fold) yang berada di
larynx untuk menghasilkan bunyi periodik. Bunyi periodik yang sifatnya konstan
tersebut kemudian disaring melalui vocal tract (juga disebut dengan istilah resonator
suara atau articulator) yang terdiri dari lidah (tongue), gigi (teeth), bibir (lips), langit-
langit (palate) dan lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran
(output) berupa bunyi vocal (vowel) dan atau bunyi konsonan (consonant) yang
membentuk kata-kata yang memiliki arti yang yang nantinya dapat dianalisa untuk
voice recognition.
Pada prinsipnya suara terdiri dari beberapa komponen yaitu, pitch, formant dan
spectogram yang dapat digunakan untuk mengidentifikasi karakteristik suara
seseorang untuk kepentingan voice recognition. Penjelasan dari masing-masing
komponen tersebut menurut adalah sbb:
a. Pitch. Frekuensi getar dari pita suara juga disebut dengan istilah frekuensi
fundamental (dasar) dengan notasi F0. Masing-masing orang memiliki pitch
yang khas (habitual pitch) yang sangat dipengaruhi oleh aspek fisiologis
larynx manusia. Pada kondisi pembicaraan normal, level habitual pitch
berkisar pada 50 s/d 250 Hz untuk laku-laki dan 120 s/d 500 Hz untuk
perempuan. Frekuensi F0 ini berubah secara konstan dan memberikan
informasi linguistic seseorang seperti pembeda antara intonasi dan emosi.
Analisa pitch dapat digunakan untuk melakukan voice recognition terhadap
suara seseorang yaitu melalui analisa statistic terhadap nilai minimum pitch,
maximum pitch dan mean pitch.
b. Formant. Formant adalah frekuensi-frekuensi resonansi dari filter, yaitu vocal
tract (articulator) yang meneruskan dan memfilter bunyi keluaran (output)
berupa kata-kata yang memiliki makna. Secara umum, frekuensifrekuensi
formant bersifat tidak terbatas namun, untuk mengidentifikasi seseorang paling
tidak ada 3 (tiga) format yang dianalisa yaitu, Formant 1 (F1), Formant 2 dan
Formant 3 (F3).
c. Spectrogram. Adalah representasi spectral (warna suara) yang bervariasi
terhadap waktu yang menunjukkan tingkat density (intensitas energi) spektral.
Dengan kata lain spectrogram adalah bentuk visualisasi dari masing-masing
nilai formant yang dilengkapi dengan level energi yang bervariasi terhadap
waktu. Level energi yang dikenal dengan dengan istilah formant bandwidth.
Pada kasus-kasus yang bersifat pemalsuan suara dengan teknik pitch shift atau
si subyek (tersangka) berusaha untuk menghilangkan karakter suara aslinya,
maka formant badwidht dapat digunakan untuk memetakan atau
mengidentifikasi suara aslinya. Dikarenakan spectogram memuat hal-hal yang
bersifat detil, maka spectogram oleh beberapa ahli dikenal dengan istilah sidik
jari suara (voice fingerprint). Spectogram membentuk pola umum yang khas
dalam pengucapan kata dan pola khusus masing-masing formant dalam
processor q(t)
p(t)
Sinyal dapat dikelompokkan menjadi dua jenis, yaitu sinyal analog (continue)
dan sinyal digital (diskit). Komponen-komponen untuk pengolahan sinyal harus
disesuaikan dengan jenis sinyalnya. Gambar 2.1 memperlihatkan secara diagram blok
perbedaan pengolahan sinyal secara analog dan digital.
Saat ini pengolahan sinyal banyak dilakukan secara digital. Hal ini dilakukan
karena kelebihan-kelebihan yang dimilikinya, antara lain:
1. Untuk menyimpan hasil pengolahan, sinyal digital lebih mudah dibandingkan
menyimpan sinyal analog. Untuk media penyimpanan dapat digunakan elemen
memori seperti Flash memory, CD/DVD, harddisk. Untuk penyimpanan sinyal
analog dapat digunakan pita tap magnetik.
2. Sinyal digital lebih kebal terhadap noise, karena bekerja dengan level tegangan
logika 0 dan 1.
3. Lebih kebal terhadap perubahan temperatur.
4. Lebih mudah memprosesnya, secara teori tidak ada batasan tergantung
kreativitas dan inovasi perancang.
Beberapa kelemahan sinyal digital:
1. Ada kehilangan informasi akibat pembulatan saat kuantisasi dan filtering saat
pembalikan kembali ke sinyal analog.
Diperlukan waktu proses yang lebih lama dibanding sinyal analog, yaitu waktu
sampling dan rekonstruksi ulang.
adalah fungsi dari satu atau lebih variabel independen. Proses ini dilakukan melalui
pemodelan sinyal.
Contoh fungsi matematis dari sinyal adalah:
( ) ( )
Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs(paru-paru),
glottis (dengan vocal cords) dan articulation tract (mouth/mulut dan nose
cavity/rongga hidung). Gambar 2.1 menunjukkan penampang melintang dari organ
wicara manusia. Untuk menghasilkan sebuah voiced sounds (suara ucapan), paru-paru
lungs menekan udara melalui epiglottis, vocal cords bergetar, menginterupt udara
melalui aliran udara dan menghassilkan sebuah gelombang tekanan quasi-periodic.
Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi
sinyal tekanan adalah pitch frequency atau fundamental frequency.
Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu
(nasals) juga merangsang nasal cavity (rongga hidung). Ketika rongga beresonansi,
akan menimbulkan radiasi sebuah gelombang suara yang mana merupakan sinyal
wicara. Kedua rongga beraksi sebagai resonators dengan karacteristik frekuensi
resonansi masing-masing, yang disebut formant frequencies. Pada saat rongga mulut
dapat mengalami perubahan besar, kita mampu untuk menghasilkan beragam pola
ucapan suara yang berbeda.
Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal tract
lebih menyerupai noise (derau). Gambar 2.3 menampilkan proses produksi suara-
suara /a/, dan /f/.(Fadlisyah. 2013).
Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu,
dalam hal ini ketika diamati pada durasi yang sangat pendek (5 sampai 100 mili detik)
karakteristiknya masih stasioner. Tetapi bilamana diamati dalam durasi yang lebih
panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk merefleksikan suara
ucapan yang keluar dari pembicara.
Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan
menampilkannya dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang
dimana sinyal wicara tidak diproduksi, unvoice (U) dimana vocal cord tidak
berfibrasi, dan yang ketiga adalah voiced (V) dimana vocal cord bervibrasi secara
periodik sehingga menggerakkan udara ke kerongkongan melalui mekanisme akustik
sampai keluar dari mulut dan menghasilkan sinyal wicara.
Sinyal digital merupakan bentuk sampling dari sinyal analog. Sinyal digital
pada dasarnya di code-kan dalam bentuk biner (Hexa). Besarnya nilai suatu sinyal
digital dibatasi oleh lebarnya atau jumlah bit (bandwidth). Jumlah bit juga sangat
mempengaruhi nilai akurasi sinyal digital Gambar 2.6 mengilustrasikan sinyal digital.
2.7 Al-Qur’an
Al-Qur’an yang secara harfiah berarti “bacaan sempurna” merupakan suatu nama
pilihan Allah yang sungguh tepat, karena tiada satu bacaan pun sejak manusia
mengenal tulis-baca lima ribu tahun yang lalu yang dapat menandingi Al-Qur’an Al-
Karim, bacaan sempurna lagi mulia itu.
Tiada bacaan semacam Al-Qur’an yang dibaca oleh ratusan juta orang yang
tidak mengerti artinya dan atau tidak dapat menulis dengan aksaranya. Bahkan dihafal
huruf demi huruf oleh orang dewasa, remaja dan anak-anak.
(١)
(٢)
(٣)
(٤)
(٥)
(٦)
(٧)
(٨)
(٩)
(١٠)
(١١)
(١٢)
(١٣)
2.8 Transformasi
Transformasi merupakan perubahan suatu bentuk, unsur, struktur menjadi bentuk
lainya dengan menambah, mengurangi atau menata kembali unsur-unsurnya.
39 35 30 28 58 18 21 15
36 28 38 18 1 0 20 3
( ) { √ …………………………………… ( 2.4)
Keterangan :
- C(u) : Hasil Transformasi Cosine
- N : Jumlah Sinyal Suara
- F(x) : Nilai Sinyal Suara
- X : Index Sinyal Suara
- U : Index Transformasi
( ) ∑ ( ) ( ) ……………………….. (2.5)
Keterangan :
- F(u) : Hasil Transformasi Fourier
- N : Jumlah Sinyal Suara
BAB 3
METODOLOGI PENELITIAN
Berdasarkan gambar 3.1 dapat dijelaskan bahwa alur kerja penelitian secara
umum dimulai dengan mengidentifikasi sebuah masalah yang akan diteliti, kemudian
menetapkan tujuan penelitian dan dilanjutkan dengan mendesain sebuah sistem yang
akan digunakan untuk menyelesaikan sebuah masalah yang akan dibangun, kemudian
pada tahap selanjutnya yaitu melakukan pengumpulan sampel suara khususnya surah
ar-rahmaan ayat 1-13, setelah memperoleh data sampel suara, tahapan selanjutnya
yaitu mengimplementasikan sistem sesuai dengan tujuan penelitian dan diteruskan
untuk menguji coba sistem, dan tahapan terakhir setelah menguji coba sistem yaitu
tahapan pengukuran unjuk kerja sistem untuk masing-masing transformasi sehingga
dapat diambil kesimpulan terhadap penelitian.
Sampel bacaan
Transformasi Transformasi Transformasi
Wavelet Cosinus Fourier
Sebuah sinyal digital atau sampel suara rekaman ayat Al Quran sebelum
ditransformasikan ke masing-masing transformasi maka sinyal tersebut dilakukan
preprocessing terlebih dahulu atau mambaca nilai-nilai daripada sinyal digital tersebut
dan dilanjutkan dengan ekstraksi cirri atau mengelompokkan nilai-nilai sinyal menjadi
sebuah picth suara dan nilai dari picth suara tersebutlah yang akan ditransformasikan
ke transformasi wavelet, discrete cosine transform (DCT) dan transformasi fourier
sehingga masing-masing transformasi menghasilkan sebuah energi dari sampel suara
rekaman yang diinputkan yang selanjutnya energi tersebut akan digunakan sebagai
nilai acuan untuk pengujian.
3.5 Tansformasi
Model transformasi yang digunakan pada sistem ini adalah jenis transformasi Wavelet
dekomposisi Averages and Differences, DCT, dan Fourier diagram alir dari masing-
masing transformasi yang ditunjukkan pada Gambar 3.3, Gambar 3.4, Gambar 3.5
berikut ini :
Mulai
Input sampel
Hitung Transformasi
Averages[k]:=Averages[i]+Averages[i+1]/2
Differences[k]:=Differences[i]+Differences[i+1]/2
i:=i+1
Tidak
i <= N
Ya
Hasil
Tranformasi
Wavelet
Selesai
Pada tahap ini, sistem menerima inputan nilai sinyal, struktur nilai sinyal
merupakan hasil dari proses baca file dan selanjutnya sistem melakukan perhitungan
transformasi dengan membandingkan nilai tetangganya. Langkah-langkah ini terus diulang
hingga nilai i memenuhi perulangan maksimum.
Mulai
Input sampel
Hitung Transformasi
i:=i+1
Tidak
i >= N
Ya
Hasil
Tranformasi
Cosine
Selesai
Pada tahap ini, sistem menerima inputan nilai sinyal, struktur nilai sinyal
merupakan hasil dari proses baca file dan selanjutnya sistem melakukan perhitungan
transformasi dengan mengalikan akar dari 2 dibagi jumlah sinyal dengan nilai dari a(u) dan
dijumlahkan dengan mengalikan nilai sinyal dengan hasil dari cos PI dikali 2x ditambah satu
dikali dengan nilai u dan dibagikan dengan 2 dikalikan jumlah sinyal. Langkah-langkah ini
terus dilakukan hingga nilai x memenuhi perulangan maksimum.
Mulai
Input sampel
Hitung Transformasi
i:=i+1
Tidak
i >= N
Ya
Hasil
Tranformasi
Fourier
Selesai
Pada tahap ini, sistem menerima inputan nilai sinyal, struktur nilai sinyal
merupakan hasil dari proses baca file dan selanjutnya sistem melakukan perhitungan
transformasi dengan mengalikan nilai daripada sinyal dengan hasil exponensial. Langkah-
langkah ini terus diulang hingga nilai u memenuhi perulangan maksimum.
BAB 4
4.1 Hasil
Hasil yang dibahas meliputi pemilihan sampel pelatihan surat Ar-Rahmaan ayat 1-13,
pendefinisian sampling pola suara, dan pengukuran unjuk kerja sistem.
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(k)
(l)
(m)
Gambar 4.1 sinyal frekuensi (a) Ar-rahmaan ayat 1 (b) Ar-rahmaan ayat 2 (c) Ar-rahmaan ayat
3 (d) Ar-rahmaan ayat 4 (e) Ar-rahmaan ayat 5 (f) Ar-rahmaan ayat 6 (g) Ar-rahmaan ayat 7 (h)
Ar-rahmaan ayat 8 (i) Ar-rahmaan ayat 9 (j) Ar-rahmaan ayat 10 (k) Ar-rahmaan ayat 11 (l) Ar-
rahmaan ayat 12 (m) Ar-rahmaan ayat 13
Berdasarkan gambar 4.1 diatas pola sampling suara untuk masing-masing ayat 1
sampai 13 memiliki pola sampling suara yang berbeda dengan gelombang frequensi
yang berbeda dan mempunyai jumlah pitch yang berbeda pula.
Gambar 4.2 berikut ini menunjukkan sampling suara surat Ar-Rahmaan ayat
pertama referensi yang dihasilkan dari pengamatan beberapa sampel suara surat Ar-
Rahmaan ayat pertama (Gambar 4.1 (a)).
( )
( ) √ ( )∑ ( ) ( )
( ) { √
( ) ( )
C(0) = √ (1235*( ( )) + 2344*( ( )) +
√
( ) ( )
893*( ( )) + 1872*( ( )))
= 3172
( ) ( )
C(1) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))
= -21.2336
( ) ( )
C(2) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))
= 1105.065
( ) ( )
C(3) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))
= -111654
( ) ∑ ( )( ( ) ( ))
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= 1586
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( + (-472 ))
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( )
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( )
Dikarenakan masih ada bilangan imaginer pada perhitungan diatas maka hasil
tersebut di spectrumkan untuk memperoleh nilai yang real dengan cara :
| ( )| ( ( ) ( ) )
| ( )| ( )
= 1586
| ( )| ( ( ))
= 145.7198
| ( )| ( )
= 522
| ( )| ( )
= 145.7198
Tabel 4.1. Hasil Unjuk Kerja Sistem menggunakan Transformasi Wavelet dekomposisi Averages
and Differences
Jumlah Jumlah
True False
Suara Suara Ayat Ke
Detection Detection
Pelatihan Pengujian
1 6 1
2 4 3
3 5 2
4 6 1
5 5 2
6 5 2
91 91 7 6 1
8 5 2
9 6 1
10 5 2
11 7 0
12 7 0
13 6 1
Jumlah Data Benar 73 / 91 = 0.802
Jumlah Data Salah 18 / 91 = 0.197
Ayat Ke
Gambar 4.3 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan ayat 1-13
Menggunakan Transformasi Wavelet dekomposisi Averages and Differences
Pada gambar 4.3 grafik pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13
mengilustrasikan bagaimana transformasi wavalet dekomposisi Averages and
Differences bekerja dalam mengenali ayat-ayat Al Quran, khususnya pada surat Ar-
Rahmaan ayat 1-13. Pada masing-masing ayat hasil pengenalannya berbeda-beda,
untuk ayat 2 hanya dapat dikenali 4 sampel suara saja, untuk ayat 3,5,6,8 dan 10
berhasil dikenali 5 sampel suara, untuk ayat 1,4,7 dan 13 berhasil dikenali 6 sampel
suara sedangkan ayat 11 dan 12 berhasil dikenali semua sampel suara.
8 6 1
9 6 1
10 4 3
11 7 0
12 5 2
13 4 3
Jumlah Data Benar 68 / 91 = 0.747
Jumlah Data Salah 23 / 91 = 0.252
Unjuk kerja Discrete Cosine Transform (DCT) dalam mengenali ayat Al Quran
persentase kebenarannya mencapai 74.7 % dan persentase salah hanya 25.3 %.
Gambar 4.4 mengilustrasikan hasil unjuk kerja Discrete Cosine Transform (DCT) di
sajikan dalam bentuk grafik.
5 benar
4
3
2 salah
1
0
Ayat Ke
Gambar 4.4 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13 Menggunakan
Discrete Cosine Transform (DCT)
Pada gambar 4.4 grafik pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13
mengilustrasikan bagaimana Discrete Cosine Transform (DCT) bekerja dalam
mengenali ayat-ayat Al Quran, khususnya pada surat ar-rahmaan ayat 1-13. Pada
5
benar
4
3
2 salah
1
0
Ayat Ke
Gambar 4.5 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13 Menggunakan
Transformasi Fourier
Pada gambar 4.5 grafik pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13
mengilustrasikan bagaimana Transformasi Fourier bekerja dalam mengenali ayat-ayat
Al Quran, khususnya pada surat ar-rahmaan ayat 1-13. Pada masing-masing ayat hasil
pengenalannya berbeda-beda, untuk ayat 10 hanya dapat dikenali 4 sampel suara saja,
untuk ayat 4,81,3,5,7 dan 13 berhasil dikenali 5 sampel suara, dan pada ayat 2 4 6 8 9
dan 12 berhasil dikenali 6 sampel suara, sedangkan ayat 11 berhasil dikenali semua
sampel suara.
Hasil pengujian meununjukkan bahwa rata-rata sampel suara yang berhasil dikenali
dari transformasi Wavelet dekomposisi Averages and Differences, Discrete Cosine
Transform (DCT), Fourier mencapai 78.02 % sedangan rata sampel yang tidak
berhasil dikenali hanya 21.97 %. Gambar 4.6 menunjukkan grafik hasil unjuk kerja
sistem pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13 secara keseluruhan.
50
40
30 23 benar
18 19
20 salah
10
0
Transformasi Discrete Cosine Transformasi Fourier
Wavelet Transform (DCT)
Jenis Transformasi
Gambar 4.6. Grafik Unjuk Kerja Sistem Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13
Pada Gambar 4.6 grafik mengilustrasikan pengujian dan pengukuran unjuk kerja
sistem secara keseluruhan. Jumlah sampel suara yang dilatih adalah 91 sampel dan
yang diuji 91 sampel. Masing-masing transformasi memiliki tingkat keberhasilan
dalam proses pengenalan yang berbeda-beda. Untuk transformasi Wavelet
dekomposisi Averages and Differences sampel berhasil dikenali 73 atau sama dengan
80.2 % dan sampel yang tidak berhasil dikenali sebesar 18 atau sama dengan 19.8 %,
Untuk Discrete Cosine Transform (DCT) sampel berhasil dikenali mencapai 68 atau
sama dengan 74.7 % dan sampel yang tidak berhasil dikenali hanya 23 atau sama
dengan 25.3 %, sedangkan Untuk transformasi Fourier sampel berhasil dikenali
hingga 72 atau setara dengan 79.1 % dan sampel yang tidak berhasil dikenali sebesar
19 atau setara dengan 20.9 %.
4.2 PEMBAHASAN
Berdasarkan hasil penelitian yang telah dilakukan, tingkat keberhasilan proses
pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13 memperoleh persentase
BAB 5
5.1 Kesimpulan
Berdasarkan hasil penelitian diatas dapat diambil kesimpulan :
1. Unjuk kerja transformasi Wavelet dekomposisi Averages and Differences,
DCT dan Fourier masing-masing memiliki true detection yang berbeda.
Persentase true detection untuk transformasi Wavelet dekomposisi Averages
and Differences 80.2 %, untuk Discrete Cosine Transform (DCT) tingkat true
detection 74.7 %, sedangkan transformasi Fourier tingkat true detection
mencapai 79.1 %.
2. Ketiga transformasi ini sangat cocok digunakan sebagai salah satu pendekatan
untuk pengenalan suara.
3. Keunggulan transformasi Wavelet adalah dalam proses perhitungan pola
sampling hanya dengan membandingkan nilai tetangganya sehingga sangat
hemat memory, keunggulan DCT adalah dalam proses perhitungan pola
sampling suara dengan menggunakan fungsi cos, sedangkan perhitungan pola
sampling suara dengan menggunakan gabungan fungsi sin dan cos adalah
keunggulan dari transformasi Fourier.
4. Ketiga transformasi ini mampu bekerja dengan baik pada sampling suara yang
tidak mengandung noise.
5. Transformasi Wavelet dekomposisi Averages and Differences lebih unggul
dari transformasi DCT dan Fourier, dan transformasi Wavelet dekomposisi
Averages and Differences sangat cocok digunakan untuk membuat sistem
pengenalan suara.
5.2 Saran
Saran untuk penelitian lanjutan :
1. Menambahkan pendekatan untuk menghapus noise pada sampling suara
sebelum sampling suara ditransformasikan.
2. Menambahkan pendekatan uji statistika dan menghitung jarak (distance) pada
tiap-tiap sampling suara.
3. Proses pelatihan dan pengujian dilakukan secara real time.
DAFTAR PUSTAKA
Adler, J. & Azhar, M. 2013. Identifikasi Suara Dengan Matlab Sebagai Aplikasi
Jaringan Syaraf Tiruan. Telekontran, Vol. 1, No. 1, Januari 2013.
Al-Azhar, M.N, 2011. Audio Forensic: Theory And Analysis. Pusat Laboratorium
Forensik Polri Bidang Fisika Dan Komputer Forensik, 2011.
Al-Irhaim, Y.F. & Saeed, E.G. 2010. Arabic Word Recognition Using Wavelet Neural
Network. ئ ؤ ي ث ث ي م 29‐30/Nov.2010.
Anusuya, M.A. & Katti, S.K. 2009. Speech Recognition By Machine: A Review.
(Ijcsis) International Journal Of Computer Science And Information Security
Vol. 6, No. 3, 2009
As-Suyuthi & Jalaluddin. 2008. Sebab Turunnya Ayat Al-Qur’an. Gema Insani:
Jakarta.
Fadlisyah & Bustami. 2013. Pengolahan suara. Penerbit Graha Ilmu. Yogyakarta.
Kaur, S. & Kaur, E.G. 2013. Enhancement Of Speech Recognition Algorithm Using
Dct And Inverse Wave Transformation. Sukhdeep Kaur Et Al Int. Journal Of
Engineering Research And Applications Vol. 3, Issue 6, Nov-Dec 2013,
Pp.749-754.
Sanjoyo, S. 2008. Membuka Tabir Pintu Langit Jilid 2 Noura Book Publising.
Wea K.S.M. & Sudiarto, W. 2010. Aplikasi Player Untuk Menjalankan File Wave
Yang Terkompresi Dengan Metode Huffman. Jurnal Informatika, Volume 6
Nomor 1, April 2010