Thesis - Analisis Perbandingan Discrete Wavelet Transform, Discrete Cosine Transform Dan Fourier Transform Pada Proses Pengenalan Pola Suara

ANALISIS PERBANDINGAN DISCRETE WAVELET
TRANSFORM, DISCRETE COSINE TRANSFORM

DAN FOURIER TRANSFORM PADA PROSES
PENGENALAN POLA SUARA
TESIS
ABDUL RAHMAN HAKIM

147038053
PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2016
Universitas sumatera Utara

ANALISIS PERBANDINGAN DISCRETE WAVELET
PENGENALAN POLA SUARA
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah

Magister Teknik Informatika
ABDUL RAHMAN HAKIM

147038053
PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
MEDAN
2016

ii
PERSETUJUAN
Judul : ANALISIS PERBANDINGAN DISCRETE WAVELET

PENGELANAN POLA SUARA
Nama : ABDUL RAHMAN HAKIM
Nomor Induk Mahasiswa : 147038053
Program Studi : MAGISTER TEKNIK INFORMATIKA
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
Komisi Pembimbing
Pembimbing 2 Pembimbing 1
Dr. Rahmat W. Sembiring, M.Sc, IT Prof. Dr. Herman Mawengkang

NIP. 19650523 199203 1 003 NIP. 19461128 197403 1 001
Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,
Prof. Dr. Muhammad Zarlis

NIP. 19570701 198601 1 003

iii
PERNYATAAN
ANALISIS PERBANDINGAN DISCRETE WAVELET TRANSFORM,

DISCRETE COSINE TRANSFORM DAN FOURIER TRANSFORM
PADA PROSES PENGENALAN POLA SUARA
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan
dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 02 Juli 2016
Abdul Rahman Hakim

147038053

iv
PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini :
Nama : Abdul Rahman Hakim
Nim : 147038053
Program Studi : Magister Teknik Informatika
Jenis Karya Ilmiah : Tesis
Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Sumatera Utara Hak Bebas Royaliti Non-Eksklusif (Non-Exclusive
Royality Free Right) atas tesis saya yang berjudul :
ANALISIS PERBANDINGAN DISCRETE WAVELET TRANSFORM,

DISCRETE COSINE TRANSFORM DAN FOURIER TRANSFORM
PADA PROSES PENGENALAN POLA SUARA
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royaliti Non-
Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 02 Juli 2016
Abdul Rahman Hakim

147038053

v
Telah diuji pada

Tanggal : 02 Juli 2016
PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Muhammad Zarlis
Anggota : 1. Dr. Poltak Sihombing, M.Kom
2. Prof. Dr. Herman Mawengkang
3. Dr. Rahmat W. Sembiring, M.Sc, IT

vi
RIWAYAT HIDUP
DATA PRIBADI
NamaLengkap : Abdul Rahman Hakim

TempatdanTanggalLahir : Medan, 21 Agustus 1984
AlamatRumah : Jl. Jermal 15 Gg. Duyung No. 11 Medan
Telepon/Faks/Hp : 081224301984
E-mail : hakeem.cs@gmail.com
InstansiTempatBekerja : bank bjbCabang Medan
Alamat Kantor : Jl. IskandarMuda No. 23 D-E-F Medan
DATA PENDIDIKAN
SD :PercobaanNegeri 1 Medan TAMAT :1996

SMP :KemalaBhayangkari 1 Medan TAMAT :1999
SMA :Negeri 10 Medan TAMAT :2002
S1 :IlmuKomputer USU TAMAT :2006
S2 : TeknikInformatika USU TAMAT :2016

vii
UCAPAN TERIMAKASIH
Alhamdulillah, pertama sekali dan yang paling utama, penulis mengucapkan

puji dan syukur ke hadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-
Nya kepada penulis, dan juga junjungan kita Nabi Muhammad SAW atas do’a dan
kasih sayang Beliau sehingga penulis dapat menyelesaikan tesis ini dengan sebaik-
baiknya. Penulis mengucapkan terimakasih yang tak terhingga kepada:
1. Ayahanda tercinta Prof. Dr. Muhammad Zarlis, dan Ibunda tercinta Nurma,
atas do’a, dukungan dan kasih sayangnya kepada Penulis, sehingga Penulis
mempunyai semangat juang yang tinggi dalam penyelesaian tesis ini.
2. Istri tercinta dan tercantik sejagat raya Putri Nesia Dahlius, SH, MH dan Anak
tersayang yang paling soleh, ganteng dan lucu sedunia Danish Al Kindi, atas
do’a, dukungan dan kasih sayangnya kepada Penulis, sehingga Penulis
mempunyai semangat juang yang tinggi dalam penyelesaian tesis ini.
3. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH.,
M.Hum.
4. Dekan Fasilkom-TI Universitas Sumatera Utara, Bapak Prof. Dr. Opim S.
Sitompul.
5. Ketua Program Studi Magister Teknik Informatika Fasilkom-TI, Bapak Prof.
Dr. Muhammad Zarlis, atas kesempatan yang telah diberikan kepada penulis
untuk dapat mengikuti dan menyelesaikan pendidikan Program Magister
Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi
Universitas Sumatera Utara.
6. Sekretaris Program Studi Teknik Informatika, Bapak M. Andri Budiman, ST,
M.Comp.Sc, MEM., beserta seluruh Staf Pengajar Program Studi Magister
Teknik Informatika Fasilkom-TI Universitas Sumatera Utara.
7. Bapak Prof. Dr. Herman Mawengkang selaku Pembimbing Utama, demikian
juga kepada Dr. Rahmat W. Sembiring, M.Sc, IT selaku Pembimbing Kedua,
atas bimbingan, pengarahan dan dorongan yang telah diberikan selama
penyusunan tesis ini, yang dengan penuh kesabaran menuntun dan
membimbing penulis hingga selesainya tesis ini dengan baik.

viii
8. Bapak Prof. Dr. Muhammad Zarlis selaku Pembanding Pertama dan Bapak Dr.
Poltak Sihombing, M.Kom sebagai Pembanding Kedua, yang telah
memberikan saran dan masukan serta arahan yang baik demi penyelesaian
tesis ini.
9. Seluruh staf pegawai Program Studi Magister Teknik Informatika Fasilkom-
TI, serta teman-teman mahasiswa/i Kom A 2014 terutama teman-teman dekat
saya Sudirman, Muhammad Zulfansyuri Siambaton dan Terry Noviar
Panggabean yang telah banyak membantu penulis selama perkuliahan.
10. Dan seluruh pihak yang tidak dapat disebutkan satu persatu dalam tesis ini,
sekali lagi terimakasih atas segala bantuan dan doa yang telah di berikan.
Penulis menyadari bahwa penelitian ini masih jauh dari kata sempurna, ini
dikarenakan oleh keterbatasan, kemampuan dan pengetahuan penulis. Harapan
penulis, semoga penelitian ini bermanfaat bagi penulis khususnya dan pembaca pada
umumnya. Sekali lagi penulis mengucapkan terimakasih, semoga Allah SWT
membalas kebaikan yang telah di berikan.Aamiin.
Medan, 02 Juli 2016

Penulis,
Abdul Rahman Hakim

147038053

ix
ABSTRAK
Suara adalah fenomena fisik yang dihasilkan oleh getaran suatu benda yang berupa
sinyal analog dengan amplitudo yang berubah secara kontinu terhadap waktu. Suara
manusia merupakan salah satu sarana komunikasi yang sangat efektif. Pengolahan
suara merupakan konsep yang sangat penting untuk semua jenis sistem yang
membutuhkan interaksi manusia dalam kegiatan sehari-hari. Pengolahan suara dapat
dikategorikan menjadi empat jenis: Isolated Words, Connected Words, Continuous
Speech, Spontaneous Speech. Untuk meminimalkan masalah, maka sinyal suara
dengan format WAV akan ditransformasi ke sinyal frequensi menggunakan
transformasi Wavelet, Discrete Sine Transform dan Discrete fourier Transform.
Berdasarkan hasil penelitian transformasi Wavelet Discrete Sine Transform dan
Discrete fourier Transform memiliki keunikan tersendiri dalam mentransformasi
sinyal suara sehingga memperoleh hasil kinerja yang berbeda-beda. Persentase true
detection untuk transformasi Wavelet mencapai 80.2%, transformasi sinus mencapai
74.7%, sedangkan transformasi fourier mencapai 79.1%.
Kata kunci : Suara, Pengolahan Suara, Wavelet, Discrete Cosine Transform,

Discrete fourier Transform.

x
ABSTRACT
Voice is a physical phenomenon generated by the vibration of an object in the form of

analog signals with amplitude changes continuously with time. The human voice is a
highly effective means of communication. Voice Recognition is a very important
concept for all types of systems that require human interaction in our daily activities.
Voice Recognition can be categorized into four types: Isolated Words, Words
Connected, Continuous Speech, Spontaneous Speech. To minimize the problem, then
the sound signal with WAV format will be transformed to the frequency signal using
Wavelet transform, Discrete Sine Transform and Discrete Fourier Transform. Based
on Discrete Wavelet transform research results Sine Transform and Discrete Fourier
Transform is unique in transforming the sound signal so as to obtain performance
results vary. The percentage of true detection for Wavelet transforms reached 80.2%,
the transformation of sinus reached 74.7%, while the Fourier transformation reached
79.1%.
Keywords : Voice, Voice Recognition, Wavelet, Discrete Cosine Transform,

Discrete fourier Transform.

xi
DAFTAR ISI
HALAMAN JUDUL ...................................................................................... i

PENGESAHAN .............................................................................................. ii
PERNYATAAN ORISINALITAS ............................................................... iii
PERSETUJUAN PUBLIKASI ..................................................................... iv
PANITIA PENGUJI ...................................................................................... v
RIWAYAT HIDUP ........................................................................................ vi
UCAPAN TERIMA KASIH ......................................................................... vii
ABSTRAK ..................................................................................................... ix
ABSTRACT .................................................................................................... x
DAFTAR ISI .................................................................................................. xi
DAFTAR TABEL ........................................................................................... xiii
DAFTAR GAMBAR ...................................................................................... xiv
BAB I PENDAHULUAN .............................................................................. 1

1.1. Latar Belakang ............................................................................. 1
1.2. Rumusan Masalah ........................................................................ 4
1.3. Batasan Masalah .......................................................................... 4
1.4. Tujuan Penelitian ......................................................................... 5
1.5. Manfaat Penelitian........................................................................ 5
BAB II TINJAUAN PUSTAKA ................................................................... 6

2.1. Suara ............................................................................................ 6
2.2. Pengenalan Suara ......................................................................... 8
2.3. Pengertian Sinyal ........................................................................ 9
2.4. Pembangkitan Sinyal Suara Manusia ......................................... 11
2.5. Sinyal dan Sistem ....................................................................... 14
2.6. Format .wav ................................................................................. 15
2.7. Al-Qur’an ..................................................................................... 16
2.7.1. Keotentikan Al-Qur’an ...................................................... 16
2.7.2. Bukti-Bukti Kesejarahan .................................................. 17

xii
2.7.3. Surat Ar-Rahmaan ............................................................ 18

2.8. Transformasi ............................................................................... 20
2.8.1 Transformasi Wavelet ........................................................ 20
2.8.1.1 Dekomposisi Averages and Differences ................ 20
2.8.2. Discrete Cosine Transform (DCT) ................................... 21
2.8.3. Discrete Fourier Transform (DFT) .................................. 22
BAB III METODOLOGI PENELITIAN .................................................... 24

3.1. Tahapan Penelitian ...................................................................... 24
3.2. Diagram Alur Kerja Penelitian ................................................... 24
3.3. Data Dan Peralatan Penelitian Yang Digunakan ......................... 25
3.4. Skema Sistem .............................................................................. 25
3.5. Transformasi ............................................................................... 26
3.6. Paramater Pengukuran Evaluasi Unjuk Kerja Sistem ................ 29
BAB IV HASIL DAN PEMBAHASAN ........................................................ 30

4.1. Hasil ............................................................................................ 30
4.1.1. Sampel pelatihan surat Ar-Rahmaan ayat 1-13 ................. 30
4.1.2. Hasil Sampling pola suara ................................................ 32
4.1.3 Proses Kinerja Transformasi ............................................. 33
4.1.3.1 Perhitungan Transforamasi Wavelet dekomposisi
Averages and Differences .................................... 34
4.1.3.2 Perhitungan Transformasi Sinus ......................... 34
4.1.3.3 Perhitungan Transformasi Fourier ...................... 35
4.1.4 Pengukuran Unjuk Kerja Sistem ...................................... 37
4.2. Pembahasan ................................................................................ 43
BAB V KESIMPULAN DAN SARAN ......................................................... 45

5.1. Kesimpulan .................................................................................. 45
5.2. Saran ............................................................................................ 46
DAFTAR PUSTAKA ..................................................................................... 47

LAMPIRAN

DAFTAR TABEL
Tabel 1.1. Informasi yang Diperoleh Dari Suara .................................................. 2

Tabel 4.1. Hasil Unjuk Kerja Sistem menggunakan Transformasi Wavelet
dekomposisi Averages and Differences .......................................................... 38
Tabel 4.2. Hasil Unjuk Kerja Sistem menggunakan DCT ............................................. 39
Tabel 4.3. Hasil Unjuk Kerja Sistem menggunakan Transformasi Fourier .................... 41
Tabel 4.4. Hasil Unjuk Kerja Sistem Secara Keseluruhan ............................................... 42
xiii
xiv
DAFTAR GAMBAR
Gambar 2.1. Perbandingan Pengolahan Sinyal Analog dan Digital ........................ 11

Gambar 2.2. Organ Wicara Manusia ....................................................................... 12
Gambar 2.3. Proses Produksi Suara ......................................................................... 13
Gambar 2.4. Contoh Sinyal Wicara Ucapan “Selamat Datang” .............................. 14
Gambar 2.5. Sinyal Analog ...................................................................................... 15
Gambar 2.6. Sinyal Digital ...................................................................................... 15
Gambar 3.1. Alur Kerja Penelitian Secara Umum ................................................... 24
Gambar 3.2. Skema Sistem Secara Keseluruhan ..................................................... 25
Gambar 3.3. Diagram Alir Transformasi Wavelet ................................................... 26
Gambar 3.4. Diagram Alir Discrete Cosine Transform ........................................... 27
Gambar 3.5. Diagram Alir Transformasi Fourier ................................................... 28
Gambar 4.1. Sinyal Frekuensi (a) Ar-Rahmaan ayat 1 (b) Ar-Rahmaan ayat 2 (c)
Ar-Rahmaan ayat 3 (d) Ar-Rahmaan ayat 4 (e) Ar-Rahmaan ayat 5
(f) Ar-Rahmaan ayat 6 (g) Ar-Rahmaan ayat 7 (h) Ar-Rahmaan ayat
8 (i) Ar-Rahmaan ayat 9 (j) Ar-Rahmaan ayat 10 (k) Ar-Rahmaan
ayat 11 (l) Ar-Rahmaan ayat 12 (m) Ar-Rahmaan ayat 13 ......... …. .. 30
Gambar 4.2. Nilai Sampling Suara ........................................................................... 33
Gambar 4.3. Grafik Pengenalan Ayat Al-quran Surat Ar-rahman ayat 1-13
Menggunakan Transformasi Wavelet dekomposisi Averages and
Differences ............................................................................................ 39
Gambar 4.4. Grafik Pengenalan Ayat Al-Quran Surat Ar-Rahmaan 1-13
Menggunakan Discrete Cosine Transform (DCT) .............................. 40
Gambar 4.5. Grafik Pengenalan Ayat Al-Quran Surat Ar-Rahmaan 1-13
Menggunakan Transformasi Fourier ................................................... 42
Gambar 4.6 Grafik Unjuk Kerja Sistem Pengenalan Ayat Al-Quran Surat Ar-
Rahmaan 1-13 ...................................................................................... 43

BAB 1
PENDAHULUAN
1.1. Latar Belakang

Suara merupakan sarana utama komunikasi antara manusia. suara diproduksi melalui
bergetarnya pita suara (vocal cord dan vocal fold) yang berada di larynx untuk
menghasilkan bunyi periodik. Bunyi periodik yang sifatnya konstan tersebut
kemudian disaring melalui vocal tract (juga disebut dengan istilah resonator suara
atau articulator) yang terdiri dari lidah (tongue), gigi (teeth), bibir (lips), langit-langit
(palate) dan lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran (output)
berupa bunyi vocal (vowel) dan atau bunyi konsonan (consonant) yang membentuk
kata-kata yang memiliki arti yang yang nantinya dapat dianalisa untuk voice
recognition (Al-Azhar, M.N. 2011).
Pengolahan suara merupakan konsep yang sangat penting untuk semua jenis
sistem yang membutuhkan interaksi manusia dalam kegiatan sehari-hari. Mengontrol
sistem dengan suara daripada menggunakan hardware misalnya keyboard atau keypad
pasti jauh lebih mudah dan menarik. Salah satu teknik yang bisa digunakan adalah
metode ekstraksi ciri dan klasifikasi yang memiliki pengaruh langsung dalam sistem
pengenalan suara (Al-Irhaim, Y.F. & Saeed, E.G. 2010).
Menurut (Anusuya, M.A. & Katti, S.K. 2009) sistem pengolahan suara dapat
dikategorikan menjadi empat jenis: Isolated Words, Connected Words, Continuous
Speech, Spontaneous Speech. Isolated Words, pengolahan kata terisolasi biasanya
memerlukan setiap ucapan yang tenang dari sisi sampel window. Sistem menerima
satu kata pada satu waktu dimana sistem mendengar pembicara untuk menunggu
antara ucapan-ucapan (biasanya sistem melakukan pengolahan selama jeda). Ucapan
terisolasi mungkin menjadi nama baik untuk kelas ini. Connected Words, system kata
terhubung hamper sama dengan kata terisolasi, tetapi memungkinkan terpisah ucapan-
ucapan untuk menjadi giliran yang sama dengan jeda minimal antara ucapan.
Continuous Speech,…

2
Continuous Speech, pengolahan suara berkelanjutan memungkinkan pengguna untuk

berbicara hampir secara alami, sementara komputer menentukan konten (pada
dasarnya ini dikte komputer). Pengolahan dengan kemampuan suara terus menerus
adalah hal yang paling sulit untuk diciptakan karena membutuhkan metode khusus
untuk menentukan batas ucapan. Spontaneous Speech, pada tingkat dasar, itu dapat
dianggap sebagai suara alami yang terdengar dan tidak terlatih. Sebuah sistem
pengolahan suara yang spontan harus mampu menangani berbagai fitur suara yang
alami.
Perkembangan teknologi yang semakin marak pada saat ini, mendorong
munculnya pemikiran dan penelitian bagaimana seseorang dapat berinteraksi dengan
komputer menggunakan suara ucapan sehingga tercipta komunikasi dan pertukaran
informasi yang baik. Suara merupakan suatu media komunikasi yang alami dan efisien
untuk mendapatkan informasi (Sunny, S. & Peter, D. dkk. 2010). Dalam kenyataannya
sehari-hari, seseorang selalu berkomunikasi untuk mendapatkan informasi dengan
orang lain. Suara identik dengan informasi maupun data yang ingin didapatkan
seseorang melalui berbagai media.
Terdapat beberapa penelitian-penelitian yang telah ada sebelumnya mengenai
suara salah satunya ialah pengenalan bacaan ayat Al-Qur’an. Pada penelitian ini,
penulis ingin menggali informasi pada bacaan ayat Al-Qur’an pada Surat Ar-
Rahmaan. Dari suara yang dihasilkan pada bacaan ayat Al-Qur’an pada Surat Ar-
Rahmaan, penulis melakukan sampling suara untuk mendapatkan nilai-nilai sinyal
yang kemudian diimplementasikan pada pola pengenalan suara.
Pada kesempatan ini, penelitian akan membandingkan efektifitas transformasi
Wavelet, DCT dan Fourier. Suara manusia yang awalnya berdomain waktu akan
diubah ke domain frekuensi oleh ketiga metode ini.
Berbagai pendekatan dan unjuk kerja dari berbagai penelitian pengenalan
suara disajikan dalam table 1.1
Tabel 1.1.Unjuk kerja berbagai pendekatan pengenalan suara.

Keakuratan
No Metode Peneliti
pengenalan
Al-Irhaim, Y.F. & Saeed,
1 Wavelet Neural Network 77%
E.G.

3
Linear Predictive Coding And 81.20% -

2 Sunny, S. & Peter, D.
Discrete Wavelet Transforms 90%
3 Discrete cosine transforms (DCT) Kaur, S. & Kaur, E.G. 98%
84.56% -
4 Wavelet Trivedi, N. & Kumar, V.
90.42%
5 Attention Shift Decoding(ASD) Kalinli, O. & Narayanan. S 83.7%
Pada sistem pengolahan suara ini, sistem harus dibangun berdasarkan

spesifikasi berikut :
1. Penggunaan komputasi yang efisien, hal ini mutlak diperlukan pada sistem
untuk pengembangan lanjut seperti sistem pengenalan Gender, pengenalan
ekspresi, dan lain-lain. Penggunaan komputasi yang terlalu komplek pada
sistem pengenalan ayat Al-Qur’an akan sangat berpengaruh pada ucapan yang
diucapkan.
2. Tingkat keakuratan pendeteksiaan sistem yang tinggi. Di dalam penelitian ini
parameter true detection dan false detection digunakan sebagai acuan
pengukuran unjuk kerja sistem.
Berbagai penelitian pengolahan suara yang telah dilakukan selalu melibatkan
komputasi yang komplek. Komputasi yang begitu komplek pada sistem pengolahan
suara telah diketahui dapat meningkatkan keakuratan unjuk kerja sistem, tetapi
komputasi yang komplek akan mempengaruhi cara pengucapan, terlebih lagi pada
sistem yang berhubungan dengan jumlah record yang besar (Kaur, S. & Kaur, E.G.
2013). Para peneliti berusaha menemukan komputasi yang hemat dan handal dalam
sistem pengolahan suara, dikarenakan sistem pengoalahan suara di masa mendatang
akan berhubungan dengan jumlah record yang besar seiring peningkatan laju
pertambahan penduduk dunia. Sampai saat ini para peneliti masih belum menemukan
komputasi yang begitu hemat dan handal untuk pengolahan suara yang akan
diterapkan pada sistem automatic speech recognition (ASR) atau sistem lainnya yang
berhubungan dengan suara. Pendekatan komputasi yang telah diterapkan masing-

4
masing memiliki kelebihan dan kekurangan. Pemilihan penggunaan komputasi yang

hemat dan handal tersebut menjadi tantangan dan konsentrasi dalam penelitian ini.
Teknologi komputasi semakin luas penggunaannya setelah ditemukan berbagai
transformasi. Berbagai transformasi yang umum dikenal luas diantaranya transformasi
laplace two side, wavelet, hankel, dan slant. Pada penelitian ini tranformasi wavelet,
discrete cosine transform (DCT) dan fourier akan dibandingkan dan diuji cobakan
untuk membangun sebuah sistem pengenalan ayat Al-Qur’an. Alasan pemilihan
transformasi wavelet, discrete cosine transform (DCT) dan fourier adalah dikarenakan
ketiga transformasi ini telah mewakilkan dari berbagai tranformasi. Pada discrete
cosine transform (DCT) sinyal akan di transformasikan menggunakan fungsi
Trigonometri dengan fungsi cosine, sedangkan pada fourier sinyal akan di
transformasikan menggunakan fungsi Trigonometri dengan gabungan fungsi cosine
dan sine dan pada wavelet sinyal hanya ditransformasikan dengan membandingkan
nilai tetangganya (Trivedi, N. & Kumar, V. 2011).
1.2. Rumusan Masalah

Adapun rumusan masalah dalam penelitian ini adalah bagaimana proses transformasi
Wavelet, DCT dan Fourier bekerja sehingga menghasilkan tingkat keakurasian
berbeda dalam pengenalan pola suara, dan penulis dapat menentukan hasil
transformasi mana yang menghasilkan tingkat keakurasian yang paling tinggi.
1.3. Batasan Masalah

Batasan masalah dalam penelitian ini adalah :
1. File yang menjadi objek penelitian adalah file berformat . wav, tanpa noise dan
bukanlah Tilawah.
2. Sampel suara yang digunakan adalah Surah Ar-Rahmaan ayat 1 sampai dengan
ayat 13
3. Penulis hanya akan menggunakan transformasi Wavelet, Cosine dan Fourier
untuk mengenali objek penelitian.

5
1.4. Tujuan Penelitian

Adapun tujuan dari penelitian ini adalah untuk mendapatkan tingkat keakurasian
pengenalan suara yang paling tinggi dari perbandingan ketiga transformasi yang
dipakai.
1.5. Manfaat Penelitian

Adapun manfaat penelitian yang diperoleh dari penelitian ini adalah sebagai berikut :
1. Komputasi yang digunakan dapat dijadikan model untuk pengembangan
sistem yang memanfaatkan jumlah data yang besar.
2. Sebagai evaluasi perbandingan terhadap berbagai pendekatan lainnya.

6
BAB 2
TINJAUAN PUSTAKA
2.1 Suara
Suara atau gelombang akustik sesungguhnya merupakan kasus khusus dari suatu
gelombang elastik pada medium udara atau fluida. Manusia mulai memperhatikan
suara sejak lama, bahkan alat musik yang menghasilkan suara sudah ada di negara
Mesir, yang kemudian dikembangkan secara terstruktur oleh Al-Farabi, Al-Kindi dan
masyarakat China. Sebuah kenyataan yang cukup unik bahwa pada awalnya, musik
adalah sebuah disiplin ilmu yang mempelajari suara dan bunyi-bunyian, kemudian
oleh Al-Farabi digolongkan ke dalam ilmu hitung dan bukan ilmu seni.
Suara merupakan suatu hal yang unik dan memiliki range frekuensi tertentu
dan intensitas suara yang bisa dan tidak bisa didengar oleh manusia. Satuan untuk
mengukur intensitas suara tersebut adalah desibel (dB) diambil dari nama penemunya
yaitu Alexander Graham Bell yang dikenal sebagai penemu telepon, sedangkan satuan
dari frekuensi suara adalah Hertz, diambil dari nama seorang Fisikawan, Heinrich
Rudolf Hertz untuk menghargai jasa atas kontribusinya dalam bidang elektromagnetik
(Al-Azhar, M.N, 2011).
Menurut (Adler, J. & Azhar, M. 2013), suara dihasilkan melalui dua buah proses
yaitu Generation dan Filtering. Pada proses Generation, suara pertama kali akan
diproduksi melalui bergetarnya pita suara (vocal cord dan vocal fold) yang berada di
larynx untuk menghasilkan bunyi periodik. Bunyi periodik yang sifatnya konstan
tersebut kemudian disaring melalui vocal tract (juga disebut dengan istilah resonator
suara atau articulator) yang terdiri dari lidah (tongue), gigi (teeth), bibir (lips), langit-
langit (palate) dan lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran
(output) berupa bunyi vocal (vowel) dan atau bunyi konsonan (consonant) yang
membentuk kata-kata yang memiliki arti yang yang nantinya dapat dianalisa untuk
voice recognition.

7
Pada prinsipnya suara terdiri dari beberapa komponen yaitu, pitch, formant dan
spectogram yang dapat digunakan untuk mengidentifikasi karakteristik suara
seseorang untuk kepentingan voice recognition. Penjelasan dari masing-masing
komponen tersebut menurut adalah sbb:
a. Pitch. Frekuensi getar dari pita suara juga disebut dengan istilah frekuensi
fundamental (dasar) dengan notasi F0. Masing-masing orang memiliki pitch
yang khas (habitual pitch) yang sangat dipengaruhi oleh aspek fisiologis
larynx manusia. Pada kondisi pembicaraan normal, level habitual pitch
berkisar pada 50 s/d 250 Hz untuk laku-laki dan 120 s/d 500 Hz untuk
perempuan. Frekuensi F0 ini berubah secara konstan dan memberikan
informasi linguistic seseorang seperti pembeda antara intonasi dan emosi.
Analisa pitch dapat digunakan untuk melakukan voice recognition terhadap
suara seseorang yaitu melalui analisa statistic terhadap nilai minimum pitch,
maximum pitch dan mean pitch.
b. Formant. Formant adalah frekuensi-frekuensi resonansi dari filter, yaitu vocal
tract (articulator) yang meneruskan dan memfilter bunyi keluaran (output)
berupa kata-kata yang memiliki makna. Secara umum, frekuensifrekuensi
formant bersifat tidak terbatas namun, untuk mengidentifikasi seseorang paling
tidak ada 3 (tiga) format yang dianalisa yaitu, Formant 1 (F1), Formant 2 dan
Formant 3 (F3).
c. Spectrogram. Adalah representasi spectral (warna suara) yang bervariasi
terhadap waktu yang menunjukkan tingkat density (intensitas energi) spektral.
Dengan kata lain spectrogram adalah bentuk visualisasi dari masing-masing
nilai formant yang dilengkapi dengan level energi yang bervariasi terhadap
waktu. Level energi yang dikenal dengan dengan istilah formant bandwidth.
Pada kasus-kasus yang bersifat pemalsuan suara dengan teknik pitch shift atau
si subyek (tersangka) berusaha untuk menghilangkan karakter suara aslinya,
maka formant badwidht dapat digunakan untuk memetakan atau
mengidentifikasi suara aslinya. Dikarenakan spectogram memuat hal-hal yang
bersifat detil, maka spectogram oleh beberapa ahli dikenal dengan istilah sidik
jari suara (voice fingerprint). Spectogram membentuk pola umum yang khas
dalam pengucapan kata dan pola khusus masing-masing formant dalam

8
pengucapan suku kata, sehingga spectrogram juga digunakan untuk

melakukan analisa identifikasi suara seseorang. Jika durasi rekaman unkown
cukup panjang, maka analisa spectogram juga dapat digunakan untuk
mempercepat pemilihan pengucapan kata-kata yang akan dianalisa dalam
rangka untuk mendapatkan jumlah minimal 20 kata untuk menunjukkan
kecocokkan suara suspect (tidak dikenal) dengan suara asli (dikenal) atau
pembanding.
Rekaman suara dimungkinkan mengandung noise. Dalam pengertian umum,
noise adalah suatu gangguan yang “didengar” orang lain, namun dalam istilah
telekomunikasi kata noise juga dipakai untuk istilah gangguan yang menimbulkan
kebisingan yang dapat didengar suatu sistem. Noise dapat terjadi dengan berbagai
macam cara, misalnya rekaman suara barang bukti terdapat bocoran yang terjadi
karena pada saat rekaman diperoleh tersangka berada pada lokasi dimana terdapat
suara-suara yang saling bercampur. Pada prinsipnya, noise jenis ini tidak dapat
dihilangkan tetapi dapat dikurangi keberadaan pada sumbernya (rekaman suara barang
bukti).
2.2 Pengenalan Suara

Pengenalan suara (juga dikenal sebagai Automatic Speech Recognition (ASR), atau
pengenalan suara komputer) adalah Proses mengkonversi sinyal suara ke urutan kata-
kata, melalui algoritma yang diimplementasikan kedalam program computer
(Anusuya, M.A. & Katti, S.K. 2009).
Pengenalan suara (speech recognition) adalah suatu proses untuk mengenali
huruf, kata atau kalimat yang diucapkan. Pengenalan suara lebih dikenal dengan
istilah Automatic Speech Recognition atau Computer Speech Recognition dimana
penggunaan sebuah mesin/komputer untuk mengenali sebuah suara atau identitas
seseorang dari suara yang diucapkan. Umumnya pengucap berbicara di depan
komputer/mesin kemudian komputer/mesin mengenali suara/identitas seseorang
dengan tepat sesuai yang diucapkan. Pengenalan pola suara dikenali ke dalam
berbagai level tugas, pengenalan dalam tingkat sinyal akustik berupa uji tingkatan
dalam susunan unit sub kata berupa fonem, kata, frase dan kalimat (Hanggarsari, P.N.,
Fitriawan, H. & Yuniati, Y. 2012).

9
2.3 Pengertian Sinyal

Sinyal adalah besaran fisis yang berubah menurut waktu, ruang, atau variable-
variabel bebas lainnya. Contoh sinyal : sinyal ucapan, ECG, dan EEG. Secara
matematis, sinyal adalah fungsi dari satu atau lebih variable independen. Proses ini
dilakukan melalui pemodelan sinyal (Fadlisyah & Bustami. 2013).
Sinyal adalah fenomena dari lingkungan yang terukur atau terkuantisasi,
sementara system merupakan bagian dari lingkungan yang menghubungkan sinyal
dengan sinyal lainnya atau dengan kata lain merespon sinyal masuk dengan
menghasilkan sinyal keluaran. Suara pembicaraan merupakan contoh dari sinyal
sementara system komunikasi telepon sendiri merupakan contoh dari sistem yang
menghubungkan sinyal-sinyal pembicaraan tersebut.
Sinyal analog adalah sinyal pemanfaatan gelombang elektromagnetik. Proses
pengiriman suara, misalnya pada teknologi telepon, dilewatkan melalui gelombang
elektromagnetik ini.
Sistem digital merupakan bentuk sampling dari sistem analog. Digital pada
dasarnya di code-kan dalam bentuk biner (atau Hexa). Besarnya nilai suatu sistem
digital dibatasi oleh lebarnya atau jumlah bit (bandwidth). Jumlah bit juga sangat
mempengaruhi nilai akurasi sistem digital.
Sinyal digital memiliki berbagai keistimewaan yang unik yang tidak dapat
ditemukan pada teknologi analog yaitu:
1. Mampu mengirimkan informasi dengan kecepatan cahaya yang dapat
membuat informasi dapat dikirim dengan kecepatan tinggi.
2. Penggunaan yang berulang–ulang terhadap informasi tidak mempengaruhi
kualitas dan kuantitas informasi itu sendiri.
3. Informasi dapat dengan mudah diproses dan dimodifikasi ke dalam berbagai
bentuk.
4. Dapat memproses informasi dalam jumlah yang sangat besar dan mengirimnya
secara interaktif.
Secara umum sinyal didefinisikan sebagai suatu besaran fisis yang merupakan
fungsi waktu, ruangan, atau beberapa variabel. Contoh dari sinyal adalah sebagai
berikut:

10
1. Tegangan listrik (V) sebagai fungsi waktu.

2. Potensial listrik adalah fungsi dari posisi pada suatu ruang tiga dimensi.
3. Intensitas sebagai fungsi dari koordinat x,y dan waktu.
Sinyal dapat direpresentasikan secara matematik, misalnya:
1. δ1 (t) = 5t (linear) ……………………………………….…… (2.1)
2. δ2 (t) = 20t2 + 5t (nonlinear/berbanding kuadrat) ……………(2.2)
. . . . ………(2.3)
3. δ3 (x,y) = 3x + 2xy +10y (2 variabel input x dan y)
Sinyal-sinyal di atas adalah sinyal yang dapat didefinisikan dengan suatu
fungsi yang jelas. Dalam beberapa kasus sinyal tidak dapat dilihat hubungan
fungsinya secara nyata dan kompleks, contohnya sinyal ucapan manusia.
Sinyal suara dapat dituliskan sebagai fungsi penjumlahan dari gelombang
sinus dengan amplitudo berbeda. Suatu sinyal mempunyai beberapa jenis informasi
yang dapat diamati misalnya amplitudo, frekuensi, perbedaan fase, dan gangguan
akibat noise. Untuk mengamati informasi tersebut dapat digunakan secara langsung
dengan peralatan ukur elektronik seperti osciloscop dan spektrum analizer. Peralatan
tersebut bekerja dengan memanfaatkan model matematik dari sinyal.
Pengolahan sinyal adalah suatu operasi matematik yang dilakukan terhadap
suatu sinyal sehingga diperoleh suatu informasi yang dibutuhkan. Dalam hal ini terjadi
suatu transformasi. Pengolahan sinyal dapat dilakukan secara analog atau digital.
Pengolahan sinyal analog memanfaatkan komponen-komponen analog misalnya
dioda, transistor, Op-amp, dan lainnya. Pengolahan sinyal secara digital menggunakan
komponen-komponen digital misalnya register, counter, dekoder, summing,
mikroprosessor, mikrokontroller dan lainnya.
Untuk kemudahan dalam pengolahan sinyal digital sebagai pemroses
digunakan suatu komputer (mikrokontroller) untuk mereprentasikan algoritma atau
model matematik. Selain sistem komputer diperlukan perangkat keras lainnya sebagai
peranti masukan atau keluaran.

11
Proses sinyal analog
processor q(t)
p(t)
Proses sinyal digital

p(n) q(n)
p(t) A/D processor D/A q(t)
Gambar 2.1 Perbandingan pengolahan sinyal analog dan digital
Sinyal dapat dikelompokkan menjadi dua jenis, yaitu sinyal analog (continue)
dan sinyal digital (diskit). Komponen-komponen untuk pengolahan sinyal harus
disesuaikan dengan jenis sinyalnya. Gambar 2.1 memperlihatkan secara diagram blok
perbedaan pengolahan sinyal secara analog dan digital.
Saat ini pengolahan sinyal banyak dilakukan secara digital. Hal ini dilakukan
karena kelebihan-kelebihan yang dimilikinya, antara lain:
1. Untuk menyimpan hasil pengolahan, sinyal digital lebih mudah dibandingkan
menyimpan sinyal analog. Untuk media penyimpanan dapat digunakan elemen
memori seperti Flash memory, CD/DVD, harddisk. Untuk penyimpanan sinyal
analog dapat digunakan pita tap magnetik.
2. Sinyal digital lebih kebal terhadap noise, karena bekerja dengan level tegangan
logika 0 dan 1.
3. Lebih kebal terhadap perubahan temperatur.
4. Lebih mudah memprosesnya, secara teori tidak ada batasan tergantung
kreativitas dan inovasi perancang.
Beberapa kelemahan sinyal digital:
1. Ada kehilangan informasi akibat pembulatan saat kuantisasi dan filtering saat
pembalikan kembali ke sinyal analog.
Diperlukan waktu proses yang lebih lama dibanding sinyal analog, yaitu waktu
sampling dan rekonstruksi ulang.
2.4 Pembangkitan Sinyal Suara Manusia

Sinyal adalah besaran fisis yang berubah menurut waktu, ruang, atau variabel-variabel
bebas lainnya. Contoh sinyal: sinyal ucapan, ECG, dan EEG. Secara matematis, sinyal

12
adalah fungsi dari satu atau lebih variabel independen. Proses ini dilakukan melalui
pemodelan sinyal.
Contoh fungsi matematis dari sinyal adalah:
( ) ( )
Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs(paru-paru),
glottis (dengan vocal cords) dan articulation tract (mouth/mulut dan nose
cavity/rongga hidung). Gambar 2.1 menunjukkan penampang melintang dari organ
wicara manusia. Untuk menghasilkan sebuah voiced sounds (suara ucapan), paru-paru
lungs menekan udara melalui epiglottis, vocal cords bergetar, menginterupt udara
melalui aliran udara dan menghassilkan sebuah gelombang tekanan quasi-periodic.
Gambar 2.2 organ wicara manusia
Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi
sinyal tekanan adalah pitch frequency atau fundamental frequency.
Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu
(nasals) juga merangsang nasal cavity (rongga hidung). Ketika rongga beresonansi,
akan menimbulkan radiasi sebuah gelombang suara yang mana merupakan sinyal
wicara. Kedua rongga beraksi sebagai resonators dengan karacteristik frekuensi
resonansi masing-masing, yang disebut formant frequencies. Pada saat rongga mulut
dapat mengalami perubahan besar, kita mampu untuk menghasilkan beragam pola
ucapan suara yang berbeda.

13
Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal tract
lebih menyerupai noise (derau). Gambar 2.3 menampilkan proses produksi suara-
suara /a/, dan /f/.(Fadlisyah. 2013).
Gambar 2.3 Proses produksi suara
Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu,
dalam hal ini ketika diamati pada durasi yang sangat pendek (5 sampai 100 mili detik)
karakteristiknya masih stasioner. Tetapi bilamana diamati dalam durasi yang lebih
panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk merefleksikan suara
ucapan yang keluar dari pembicara.
Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan
menampilkannya dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang
dimana sinyal wicara tidak diproduksi, unvoice (U) dimana vocal cord tidak
berfibrasi, dan yang ketiga adalah voiced (V) dimana vocal cord bervibrasi secara
periodik sehingga menggerakkan udara ke kerongkongan melalui mekanisme akustik
sampai keluar dari mulut dan menghasilkan sinyal wicara.

14
Gambar 2.4 Contoh sinyal wicara ucapan “Selamat Datang”
2.5 Sinyal dan Sistem

Secara umum sinyal didefinisikan sebagai suatu besaran fisis yang merupakan fungsi
waktu, ruangan, atau beberapa variabel. Sinyal biasa juga diartikan fenomena dari
lingkungan yang terukur atau terkuantisasi, sementara system merupakan bagian dari
lingkungan yang menghubungkan sinyal dengan sinyal lainnya atau dengan kata lain
merespon sinyal masuk dengan menghasilkan sinyal keluaran. Suara pembicaraan
merupakan contoh dari sinyal sementara sistem komunikasi telepon sendiri
merupakan contoh dari sistem yang menghubungkan sinyal-sinyal pembicaraan
tersebut.
Sinyal analog adalah sinyal pemanfaatan gelombang elektromagnetik. Proses
pengiriman suara, misalnya pada teknologi telepon, dilewatkan melalui gelombang
elektromagnetik sinyal analog diilustrasikan pada Gambar 2.5

15
Gambar 2.5 Sinyal Analog
Sinyal digital merupakan bentuk sampling dari sinyal analog. Sinyal digital
pada dasarnya di code-kan dalam bentuk biner (Hexa). Besarnya nilai suatu sinyal
digital dibatasi oleh lebarnya atau jumlah bit (bandwidth). Jumlah bit juga sangat
mempengaruhi nilai akurasi sinyal digital Gambar 2.6 mengilustrasikan sinyal digital.
Gambar 2.6 sinyal digital
2.6 Format .wav

Format wave (*.wav) merupakan salah satu format file suara yang banyak dipakai
dalam sistem operasi Windows untuk keperluan game dan multimedia. Format wave
sebenarnya merupakan format kasar (raw format) dimana sinyal suara langsung
direkam dan dikuantisasi menjadi data digital. Format dasar dari file ini secara default
tidak mendukung kompresi dan dikenal dengan nama PCM (Pulse Code
Modulation)(Karmela. 2010).
Secara umum data audio digital memiliki karakteristik yang dapat dinyatakan
dengan parameter-parameter berikut:
a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau 44100
sampel/detik.
b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.
c. Jumlah kanal, yaitu 1 untuk mono dan 2 untuk stereo.

16
Parameter-parameter tersebut menyatakan setting yang digunakan oleh ADC

(Analog-to-Digital Converter) pada saat data audiodirekam. Biasanya laju sampel juga
dinyatakan dengan satuan Hz atau kHz. Sebagai gambaran, data audiodigital yang
tersimpan dalam CD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per
sampel, dan 2 kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100
sampel, dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju
sampel selalu dinyatakan untuk setiap satu kanal. Jadi misalkan suatu data audio
digital memiliki 2 kanal dengan laju sampel 8000 sampel/detik, maka sesungguhnya
di dalam setiap detiknya akan terdapat 16000 sampel (Karmela 2010).
2.7 Al-Qur’an
Al-Qur’an yang secara harfiah berarti “bacaan sempurna” merupakan suatu nama
pilihan Allah yang sungguh tepat, karena tiada satu bacaan pun sejak manusia
mengenal tulis-baca lima ribu tahun yang lalu yang dapat menandingi Al-Qur’an Al-
Karim, bacaan sempurna lagi mulia itu.
Tiada bacaan semacam Al-Qur’an yang dibaca oleh ratusan juta orang yang
tidak mengerti artinya dan atau tidak dapat menulis dengan aksaranya. Bahkan dihafal
huruf demi huruf oleh orang dewasa, remaja dan anak-anak.
2.7.1 Keotentikan Al-Qur’an

Al-Qur’an Al-Karim memperkenalkan dirinya dengan berbagai ciri dan sifat. Salah
satu diantaranya adalah bahwa ia merupakan kitab yang keotentikannya dijamin oleh
Allah dan ia adalah kitab yang selalu dipelihara. Inna nahnu nazzalna al-dzikra wa
inna lahu lahafizhun (sesungguhnya kami menurunkan Al-Qur’an dan kamilah
pemelihara-Nya)(Qs.15:9).
Demikianlah Allah menjamin keotentikan Al-Qur’an, jaminan yang diberikan
atas dasar Kemahakuasaan dan Kemahatahuan-Nya, serta berkat upaya-upaya yang
dilakukan oleh makhluk-makhluk-Nya. Dengan jaminan ayat di atas, setiap muslim
percaya bahwa apa yang dibaca dan didengarnya sebagai Al-Qur’an tidak berbeda
sedikit pun dengan apa yang pernah dibaca oleh Rasulullah SAW, dan yang didengar
serta dibaca oleh para sahabat Rasulullah SAW.

17
2.7.2 Bukti-Bukti Kesejarahan

Al-Qur’an Al-Karim turun dalam masa sekitar 22 tahun atau tepatnya, menurut ulama,
dua puluh dua tahun, dua bulan dua puluh dua hari.
Ada beberapa faktor yang terlebih dahulu harus dikemukakan dalam rangka
pembicaraan yang merupakan faktor-faktor pendukung bagi pembuktian otentisitas
Al-Qur’an.
a. Masyarakat Arab, yang hidup pada masa turunnya Al-Qur’an adalah
masyarakat yang tidak mengenal baca tulis. Karena itu satu-satunya andalan
mereka adalah hafalan. Dalam hal hafalan, orang Arab – bahkan sampai kini –
dikenal sangat kuat.
b. Masyarakat Arab – khususnya pada masa turunnya Al-Qur’an – dikenal
sebagai masyarakat sederhana dan bersahaja. Kesederahanaan ini, menjadikan
mereka memiliki waktu luang yang cukup, disamping menambah ketajaman
pikiran dan hafalan.
c. Masyarakat Arab sangat gandrung lagi membanggakan kesusastraan, mereka
bahkan melakukan perlombaan-perlombaan dalam bidang ini pada waktu-
waktu tertentu.
d. Al-Qur’an mencapai tingkat tertinggi dari segi keindahan bahasanya dan
sangat mengagumkan bukan saja bagi orang-orang mukmin tetapi juga orang
kafir. Berbagai riwayat menyatakan bahwa tokoh-tokoh kaum musyrik
seringkali secara sembunyi-sembunyi berupaya mendengarkan ayat-ayat Al-
Qur’an yang dibaca oleh kaum muslim. Kaum muslim, disamping mengagumi
keindahan bahasa Al-Qur’an, juga mengagumi kandungannya, serta meyakini
bahwa ayat-ayat Al-Qur’an adalah petunjuk kebahagian dunia dan akhirat.
e. Al-Qur’an, demikian pula Rasulullah saw., menganjurkan kepada kaum
muslim memperbanyak membaca dan mempelajari Al-Qur’an dan anjuran
tersebut mendapat sambutan yang hangat.
f. Ayat-ayat Al-Qur’an turun berdialog dengan mereka, mengomentari keadaan
dan peristiwa-peristiwa yang mereka alami, bahkan menjawab pertanyaan-
pertanyaan mereka. Disamping itu, ayat-ayat Al-Qur’an turun sedikit demi
sedikit. Hal itu lebih mempermudah pencernaan maknanya dan proses
penghafalannya.

18
g. Dalam Al-Qur’an, demikian pula hadits-hadits Nabi, ditemukan petunjuk-

petunjuk yang mendorong para sahabatnya untuk selalu bersikap teliti dan
hati-hati dalam menyampaikan berita, lebih-lebih kalau berita tersebut
merupakan firman-firman Allah atau sabda Rasul-Nya.
Faktor-faktor di atas menjadi penunjang terpelihara dan dihafalkannya ayat-
ayat Al-Qur’an. Itulah sebabnya, banyak riwayat sejarah yang menginformasikan
bahwa terdapat ratusan sahabat Rasulullah SAW yang menghafalkan Al-Qur’an.
Bahkan dalam peperangan Yamamah, yang terjadi beberapa saat setelah wafatnya
Rasulullah SAW, telah gugur tidak kurang dari tujuh puluh orang penghafal Al-
Qur’an.
2.7.3 Surat Ar-Rahmaan

Pada surah Ar-Rahmaan terkandung hikmah yang luar biasa bagi umat manusia
umumnya dan bagi umat muslim khususnya. Hal demikian terkait dengan derajat
mensyukuri nikmat dalam makna seluas-luasnya. Termasuk menyadari eksistensi
pemberi nikmat itu sendiri, Allah SWT. Mereka yang menyadari nikmat dan
eksistensi Pemberi nikmat sembari patuh dan taat kepadaNya akan memperoleh
tempat yang mulia. Sebaliknya mereka yang zalim dan ingkar dengan segala nikmat
yang telah dianugerahkan, akan merasa kepediahan hidup yang kekal.
Terkait dengan masalah nikmat bekali-kali Allah SWT bertanya kepada
manusia :
“ Maka nikmat tuhanmu yang manakah yang kau dustakan “
Firman tersebut menunjukkan betapa Allah SWT sungguh menyayangi
manusia, terutama bagi kaum muslim yang menaati segala perintahnya dan menjauhi
segala larangannya.
Penjelasan mengenai aneka ragam nikmat banyak termaktub dalam Al-Qur’an.
Pada surah Ar-Rahmaan dakatakan bahwa Al-Qur’an adalah karunianya yang amat
besar dan teramat mulia bagi umat manusia. Disamping itu, menariknya surah itu
diawali dengan pernyataan tentang sifat Allah SWT yang Maha Ppemurah. Rasa
pemurahnya laksana sumber dari semua karunia yang diberikannya kepada manusia.
Bahkan sifat pemurahnya sudah ada lebih dulu sebelum manusia tercipta. Simaklah
urutan ayatnya. Segala karunia nikmat yang diberikan kepada manusia disebutkan
lebih dahulu daripada masalah lain.

19
(١)
(٢)
(٣)
(٤)
(٥)
(٦)
(٧)
(٨)
(٩)
(١٠)
(١١)
(١٢)
(١٣)
(1). [Tuhan] Yang Maha Pemurah,

(2). Yang telah mengajarkan Al Qur’an.
(3). Dia menciptakan manusia,
(4). Mengajarnya pandai berbicara.
(5). Matahari dan bulan [beredar] menurut perhitungan.
(6). Dan tumbuh-tumbuhan dan pohon-pohonan kedua-duanya tunduk kepadaNya.
(7). Dan Allah telah meninggikan langit dan Dia meletakkan neraca [keadilan].
(8). Supaya kamu jangan melampaui batas tentang neraca itu.
(9). Dan tegakkanlah timbangan itu dengan adil dan janganlah kamu mengurangi
neraca itu.
(10). Dan Allah telah meratakan bumi untuk makhluk [Nya].
(11). Di bumi itu ada buah-buahan dan pohon kurma yang mempunyai kelopak
mayang.
(12). Dan biji-bijian yang berkulit dan bunga-bunga yang harum baunya.
(13). Maka ni’mat Tuhan kamu yang manakah yang kamu dustakan?

20
2.8 Transformasi
Transformasi merupakan perubahan suatu bentuk, unsur, struktur menjadi bentuk
lainya dengan menambah, mengurangi atau menata kembali unsur-unsurnya.
2.8.1 Transformasi Wavelet

Wavelet diartikan sebagai small wave atau gelombang singkat. Transformasi Wavelet
akan mengkonversi suatu sinyal kedalam sederetan Wavelet. Gelombang singkat
tersebut merupakan fungsi basis yang terletak pada waktu berbeda.
Transformasi Wavelet merupakan perbaikan dari transformasi Fourier. Pada
transformasi Fourier hanya dapat menentukan frekuensi yang muncul pada suatu
sinyal, namun tidak dapat menentukan kapan (dimana) frekuensi itu muncul. Dengan
kata lain, transformasi Fourier tidak memberikan informasi tentang domain waktu
(time domain). Kelemahan lain dari transformasi Fourier adalah perubahan sedikit
terhadap sinyal pada posisi tertentu akan berdampak atau mempengaruhi sinyal pada
posisi lainnya. Hal ini disebabkan karena transformasi Fourier berbasis sin – cos yang
bersifat periodik dan kontinu.
Transformasi Wavelet selain mampu memberikan informasi frekuensi yang
muncul, juga dapat memberikan informasi tentang skala atau durasi atau waktu.
Wavelet dapat digunakan untuk menganalisis suatu bentuk gelombang (sinyal) sebagai
kombinasi dari waktu (skala) dan frekuensi. Selain itu, perubahan sinyal pada suatu
posisi tertentu tidak akan berdampak banyak terhadap sinyal pada posisi-posisi yang
lainnya. Dengan Wavelet suatu sinyal dapat disimpan lebih efisien dibandingkan
dengan Fourier dan lebih baik dalam hal melakukan aproksimasi terhadap real – word
signal.
2.8.1.1 Dekomposisi Averages dan Differences

Dekomposisi perataan (Averages) dan pengurangan (Differences) memegang peranan
penting untuk memahami transformasi wavelet. Untuk memahami dekomposisi
perataan dan pengurangan ini, berikut diberikan suatu contoh citra 1 dimensi dengan
dimensi 8.

21
39 35 30 28 58 18 21 15
Perataan dilakukan dengan menghitung nilai rata-rata 2 pasangan data dengan

rumus :
…………………………………………… (2.1)
Sedangkan pengurangan dilakukan dengan rumus :

………………………………………..….. (2.2)
Hasil proses perataan untuk citra diatas adalah :
Sedangkan hasil proses pengurangannya adalah :
Sehingga hasil proses dekomposisi perataan dan pengurangan terhadap citra

diatas adalah :
36 28 38 18 1 0 20 3
2.8.2 Discrete Cosine Transform (DCT)

Discrete Cosine Transform (DCT) biasa digunakan untuk mengubah sebuah sinyal
menjadi komponen frekuensi dasarnya. DCT adalah sebuah transformasi yang
mengubah sebuah kawasan spasial menjadi kawasan fekuensi dan sebaliknya kawasan
frekuensi dapat di kembalikan ke kawasan spasial dengan menggunakan invers DCT.
DCT pertama kali diperkenalkan oleh Ahmed, Natarajan dan Rao pada tahun 1974
dalam makalahnya yang berjudul " On image processing and a discrete cosine
transform" (Watson, 1994).
Discrete Cosine Transform (DCT) adalah salah satu tranformasi yang sangat
mirip dengan Discrete Fourier Transform, hanya saja DCT menggunakan komponen
cosinus saja.
Bentuk transformasi sinus diskrit (Discrete Cosine Transform) atau DCT
untuk citra 1 dimensi f(x) adalah :
( )
( ) √ ( )∑ ( ) ( ) …………. (2.3)

22
Dengan ( ) dinyatakan sebagai berikut :
( ) { √ …………………………………… ( 2.4)
Keterangan :
- C(u) : Hasil Transformasi Cosine
- N : Jumlah Sinyal Suara
- F(x) : Nilai Sinyal Suara
- X : Index Sinyal Suara
- U : Index Transformasi
2.8.3 Discrete Fourier Transform (DFT)

Discrete Fourier Transform (DFT) adalah suatu model transformasi yang
memindahkan sinyal domain spasial atau sinyal domain waktu menjadi sinyal domain
frekuensi. Di dalam pengolahan suara, transformasi fourier banyak digunakan untuk
mengubah domain spasial pada suara menjadi domain frekuensi. Analisa-analisa
dalam domain frekuensi banyak digunakan seperti filtering. Dengan menggunakan
transformasi fourier, sinyal atau suara dapat dilihat sebagai suatu objek dalam domain
frekuensi.
Discrete Fourier Transform (DFT) adalah salah satu tranformasi yang paling
terkenal dan banyak digunakan dalam pengolahan citra.
Bentuk transformasi sinus diskrit (Discrete Fourier Transform) atau DFT
untuk citra 1 dimensi f(x) adalah :
( ) ∑ ( ) ( ) ……………………….. (2.5)
J= √ merupakan bilangan komplek

…………………………………………… (2.6)
Maka persamaan (2.5) dapat disajikan dalam bentuk :

( ) ∑ ( )( ( ) ( )) ……… (2.7)
Keterangan :
- F(u) : Hasil Transformasi Fourier
- N : Jumlah Sinyal Suara

23
- F(x) : Nilai Sinyal Suara

- X : Index Sinyal Suara
- U : Index Transformasi

24
BAB 3
METODOLOGI PENELITIAN
3.1. Tahapan Penelitian

Pada penelitian ini, seluruh prosedur awal penelitian terlebih dahulu harus sudah
dilakukan seperti studi literatur dan melakukan konsultasi dengan pembimbing.
Setelah ditemukan permasalahan dan merumuskannya maka penelitian bisa
dilanjutkan pada proses selanjutnya.
3.2 Diagram Alur Kerja Penelitian

Diagram alur kerja sistem penelitian yang akan dilakukan pada penelitian ini di
ilustrasikan pada gambar 3.1.
Identifikasi Menetapkan tujuan Desain sistem

masalah penelitian
Pengumpulan Implementasi Uji coba sistem

sampel sistem
Pengukuran unjuk Kesimpulan

kerja sistem penelitian
Gambar 3.1 Alur kerja penelitian secara umum
Berdasarkan gambar 3.1 dapat dijelaskan bahwa alur kerja penelitian secara
umum dimulai dengan mengidentifikasi sebuah masalah yang akan diteliti, kemudian
menetapkan tujuan penelitian dan dilanjutkan dengan mendesain sebuah sistem yang
akan digunakan untuk menyelesaikan sebuah masalah yang akan dibangun, kemudian
pada tahap selanjutnya yaitu melakukan pengumpulan sampel suara khususnya surah
ar-rahmaan ayat 1-13, setelah memperoleh data sampel suara, tahapan selanjutnya
yaitu mengimplementasikan sistem sesuai dengan tujuan penelitian dan diteruskan

25
untuk menguji coba sistem, dan tahapan terakhir setelah menguji coba sistem yaitu
tahapan pengukuran unjuk kerja sistem untuk masing-masing transformasi sehingga
dapat diambil kesimpulan terhadap penelitian.
3.3 Data Dan Peralatan Penelitian Yang Digunakan

Data yang digunakan dalam penelitian ini terdiri dari sekumpulan file audio untuk
pelatihan dan sekumpulan file audio untuk pengujian. File audio yang digunakan
untuk pelatihan maupun pengujian diperoleh dari hasil rekaman dengan bantuan
aplikasi Adobe Audition 1.5. File audio yang digunakan yaitu file yang berekstensi
wav. Alasan pemilihan file audio .wav adalah dikarenakan format audio .wav
merupakan standar default dalam pemrosesan audio pada sistem operasi Windows.
3.4 Skema Sistem

Skema sistem pengelanan ayat Al Quran yang dibangun dalam penelitian ini
diilustrasikan pada Gambar 3.2.
Preprocessing Ekstraksi ciri
Sampel bacaan
Transformasi Transformasi Transformasi
Wavelet Cosinus Fourier
Bacaan dikenali Bacaan dikenali Bacaan dikenali
Gambar 3.2. Skema Sistem Secara Keseluruhan
Sebuah sinyal digital atau sampel suara rekaman ayat Al Quran sebelum
ditransformasikan ke masing-masing transformasi maka sinyal tersebut dilakukan
preprocessing terlebih dahulu atau mambaca nilai-nilai daripada sinyal digital tersebut
dan dilanjutkan dengan ekstraksi cirri atau mengelompokkan nilai-nilai sinyal menjadi
sebuah picth suara dan nilai dari picth suara tersebutlah yang akan ditransformasikan
ke transformasi wavelet, discrete cosine transform (DCT) dan transformasi fourier
sehingga masing-masing transformasi menghasilkan sebuah energi dari sampel suara

26
rekaman yang diinputkan yang selanjutnya energi tersebut akan digunakan sebagai
nilai acuan untuk pengujian.
3.5 Tansformasi
Model transformasi yang digunakan pada sistem ini adalah jenis transformasi Wavelet
dekomposisi Averages and Differences, DCT, dan Fourier diagram alir dari masing-
masing transformasi yang ditunjukkan pada Gambar 3.3, Gambar 3.4, Gambar 3.5
berikut ini :
Mulai
Input sampel
Baca file dan

ambil nilai N
Hitung Transformasi
Averages[k]:=Averages[i]+Averages[i+1]/2
Differences[k]:=Differences[i]+Differences[i+1]/2
i:=i+1
Tidak
i <= N
Ya
Hasil
Tranformasi
Wavelet
Selesai
Gambar 3.3 Diagram alir transformasi Wavelet

27
Pada tahap ini, sistem menerima inputan nilai sinyal, struktur nilai sinyal
merupakan hasil dari proses baca file dan selanjutnya sistem melakukan perhitungan
transformasi dengan membandingkan nilai tetangganya. Langkah-langkah ini terus diulang
hingga nilai i memenuhi perulangan maksimum.
Mulai
Input sampel
Baca file dan

ambil nilai N
Hitung Transformasi
i:=i+1
Tidak
i >= N
Ya
Hasil
Tranformasi
Cosine
Selesai
Gambar 3.4 Diagram alir Discrete cosine transform
transformasi dengan mengalikan akar dari 2 dibagi jumlah sinyal dengan nilai dari a(u) dan

28
dijumlahkan dengan mengalikan nilai sinyal dengan hasil dari cos PI dikali 2x ditambah satu
dikali dengan nilai u dan dibagikan dengan 2 dikalikan jumlah sinyal. Langkah-langkah ini
terus dilakukan hingga nilai x memenuhi perulangan maksimum.
Mulai
Input sampel
Baca file dan

ambil nilai N
Hitung Transformasi
i:=i+1
Tidak
i >= N
Ya
Hasil
Tranformasi
Fourier
Selesai
Gambar 3.5 Diagram alir transformasi Fourier
transformasi dengan mengalikan nilai daripada sinyal dengan hasil exponensial. Langkah-
langkah ini terus diulang hingga nilai u memenuhi perulangan maksimum.

29
3.6 Paramater Pengukuran Evaluasi Unjuk Kerja Sistem

Pengukuran evaluasi unjuk kerja sistem pengenalan ayat Al-Qur’an melalui suara
pada umumnya menggunakan dua parameter, yaitu true detection dan false detection.
True detection merupakan jumlah file suara yang berhasil dikenali per seluruh jumlah
file suara yang di uji, sedangkan false detection adalah jumlah file suara yang tidak
dikenali.

30
BAB 4
HASIL DAN PEMBAHASAN
4.1 Hasil
Hasil yang dibahas meliputi pemilihan sampel pelatihan surat Ar-Rahmaan ayat 1-13,
pendefinisian sampling pola suara, dan pengukuran unjuk kerja sistem.
4.1.1 Sampel pelatihan surat Ar-Rahmaan ayat 1-13

Sampel pelatihan surat Ar-Rahmaan ayat 1-13 yang digunakan dalam penelitian ini
berjumlah 7 sampling suara per-ayat yang mewakili karakteristik suara yang berbeda.
Gambar 4.1 menunjukkan beberapa sampel frekuensi surat Ar-Rahmaan yang
digunakan sebagai pelatihan. Pelatihan dilakukan menggunakan transformasi wavelet
dekomposisi Averages and Differences, DCT dan Fourier.
(a)
(b)
(c)
(d)

31
(e)
(f)
(g)
(h)
(i)
(j)
(k)

32
(l)
(m)
Gambar 4.1 sinyal frekuensi (a) Ar-rahmaan ayat 1 (b) Ar-rahmaan ayat 2 (c) Ar-rahmaan ayat
3 (d) Ar-rahmaan ayat 4 (e) Ar-rahmaan ayat 5 (f) Ar-rahmaan ayat 6 (g) Ar-rahmaan ayat 7 (h)
Ar-rahmaan ayat 8 (i) Ar-rahmaan ayat 9 (j) Ar-rahmaan ayat 10 (k) Ar-rahmaan ayat 11 (l) Ar-
rahmaan ayat 12 (m) Ar-rahmaan ayat 13
Berdasarkan gambar 4.1 diatas pola sampling suara untuk masing-masing ayat 1
sampai 13 memiliki pola sampling suara yang berbeda dengan gelombang frequensi
yang berbeda dan mempunyai jumlah pitch yang berbeda pula.
4.1.2 Hasil Sampling pola suara

Hasil sampling pola suara diperoleh berdasarkan nilai frequensi yang berbeda-beda,
dimana nilai-nilai frequensi tersebut dipengaruhi oleh tinggi rendahnya nada suara,
semakin tinggi nada suara yang diucapkan maka nilai frequensi yang dikandungpun
semakin tinggi, begitu juga sebaliknya semakin rendah nada suara yang diucapkan
maka nilai frequensi yang dikandungpun semakin rendah, nilai frequensi tersebut
sebelum ditransformasikan ke masing-masing transformasi maka akan didapatkan
nilai pitch dari frequensi suara tersebut yang akan dijelaskan pada proses kinerja
transformasi.
Setiap suara memiliki sampling suara yang spesifik atau berbeda antara satu
suara dengan suara lainnya. Pada transformasi wavelet dekomposisi Averages and
Differences, DCT dan fourier, sampling suara referensi sudah harus ditentukan
sebelum dilakukan pengujian.

33
Gambar 4.2 Nilai sampling suara
Gambar 4.2 berikut ini menunjukkan sampling suara surat Ar-Rahmaan ayat
pertama referensi yang dihasilkan dari pengamatan beberapa sampel suara surat Ar-
Rahmaan ayat pertama (Gambar 4.1 (a)).
4.1.3 Proses Kinerja Transformasi

Setelah pembacaan frekuensi dari file audio kemudian akan didapatkan nilai pitch dari
audio tersebut, berdasarkan sampling suara diatas didapatkanlah pitch untuk surat ar-
rahmaan ayat pertama sebagai berikut [1235, 2344, 893, 1872]. Setelah nilai pitch
diperoleh, selanjutnya nilai pitch tersebut akan di transformasikan ke masing-masing
transformasi, dengan proses perhitungan yang berbeda-beda, dan tentunya akan
menghasilkan nilai yang berbada pula, dimana nilai tersebut akan dijadikan sebagai
acuan pada saat proses pengujian.
4.1.3.1 Perhitungan Transformasi Wavelet dekomposisi Averages and Differences

Nilai pitch [1235, 2344, 893, 1872]

34
Berdasarkan rumus diatas sehingga dihasilkan nilai :
[1789.5, -55.45, 1382.5, -489.5]

Nilai setelah ditransformasikan akan diambil rata-ratanya sebagai bobot yang
akan disimpan dalam database, yang nantinya digunakan pada proses pengujian
sistem.
Energy rata-rata dari hasil transformasi diatas : 532
4.1.3.2 Perhitungan Transformasi Sinus

Nilai pitch [1235, 2344, 893, 1872]
( )
( ) √ ( )∑ ( ) ( )
Dengan ( ) dinyatakan sebagai berikut :
( ) { √
( ) ( )
C(0) = √ (1235*( ( )) + 2344*( ( )) +
√
( ) ( )
893*( ( )) + 1872*( ( )))
=√ ( 1235 + 2344 + 893 + 1872 )

√
= 3172
( ) ( )
C(1) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))

35
= √ 1 ( 1141.085 + 898.3032 + (-340.915) + (-1728.5) )
= -21.2336
( ) ( )
C(2) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))
= √ 1 ( 873.6245 + 1.8665 + (-632.702) + 1320.009 )
= 1105.065
( ) ( )
C(3) = √ 1 (1235*( ( )) + 2344*( ( )) +
( ) ( )
893*( ( )) + 1872*( ( )))
= √ 1 ( 473.2954 + (-2167.18) + 824.0002 + (-709.147))
= -111654
[3172, -21.2336, 1105.065, -111654]

sistem.
Energy rata-rata dari hasil transformasi diatas : 784.8225
4.1.3.3 Perhitungan Transformasi Fourier

Nilai pitch [1235, 2344, 893, 1872]
( ) ∑ ( )( ( ) ( ))
( ) ( ) ( ) ( )
( ) ( ) ( )

36
( ) ( )
= 1586
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( + (-472 ))
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( )
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( )
= ( ) ( ) ( ) ( )
= ( )
= ( )

37
Dikarenakan masih ada bilangan imaginer pada perhitungan diatas maka hasil
tersebut di spectrumkan untuk memperoleh nilai yang real dengan cara :
| ( )| ( ( ) ( ) )
| ( )| ( )
= 1586
| ( )| ( ( ))
= 145.7198
| ( )| ( )
= 522
| ( )| ( )
= 145.7198
[1586, 145.7198, 522, 145.7198]

sistem.
Energy rata-rata dari hasil transformasi diatas : 599.8599
4.1.4 Pengukuran Unjuk Kerja Sistem

Pengukuran unjuk kerja sistem dilakukan dengan masing-masing kinerja transformasi
dan kesimpulan dari ketiga trasnsformasi. Untuk hasil pengukuran unjuk kerja sistem
pengenalan ayat Al Quran menggunakan transformasi Wavelet dekomposisi Averages
and Differences dapat diilustrasikan pada table 4.1. Table 4.2 mengilustrasikan hasil
pengukuran unjuk kerja sistem pengenalan ayat Al Quran menggunakan DCT, dan
Table 4.6 mengilustrasikan hasil pengukuran unjuk kerja sistem pengenalan ayat Al
Quran menggunakan transformasi Fourier, dan pada Table 4.7 mengilustrasikan
kesimpulan hasil pengukuran unjuk kerja sistem pengenalan ayat Al Quran
menggunakan transformasi Wavelet dekomposisi Averages and Differences, DCT dan
Fourier.

38
Tabel 4.1. Hasil Unjuk Kerja Sistem menggunakan Transformasi Wavelet dekomposisi Averages
and Differences
Jumlah Jumlah
True False
Suara Suara Ayat Ke
Detection Detection
Pelatihan Pengujian
1 6 1
2 4 3
3 5 2
4 6 1
5 5 2
6 5 2
91 91 7 6 1
8 5 2
9 6 1
10 5 2
11 7 0
12 7 0
13 6 1
Jumlah Data Benar 73 / 91 = 0.802
Jumlah Data Salah 18 / 91 = 0.197
Unjuk kerja transformasi wavelet dekomposisi Averages and Differences dalam

mengenali ayat Al Quran persentase kebenarannya mencapai 80.2 % dan persentase
salah hanya 19.8 %. Gambar 4.3 mengilustrasikan hasil unjuk kerja transformasi
wavelet dekomposisi Averages and Differences di sajikan dalam bentuk grafik.

39
Grafik Unjuk Kerja Transformasi

Wavelet
8
7
6
Jumlah Benar
benar
5
4
3
2 salah
1
0
Ayat Ke
Gambar 4.3 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan ayat 1-13
Menggunakan Transformasi Wavelet dekomposisi Averages and Differences
Pada gambar 4.3 grafik pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13
mengilustrasikan bagaimana transformasi wavalet dekomposisi Averages and
Differences bekerja dalam mengenali ayat-ayat Al Quran, khususnya pada surat Ar-
Rahmaan ayat 1-13. Pada masing-masing ayat hasil pengenalannya berbeda-beda,
untuk ayat 2 hanya dapat dikenali 4 sampel suara saja, untuk ayat 3,5,6,8 dan 10
berhasil dikenali 5 sampel suara, untuk ayat 1,4,7 dan 13 berhasil dikenali 6 sampel
suara sedangkan ayat 11 dan 12 berhasil dikenali semua sampel suara.
Tabel 4.2. Hasil Unjuk Kerja Sistem menggunakan DCT

Jumlah Jumlah
True False
Suara Suara Ayat Ke
Detection Detection
Pelatihan Pengujian
1 7 0
2 5 2
3 6 1
91 91 4 4 3
5 6 1
6 3 4
7 5 2

40
8 6 1
9 6 1
10 4 3
11 7 0
12 5 2
13 4 3
Unjuk kerja Discrete Cosine Transform (DCT) dalam mengenali ayat Al Quran
persentase kebenarannya mencapai 74.7 % dan persentase salah hanya 25.3 %.
Gambar 4.4 mengilustrasikan hasil unjuk kerja Discrete Cosine Transform (DCT) di
sajikan dalam bentuk grafik.
Grafik Unjuk Kerja Discrete Cosine

Transform (DCT)
8
7
6
Jumlah Benar
5 benar
4
3
2 salah
1
0
Ayat Ke
Gambar 4.4 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13 Menggunakan
Discrete Cosine Transform (DCT)
mengilustrasikan bagaimana Discrete Cosine Transform (DCT) bekerja dalam
mengenali ayat-ayat Al Quran, khususnya pada surat ar-rahmaan ayat 1-13. Pada

41
masing-masing ayat hasil pengenalannya berbeda-beda, pada ayat 6 hanya dapat

dikenali 3 sampel suara saja, untuk ayat 4,10 dan 13 hanya dapat dikenali 4 sampel
suara saja, dan pada ayat 2,7 dan 12 berhasil dikenali 5 sampel suara, untuk ayat 3,5,8
dan 9 berhasil dikenali 6 sampel suara, sedangkan ayat 1, 11 berhasil dikenali semua
sampel suara.
Tabel 4.3. Hasil Unjuk Kerja Sistem menggunakan Transformasi Fourier

Jumlah Jumlah
True False
Suara Suara Ayat Ke
Detection Detection
Pelatihan Pengujian
1 5 2
2 6 1
3 5 2
4 6 1
5 5 2
6 6 1
91 91 7 5 2
8 6 1
9 6 1
10 4 3
11 7 0
12 6 1
13 5 2
Unjuk kerja transformasi fourier dalam mengenali ayat Al Quran persentase

kebenarannya mencapai 79.1 % dan persentase salah hanya 20.9 %. Gambar 4.5
mengilustrasikan hasil unjuk kerja transformasi fourier di sajikan dalam bentuk grafik.

42
Grafik Unjuk Kerja Transformasi Fourier

8
7
6
Jumlah Benar
5
benar
4
3
2 salah
1
0
Ayat Ke
Gambar 4.5 Grafik Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13 Menggunakan
Transformasi Fourier
mengilustrasikan bagaimana Transformasi Fourier bekerja dalam mengenali ayat-ayat
Al Quran, khususnya pada surat ar-rahmaan ayat 1-13. Pada masing-masing ayat hasil
pengenalannya berbeda-beda, untuk ayat 10 hanya dapat dikenali 4 sampel suara saja,
untuk ayat 4,81,3,5,7 dan 13 berhasil dikenali 5 sampel suara, dan pada ayat 2 4 6 8 9
dan 12 berhasil dikenali 6 sampel suara, sedangkan ayat 11 berhasil dikenali semua
sampel suara.
Tabel 4.4. Hasil Unjuk Kerja Sistem Secara Keseluruhan

Jumlah Jumlah Jumlah Pengenalan Jumlah Pengenalan
Suara Suara yang Benar yang Salah
Pelatihan Pengujian Wavelet DCT Fourier Wavelet DCT Fourier
91 91 82 83 86 9 8 5
Total 73 + 68 + 72 = 213 18 + 23 + 19 = 60
Persentase 78.02 % 21.97 %

43
Hasil pengujian meununjukkan bahwa rata-rata sampel suara yang berhasil dikenali
dari transformasi Wavelet dekomposisi Averages and Differences, Discrete Cosine
Transform (DCT), Fourier mencapai 78.02 % sedangan rata sampel yang tidak
berhasil dikenali hanya 21.97 %. Gambar 4.6 menunjukkan grafik hasil unjuk kerja
sistem pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13 secara keseluruhan.
Grafik Unjuk Kerja Sistem Secara Keseluruhan

Pengenalan Ayat Al-Quran Surat Ar-Rahmaan Ayat 1-13
80 73 72
68
70
60
Jumlah Benar
50
40
30 23 benar
18 19
20 salah
10
0
Transformasi Discrete Cosine Transformasi Fourier
Wavelet Transform (DCT)
Jenis Transformasi
Gambar 4.6. Grafik Unjuk Kerja Sistem Pengenalan Ayat Al Quran Surat Ar-Rahmaan 1-13
Pada Gambar 4.6 grafik mengilustrasikan pengujian dan pengukuran unjuk kerja
sistem secara keseluruhan. Jumlah sampel suara yang dilatih adalah 91 sampel dan
yang diuji 91 sampel. Masing-masing transformasi memiliki tingkat keberhasilan
dalam proses pengenalan yang berbeda-beda. Untuk transformasi Wavelet
dekomposisi Averages and Differences sampel berhasil dikenali 73 atau sama dengan
80.2 % dan sampel yang tidak berhasil dikenali sebesar 18 atau sama dengan 19.8 %,
Untuk Discrete Cosine Transform (DCT) sampel berhasil dikenali mencapai 68 atau
sama dengan 74.7 % dan sampel yang tidak berhasil dikenali hanya 23 atau sama
dengan 25.3 %, sedangkan Untuk transformasi Fourier sampel berhasil dikenali
hingga 72 atau setara dengan 79.1 % dan sampel yang tidak berhasil dikenali sebesar
19 atau setara dengan 20.9 %.
4.2 PEMBAHASAN
Berdasarkan hasil penelitian yang telah dilakukan, tingkat keberhasilan proses
pengenalan ayat Al Quran surat Ar-Rahmaan ayat 1-13 memperoleh persentase

44
kebenaran yang berbeda-beda, disebabkan oleh cara dalam mentransformasikan

sinyal, untuk transformasi wavelet dekomposisi Averages and Differences sinyal
hanya di bandingkan dengan sinyal tetangganya, Discrete Cosine Transform (DCT)
hanya menggunakan fungsi cos dalam proses mentransformasikan sinyal, sedangkan
untuk transformasi fourier sinyal ditransformasikan menggunakan gabungan fungsi
sin dan cos sehingga hasil dalam pengenalannya pun memperoleh tingkat keberhasilan
yang berbeda.
Pengamatan terhadap sampling pola acuan untuk pengujian, dan tingkat
keberhasilan sistem dalam proses sampling pola suara. Suara dapat dikenali oleh
sistem jika proses sampling pola suara mirip atau mendekati dengan proses sampling
pola acuan.

45
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil penelitian diatas dapat diambil kesimpulan :
1. Unjuk kerja transformasi Wavelet dekomposisi Averages and Differences,
DCT dan Fourier masing-masing memiliki true detection yang berbeda.
Persentase true detection untuk transformasi Wavelet dekomposisi Averages
and Differences 80.2 %, untuk Discrete Cosine Transform (DCT) tingkat true
detection 74.7 %, sedangkan transformasi Fourier tingkat true detection
mencapai 79.1 %.
2. Ketiga transformasi ini sangat cocok digunakan sebagai salah satu pendekatan
untuk pengenalan suara.
3. Keunggulan transformasi Wavelet adalah dalam proses perhitungan pola
sampling hanya dengan membandingkan nilai tetangganya sehingga sangat
hemat memory, keunggulan DCT adalah dalam proses perhitungan pola
sampling suara dengan menggunakan fungsi cos, sedangkan perhitungan pola
sampling suara dengan menggunakan gabungan fungsi sin dan cos adalah
keunggulan dari transformasi Fourier.
4. Ketiga transformasi ini mampu bekerja dengan baik pada sampling suara yang
tidak mengandung noise.
5. Transformasi Wavelet dekomposisi Averages and Differences lebih unggul
dari transformasi DCT dan Fourier, dan transformasi Wavelet dekomposisi
Averages and Differences sangat cocok digunakan untuk membuat sistem
pengenalan suara.

46
5.2 Saran
Saran untuk penelitian lanjutan :
1. Menambahkan pendekatan untuk menghapus noise pada sampling suara
sebelum sampling suara ditransformasikan.
2. Menambahkan pendekatan uji statistika dan menghitung jarak (distance) pada
tiap-tiap sampling suara.
3. Proses pelatihan dan pengujian dilakukan secara real time.

47
DAFTAR PUSTAKA
Adler, J. & Azhar, M. 2013. Identifikasi Suara Dengan Matlab Sebagai Aplikasi
Jaringan Syaraf Tiruan. Telekontran, Vol. 1, No. 1, Januari 2013.
Al-Azhar, M.N, 2011. Audio Forensic: Theory And Analysis. Pusat Laboratorium
Forensik Polri Bidang Fisika Dan Komputer Forensik, 2011.
Al-Irhaim, Y.F. & Saeed, E.G. 2010. Arabic Word Recognition Using Wavelet Neural
Network. ‫ئ‬ ‫ؤ‬ ‫ي‬ ‫ث ث‬ ‫ي‬ ‫م‬ 29‐30/Nov.2010.
Anusuya, M.A. & Katti, S.K. 2009. Speech Recognition By Machine: A Review.
(Ijcsis) International Journal Of Computer Science And Information Security
Vol. 6, No. 3, 2009
As-Suyuthi & Jalaluddin. 2008. Sebab Turunnya Ayat Al-Qur’an. Gema Insani:
Jakarta.
Fadlisyah & Bustami. 2013. Pengolahan suara. Penerbit Graha Ilmu. Yogyakarta.
Hanggarsari, P.N., Fitriawan, H. & Yuniati, Y. 2012. Simulasi Sistem Pengacakan

Sinyal Suara Secara Realtime Berbasis Fast Fourier Transform (FFT).
Electrician Jurnal Rekayasa Dan Teknologi Elektro Volume:6, No.3 |
September 2012.
Kalinli, O. & Narayanan. S. 2009. Continuous Speech Recognition Using Attention

Shift Decoding With Soft Decision. Journal Interspeech Brighton Vol .6,6-10
September 2009
Kaur, S. & Kaur, E.G. 2013. Enhancement Of Speech Recognition Algorithm Using
Dct And Inverse Wave Transformation. Sukhdeep Kaur Et Al Int. Journal Of
Engineering Research And Applications Vol. 3, Issue 6, Nov-Dec 2013,
Pp.749-754.

48
Putra, D.. 2010. Pengolahan Citra Digital. Penerbit ANDI: Yogyakarta.
Sanjoyo, S. 2008. Membuka Tabir Pintu Langit Jilid 2 Noura Book Publising.
Shihab, Q. 1994. Membumikan Al-Qur’an. MIZAN: Bandung.
Sunny, S. & Peter, D. dkk. 2010. Recognition Of Speech Signals: An Experimental

Comparison Of Linear Predictive Coding And Discrete Wavelet Transforms.
International Journal Of Engineering Science And Technology (Ijest) Vol. 4
No.04 April 2012.
Trivedi, N. & Kumar, V. 2011. Speech Recognition By Wavelet Analysis.

International Journal Of Computer Applications (0975 – 8887) Volume 15–
No.8, February 2011.
Wea K.S.M. & Sudiarto, W. 2010. Aplikasi Player Untuk Menjalankan File Wave
Yang Terkompresi Dengan Metode Huffman. Jurnal Informatika, Volume 6
Nomor 1, April 2010

Thesis - Analisis Perbandingan Discrete Wavelet Transform, Discrete Cosine Transform Dan Fourier Transform Pada Proses Pengenalan Pola Suara

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Thesis - Analisis Perbandingan Discrete Wavelet Transform, Discrete Cosine Transform Dan Fourier Transform Pada Proses Pengenalan Pola Suara

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS PERBANDINGAN DISCRETE WAVELET

TRANSFORM, DISCRETE COSINE TRANSFORM

ABDUL RAHMAN HAKIM

PROGRAM STUDI S2 TEKNIK INFORMATIKA

Universitas sumatera Utara

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah

ABDUL RAHMAN HAKIM

PROGRAM STUDI S2 TEKNIK INFORMATIKA

Universitas sumatera Utara

Judul : ANALISIS PERBANDINGAN DISCRETE WAVELET

Dr. Rahmat W. Sembiring, M.Sc, IT Prof. Dr. Herman Mawengkang

Prof. Dr. Muhammad Zarlis

Universitas sumatera Utara

ANALISIS PERBANDINGAN DISCRETE WAVELET TRANSFORM,

Medan, 02 Juli 2016

Abdul Rahman Hakim

Universitas sumatera Utara

PERNYATAAN PERSETUJUAN PUBLIKASI

Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

ANALISIS PERBANDINGAN DISCRETE WAVELET TRANSFORM,

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 02 Juli 2016

Abdul Rahman Hakim

Universitas sumatera Utara

Telah diuji pada

PANITIA PENGUJI TESIS

Universitas sumatera Utara

NamaLengkap : Abdul Rahman Hakim

SD :PercobaanNegeri 1 Medan TAMAT :1996

Universitas sumatera Utara

Alhamdulillah, pertama sekali dan yang paling utama, penulis mengucapkan

Universitas sumatera Utara

Medan, 02 Juli 2016

Abdul Rahman Hakim

Universitas sumatera Utara

Kata kunci : Suara, Pengolahan Suara, Wavelet, Discrete Cosine Transform,

Universitas sumatera Utara

Voice is a physical phenomenon generated by the vibration of an object in the form of

Keywords : Voice, Voice Recognition, Wavelet, Discrete Cosine Transform,

Universitas sumatera Utara

HALAMAN JUDUL ...................................................................................... i

BAB I PENDAHULUAN .............................................................................. 1

BAB II TINJAUAN PUSTAKA ................................................................... 6

Universitas sumatera Utara

2.7.3. Surat Ar-Rahmaan ............................................................ 18

BAB III METODOLOGI PENELITIAN .................................................... 24

BAB IV HASIL DAN PEMBAHASAN ........................................................ 30

BAB V KESIMPULAN DAN SARAN ......................................................... 45

DAFTAR PUSTAKA ..................................................................................... 47

Universitas sumatera Utara

Tabel 1.1. Informasi yang Diperoleh Dari Suara .................................................. 2

Gambar 2.1. Perbandingan Pengolahan Sinyal Analog dan Digital ........................ 11

Universitas sumatera Utara

1.1. Latar Belakang

Universitas sumatera Utara

Continuous Speech, pengolahan suara berkelanjutan memungkinkan pengguna untuk

Tabel 1.1.Unjuk kerja berbagai pendekatan pengenalan suara.

Universitas sumatera Utara

Linear Predictive Coding And 81.20% -

3 Discrete cosine transforms (DCT) Kaur, S. & Kaur, E.G. 98%

Pada sistem pengolahan suara ini, sistem harus dibangun berdasarkan

Universitas sumatera Utara

masing memiliki kelebihan dan kekurangan. Pemilihan penggunaan komputasi yang

1.2. Rumusan Masalah