Anda di halaman 1dari 12

PROPOSAL TUGAS AKHIR

RENCANA JUDUL

Deteksi Pengucapan Machrajul Huruf Hijaiyah Berbasis Voice Recognition


Mel Frequency Cepstrum Coefficients dan Dynamic Time Warping

Fachrul Priyadi

131402126

PROGRAM STUDI S-1 TEKNOLOGI INFORMASI


FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2017
BAB 1

1 PENDAHULUAN
1.1 Latar Belakang
Alqur’an adalah kitab suci umat Islam yang diturunkan oleh Allah kepada Nabi
Muhammad Shalallahu Alaihi Wassalam yang merupakan mukjizat terbesar yang
diberikan untuk menjadi pedoman hidup bagi manusia yang merupakan suatu ibadah
jika membacanya dengan benar.
Umat Islam diwajibkan untuk membaca Alqur’an dengan bacaan sebaik-baiknya
sebagaimana tercantumkan dalam firman Allah di dalam surat Al-Muzammil : 4 yang
memiliki arti :
“Dan Bacalah Al Qur’an itu dengan tartil.(Q.S. Al-Muzammil :4)”
yang ditafsirkan menurut para ulama sepakat tentang bagaimana membaca alquran
dengan baik dalam fatwa :
“Tidak diragukan lagi bahwa mereka itu beribadah dalam upaya
memahami Al Qur’an dan menegakkan ketentuan-ketentuannya, beribadah dalam
pembenaran lafadz-lafadznya, menegakkan huruf yang sesuai dengan sifat dari
ulama qura’ yang sampai kepada Nabi shallallahu ‘alaihi wasallam. (Ibnu Al
Jazary,210)”
Namun untuk dapat membaca alquran dengan baik dan benar diperlukan
mempelajari ilmu tajwid dan memperhatikan makhraj bacaan alquran, karena setiap
huruf hijaiyah di dalam alquran memiliki perbedaan dalam pengucapannya yang jika
salah dalam pengucapannya maka akan mengubah makna dalam arti alquran tersebut,
ketika kita mengucapkan satu kata atau huruf dalam Al Qur'an, maka artinya pun akan
berbeda.Sebagai contoh, kata 'asaa (yang memiliki makna pengharapan), jika
huruf Sin-nya diganti Shad, maka akan menjadi 'ashaa maknanya berbuat maksiat
(kata kerja) atau tongkat (kata benda) ,berbeda dengan huruf latin yang tidak ada
perbedaan dalam pengucapan , walaupun ada tidak akan mengubah makna secara
signifikan.
Meskipun sekarang sudah ada aplikasi seperti Alquran Mobile belum maksimal
dalam memberikan pemahaman kepada umat Islam dalam memahami pengucapan
makhraj benar dikarenakan :
1. Aplikasi hanya memuat teks bacaan latin
2. Aplikasi tidak dapat mengoreksi bacaan huruf hijaiyah yang benar
Oleh karena hal yang diatas dibutuhkan aplikasi yang dapat mendeteksi benar
atau tidaknya pengucapan makhraj huruf hijaiyah dengan basis voice recognition
menggunakan metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW
(Dynamic Time Warping), proses dimulai dengan input suara pengucapan huruf
hijaiyah dan konversi sinyal suara. Sinyal suara kemudian diekstraksi cirinya dengan
metode MFCC dan dicocokkan polanya menggunakan metode DTW.Proses
pencocokan dilakukan antara suara yang diinputkan dengan sinyal suara referensi
yang tersimpan dalam database. Jika terdapat kesamaan pola suara, maka aplikasi
akan membenarkan bacaan makhraj huruf hijaiyah yang di ucapkan. Jika sebaliknya,
maka input suara ditolak dan kembali ke input suara awal.
Maka dengan menerapkan metode ini ke aplikasi diharapkan dapat mengurangi
terjadinya kesalahan pengucapan makhraj huruf hijaiyah di dalam membaca alquran
yang dapat mengubah makna ayat di dalam alquran di saat membacanya.
1.2 Rumusan Masalah
Di dalam membaca alquran perlu diperhatikan dalam pengucapan makhraj huruf
hijaiyah yang jika terjadi kesalahan dalam pengucapannya dapat membuat makna ayat
di dalam alquran itu memiliki artian yang berbeda.
Oleh sebab itu dibutuhkan aplikasi yang dapat mendeteksi dengan voice
recognition benar atau tidaknya pengucapan makhraj huruf hijaiyah

1.3 Batasan Masalah


Adapun batasan masalah yang akan dibahas adalah:
1. Hanya mendeteksi contoh suara huruf hijaiyah dari suara pria
2. Database suara menggunakan pengucapan huruf hijaiyah yang sudah benar
pengucapannya
3. Karakteristik suara menggunakan suara yang jelas
4. Aplikasi hanya mendeteksi input suara per huruf hijaiyah tidak per kata atau per
kalimat alquran.

1.4 Tujuan Penelitian


Tujuan dari dibuatnya aplikasi ini adalah untuk menerapkan metode MFCC (Mel
Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) pada aplikasi
berbasis voice recognition untuk dapat mendeteksi pengucapan makhraj huruf
hijaiyah yang benar.

1.5 Manfaat Penelitian


Manfaat pada penelitian ini adalah melihat keefesiensian metode MFCC (Mel
Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) dalam
mendeteksi suara.
1.6 Metodologi Penelitian
Adapun tahapan – tahapan yang akan dilakukan pada penelitian ini adalah :
1. Studi Literatur
Pada tahapan ini penulis mengumpulkan dan mempelajari informasi yang
diperoleh dari buku, skripi, jurnal, dan berbagai sumber informasi lainnya.
Informasi yang berkaitan dengan penelitian tersebut seperti makhraj huruf
hijaiyah, metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW
(Dynamic Time Warping) dalam mendeteksi suara.

2. Analisis Permasalahan dan Perancangan Sistem


Pada tahap selanjutnya penulis menganalisis permasalahan dari informasi yang
didapat pada tahapan sebelumnya agar diperoleh metode yang tepat untuk
mengatasi masalah dalam penelitian ini. Kemudian melakukan perancangan
sistem yang sesuai dari hasil analisis permasalahan yang telah dilakukan. Pada
penelitian ini, arsitektur umum dari perancangan sistem yang akan dibuat adalah
sebagai berikut :

Input

Proses

Output

Gambar 1.1 Arsitektur umum


Arsitektur umum pada penelitian yang akan dilakukan terbagi atas 3 yaitu input, proses,
dan output :
2.1 Input
Input suara yang pertama berupa sampling wave suara huruf hijaiyah
sudah benar pengucapannya yang menjadi data training kemudian di ekstrasi
ciri suara menggunakan MFCC dan dicocokkan polanya menggunakan
metode DTW untuk input suara kedua yang merupakan tester.Proses
pencocokan dilakukan antara suara yang diinputkan dengan sinyal suara
referensi yang tersimpan dalam database. Jika terdapat kecocokan, maka
akan muncul notifikasi bahwa makhraj huruf hijaiyah yang dicuapkan sudah
benar.Jika sebaliknya, maka muncul notifikasi bahwa makhraj huruf hijaiyah
salah.
2.2 Proses
Pada tahap ini merupakan proses ekstrasi ciri suara menggunakan MFCC
dari input yang diberikan.Berikut merupakan diagram alur MFCC pada gambar
1.2 :

Gambar 1.2
2.2.1 DC-Removal
Remove DC Components bertujuan untuk menghitung rata-rata dari data
sampel suara, dan mengurangkan nilai setiap sampel suara dengan nilai rata-
rata tersebut. Tujuannya adalah mendapat normalisasi dari data suara input.

2.2.2 Pre – emphasize


Pre – emphasize merupakan salah satu jenis filter yang sering digunakan
sebelum sebuah signal diproses lebih lanjut. Filter ini mempertahankan
frekuensi-frekuensi tinggi pada sebuah spektrum, yang umumnya tereliminasi
pada saat proses produksi suara.

2.2.3 Frame Blocking


Karena signal suara terus mangalami perubahan akibat adanya pergeseran
artikulasi dari organ produksi vocal, signal harus diproses secara short
segments (short frame). Panjang frame yang biasanya digunakan untuk
pemrosesan signal adalah antara 10-30 milidetik. Panjang frame yang
digunakan sangat mempengaruhi keberhasilan dalam analisa spektral. Di satu
sisi, ukuran dari frame harus sepanjang mungkin untuk dapat menunjukkan
resolusi frekuensi yang baik.

2.2.4 Windowing
Proses framing dapat menyebabkan terjadinya kebocoran spektral (spectral
leakage) atau aliasing. Aliasing adalah signal baru dimana memiliki frekuensi
yang berbeda dengan signal aslinya. Efek ini dapat terjadi karena rendahnya
jumlah sampling rate, ataupun karena proses frame blocking dimana
menyebabkan signal menjadi discontinue. Untuk mengurangi kemungkinan
terjadinya kebocoran spektral, maka hasil dari proses framing harus melewati
proses window.Sebuah fungsi window yang baik harus menyempit pada
bagian main lobe dan melebar pada bagian side lobe-nya.
2.2.5 Fast Fourier Transform
Suatu fungsi dengan periode terbatas dapat dinyatakan dalam deret fourier.
Transfomasi fourier digunakan untuk mengubah deret sinyal domain waktu
berbatas menjadi spektrum frekuensi. Frame yang telah mengalami proses
windowing diubah menjadi spektrum frekuensi.

2.2.6 Mel Frequency Warping


Mel Frequency Wrapping umumnya dilakukan dengan menggunakan
Filterbank. Filterbank adalah salah satu bentuk dari filter yang dilakukan
dengan tujuan untuk mengetahui ukuran energi dari frequency band tertentu
dalam signal suara. Filterbank dapat diterapkan baik pada domain waktu
maupun pada domain frekuensi, tetapi untuk keperluan MFCC, filterbank
harus diterapkan dalam domain frekuensi.

2.2.7 Discrete Cosine Transfomr


DCT merupakan langkah terakhir dari proses utama MFCC feature extraction.
Konsep dasar dari DCT adalah mendekorelasikan mel spectrum sehingga
menghasilkan representasi yang baik dari property spektral local.

2.2.8 Cepstral liftering


Hasil dari proses utama MFCC feature extraction memiliki beberapa
kelemahan. Low order dari cepstral coefficients sangat sensitif terhadap
spectral slope, sedangkan bagian high ordernya sangat sensitif terhadap noise.
Oleh karena itu, cepstral liftering menjadi salah satu standar teknik yang
diterapkan untuk meminimalisasi sensitifitas tersebut.Cepstral liftering dapat
dilakukan dengan mengimplementasikan fungsi window terhadap cepstral
features.
Dalam beberapa jurnal dikatakan bahwa cepstral liftering dapat meningkatkan
akurasi dari aplikasi pengeluaran suara, baik speaker recognition maupun
speech recognition.
2.3 Output
Secara keseluruhan, proses dimulai dengan input suara data training yaitu
pengucapan suara makhraj huruf hijaiyah yang sudah benar, kemudian
diekstraksi cirinya dengan metode MFCC dan dicocokkan polanya dengan
input suara kedua yaitu data tester menggunakan metode DTW. Proses
pencocokan dilakukan antara suara yang diinputkan dengan sinyal suara
referensi yang tersimpan dalam database. Jika terdapat kecocokan, maka
output berupa notifikasi bahwa makhraj huruf hijaiyah sudah benar
pengucapannya Jika sebaliknya, maka notifikasi bahwa makhraj huruf hijaiyah
masih salah dalam pengucapannya.

3. Dokumentasi dan Penyusunan Laporan


Tahap terakhir yang akan dilakukan yaitu membuat dokumentasi dan menyusun
laporan dari hasil penelitian yang telah dilakukan.

Untuk rencana judul tugas akhir “Deteksi Pengucapan Makhrajul Huruf Hijaiyah
Berbasis Voice Recognition Menggunakan Metode Mel Frequency Cepstrum Coefficient
dan Dynamic Time Warping ” dari hasil pencarian yang dilakukan, ditemukan
beberapa jurnal ilmiah mengenai voice recognition yang dijadikan sebagai referensi
dan beberapa informasi pendukung lainya.Informasi yang diberikan dari referensi
tersebut merupakan penggunaan algoritma MFCC dan DTW untuk penerapan di
dalam voice recognition.
Selanjutnya, penulis melakukan penelusuran terhadap beberapa karya ilmiah yang
relevan dalam bentuk jurnal, Adapun karya-karya tersebut antara lain :
Tabel 1. Penelitian Terdahulu

No Peneliti Judul Penelitian Tahun Metode

1 Zulham Sistem Penguncian Pintu 2015 MFCC (Mel Frequency


Effendi dan Menggunakan Voice Recognition Cepstrum Coefficients) dan
Firdaus DTW (Dynamic Time Warping)
2 M.Tri Penerapan Speech Recognition Pada 2016 Hidden Markov Model (Hmm)
Satria Jaya Permainan Teka-Teki Silang
dan Boko Menggunakan Metode Hidden
Susilo Markov Model (Hmm) Berbasis
Desktop
3 Sahil Recognizing Voice For Numerics 2013 MFCC (Mel Frequency
Verma dan Using Mfcc And Dtw Cepstrum Coefficients) dan
Tarun DTW (Dynamic Time Warping)
Gullati
4 Ming So Vietnamese Voice Recognition for 2015 MFCC (Mel Frequency
Nguyen Home Automation using MFCC and Cepstrum Coefficients) dan
dan Tu DTW Techniques DTW (Dynamic Time Warping)
Lanh Vo

1.7 Tinjauan Pustaka


a. Makhraj
Makhraj ditinjau dari morfologi berasal dari fi’il madli: ‫ خ ََر َج‬yang
artinya keluar. Lalu dijadikan ber-wazan ‫ َم ْفعَل‬yang ber-sighat isim makan,
maka menjadi ‫ َم ْخ َرج‬. Bentuk jamaknya adalah: ‫ارج‬ ِ ‫ َم َخ‬. Karena itu, makharijul
ِ ‫َار ُج ْال ُح ُر ْو‬
huruf (‫ف‬ ِ ‫ ) َمخ‬yang diindonesiakan menjadi makhraj huruf, artinya:
tempat-tempat keluar huruf.Secara bahasa, makhraj artinya tempat keluar.
Sedangkan menurut istilah, makhraj adalah suatu nama tempat yang padanya
huruf dibentuk atau diucapkan.Dengan demikian, makhraj huruf adalah
tempat keluarnya huruf pada waktu huruf tersebut dibunyikan.
Untuk mengetahui makhraj suatu huruf, hendaklah huruf tersebut disukunkan
atau ditasydidkan, kemudian tambahkan satu huruf hidup di belakangnya, lalu
bacalah. Tatkala suara tertahan, maka tampaklah makhraj huruf dari huruf
yang bersangkutan.
Contoh:
‫ب‬ (huruf ba’) menjadi ْ‫اَب‬ (dibaca: ab) atau ‫اَب‬ (dibaca: abb)
‫س‬ (huruf sin) ْ َ‫ا‬
menjadi ‫س‬ (dibaca: as) atau ‫اَس‬ (dibaca: ass)
‫( ق‬huruf qaf) menjadi ‫( ا َ ْق‬dibaca: aq) atau ‫( اَق‬dibaca: aqq)

b. Huruf Hijaiyah
Jumlah huruf `Arab aslinya sebanyak 29 huruf.Terdapat perbedaan
penyebutan nama huruf-huruf `Arab menurut ahli bahasa `Arab (ahli nahwu
atau nahwiyyin) dengan ahli qira'ah. Menurut ahli bahasa `Arab, nama-nama
huruf dibaca dengan menambah Alif Lâm di depannya dan huruf Hamzah di
belakangnya. Misalnya, huruf Bâ (‫ ) ب‬diberi nama al-Ba'u,ditulis ُ‫ ا َ ْلبَاء‬,sehingga
ketika dibaca menjadi berbunyi: Bâ' atau Bâk.
Cara membaca ini bertentangan dengan kaidah bacaan yang digunakan
oleh ahli qira'ah, sebab ahli qira'ah merujuk kepada bacaan Al-Qur'an pada Huruf-
huruf Pembuka Al-Qur'an seperti ‫ طه‬, ‫ حم‬, dll, dimana tidak pernah diajarkan
secara sima`i (mendengar langsung) bahwa huruf-huruf tersebut dibaca
menjadi Thâ' Hâ' (atau Thâk Hâk), Hâ' Mim (atau Hâk Mim), melainkan wajib
dibaca Thâ Hâ dan Hâ Mîm.
Dengan demikian, nama huruf-huruf selain huruf Pembuka Al-
Qur'an tersebut, misalnya huruf Bâ (‫) ب‬, dapat diqiyaskan bacaannya sama
dengan huruf-huruf Pembuka Al-Qur'an tersebut, sehingga dibaca tanpa
mengeluarkan bunyi huruf Hamzah pada akhirnya.Keterangan mengenai nama-
nama huruf `Arab menurut kaidah ahli qira'ah tersebut dapat dibaca pada kitab
standar pengajaran Al-Qur'an yang digunakan di Saudi `Arabia, berjudul Qaidah
al-Makkiyah.
Transliterasi (perubahan tulisan huruf) Arab ke Latin sejauh ini belum
memiliki standar yang berlaku universal, bergantung masing-masing negara atau
bahkan masing-masing penerbit tulisan. Tabel transliterasi di atas merujuk kepada
apa yang tertulis dalam Kamus Besar Bahasa Indonesia, kecuali untuk
huruf Hâ (‫) ح‬, Shôd (‫) ص‬, Dhôd (‫) ض‬, Thô (‫ ) ط‬Zhô (‫ ) ظ‬dan Hâ (‫) هـ‬.

c.

Anda mungkin juga menyukai