Anda di halaman 1dari 14

UNIVERSITAS DIPONEGORO

APLIKASI PENGENAL PENGUCAP BERBASIS


IDENTIFIKASI SUARA DENGAN EKSTRAKSI CIRI MEL-
FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN
KUANTISASI VEKTOR

TUGAS AKHIR

MEGA TIARA NUR AZIZAH


21060113120063

FAKULTAS TEKNIK
DEPARTEMEN TEKNIK ELEKTRO
PROGRAM STUDI SARJANA
SEMARANG
OKTOBER 2017
UNIVERSITAS DIPONEGORO

APLIKASI PENGENAL PENGUCAP BERBASIS


IDENTIFIKASI SUARA DENGAN EKSTRAKSI CIRI MEL-
FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN
KUANTISASI VEKTOR

TUGAS AKHIR

Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Teknik

MEGA TIARA NUR AZIZAH


21060113120063

FAKULTAS TEKNIK
DEPARTEMEN TEKNIK ELEKTRO
PROGRAM STUDI SARJANA
SEMARANG
OKTOBER 2017

i
HALAMAN PERNYATAAN ORISINALITAS

Skripsi ini adalah hasil karya saya sendiri,


dan semua sumber baik yang dikutip maupun yang dirujuk
telah saya nyatakan dengan benar.

NAMA : Mega Tiara Nur A.


NIM : 21060113120063
Tanda Tangan :

Tanggal : Oktober 2017

ii
HALAMAN PENGESAHAN

Tugas Akhir ini diajukan oleh :


NAMA : MEGA TIARA NUR AZIZAH
NIM : 21060113120063
Jurusan/Program Studi : TEKNIK ELEKTRO / S1
Judul Skripsi : APLIKASI PENGENAL PENGUCAP BERBASIS
IDENTIFIKASI SUARA DENGAN EKSTRAKSI
CIRI MEL-FREQUENCY CEPSTRUM
COEFFICIENT DAN KUANTISASI VEKTOR

Telah berhasil dipertahankan di hadapan Tim Penguji dan diterima sebagai


bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana pada
Jurusan/ Program Studi TEKNIK ELEKTRO/S1, Fakultas TEKNIK,
Universitas Diponegoro.

TIM PENGUJI

Pembimbing 1 : Achmad Hidayatno, S.T., M.T. (..............................)

Pembimbing 2 : Yuli Christyono S.T., M.T. (...............................)

Penguji 1 : Ajub Ajulian Zahra M S.T., M.T. (...............................)

Penguji 2 : Teguh Prakoso S.T., M.T., Ph.D. (...............................)

Semarang, 26 Oktober 2017

Ketua Departemen Teknik Elektro,

Dr. Wahyudi, S.T., M.T.


NIP.196906121994031001

iii
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI
TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademika Universitas Diponegoro, saya yang bertanda tangan di


bawah ini :

Nama : MEGA TIARA NUR AZIZAH


NIM : 21060113120063
Program Studi : SARJANA (S1)
Departemen : TEKNIK ELEKTRO
Fakultas : TEKNIK
Jenis Karya : TUGAS AKHIR

demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada


Universitas Diponegoro Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty
Free Right) atas karya ilmiah saya yang berjudul :

APLIKASI PENGENAL PENGUCAP BERBASIS IDENTIFIKASI SUARA


DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM
COEFFICIENT DAN KUANTISASI VEKTOR

beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas


Royalti/Noneksklusif ini Universitas Diponegoro berhak menyimpan,
mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data (database),
merawat dan mempublikasikan tugas akhir saya selama tetap mencantumkan nama
saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di : SEMARANG
Pada Tanggal :

Yang menyatakan,

( MEGA TIARA N.A)


21060113120063

iv
ABSTRAK

Kemajuan teknologi dalam bidang Pengolahan Sinyal Digital telah


berkembang pesat dan membawa dampak positif dalam kehidupan manusia. Salah
satu disiplin ilmu dalam pengolahan sinyal digital yang memberikan dampak yang
cukup besar ialah bidang Pengolahan Suara Digital. Pengolahan suara digital
dapat dikembangkan berbagai aplikasi yang dapat mempermudah kehidupan
manusia. Salah satu pengembanganya adalah pengenalan suara. Pengenalan
pengucap dapat digunakan untuk sistem keamanan, absensi dan lain sebagainya.
Program pengenal pengucap ini menggunakan ekstraksi ciri Mel Frequency
Cepstrum Coefficient (MFCC) dan Kuantisasi Vektor untuk menghasilkan
koefisien-koefisien ciri dari masing-masing suara responden. Dengan menghitung
jarak Euclidean dan jarak Mahalanobis terdekat maka akan diambil keputusan
atas kepemilikan suara pengucap. Apabila hasil keputusan dengan menggunakan
jarak Euclidean dan jarak Mahalanobis sama atau match maka suara pengucap
tersebut akan dikenali sedangkan apabila hasil keputusan antara kedua jarak
tersebut berbeda maka pengucap tidak akan dikenali. Pengujian dilakukan dalam
3 variasi yaitu variasi sample rate, ukuran codebook, dan kondisi tidak ideal/salah.
Hasil pengujian pada variasi sample rate didapat akurasi tertinggi pada saat
sample rate bernilai 16000Hz yaitu sebesar 83,3%, sedangkan pada variasi ukuran
codebook didapat akurasi tertinggi pada saat ukuran codebook 16 dan hasil
pengujian dengan kondisi tidak ideal/salah didapatkan akurasi 100%.

Kata Kunci : MFCC, Kuantisasi Vektor, Jarak Mahalanobis, Jarak Euclidean,


Pengenalan Pengucap.

v
ABSTRACT

Technology advances in Digital Signal Processing sector is rapidly


developing and brings positive impacts into human’s life. One of study disciplines
in digital signal processing that brings significant impact is the Digital Voice
Processing sector. Digital voice processing can be developed into various
application that can give ease to human’s life. One of the development is speaker
recognition. Speaker recognition can be used for security system, attendance and
many more. This Speaker Recognition program is using Mel Frequency Cepstrum
Coefficient (MFCC) characteristic extraction and Vector Quantity to generate
characteristic coefficients from each respondent’s speech. By calculating the
closest Euclidean range and Mahalanobis range, decision of speech’s voice
ownership will be taken. If the decision using Euclidean range and Mahalanobis
range is same or matched then the speech will be recognized, while if the decision
of those two range is different then the speech will not be recognized. The program
is tested in 3 variations that is sample rate, codebook size and not ideal/wrong
conditions variations. Testing result in sample rate variation is obtained that the
higher accuracy is when the sample rate is 16000 Hz as much as 83,3%. While in
the codebook size variation highest accuracy is obtained when the codebook size is
16 and the not ideal/wrong condition variation testing has 100% accuracy

KeyWord : MFCC, Vector Quantity, Mahalanobis Range, Euclidean Range,


Speaker Recognition.

vi
KATA PENGANTAR

Puji dan syukur penulis ucapkan kepada Tuhan Yang Maha Esa atas berkat
dan karunia-Nya, sehingga pelaksanaan tugas akhir dan penyusunan laporan ini
dapat terselesaikan.
Tugas akhir dengan judul “Aplikasi Pengenal Pengucap dengan Ekstraksi
Ciri Mel Frequency Cepstrum Coefficient (MFCC) dan Kuantisasi Vektor” Teknik
Elektro Fakultas Teknik Universitas Diponegoro Semarang.
Rasa terima kasih yang tulus kami ucapkan kepada semua pihak yang telah
membantu selama pelaksanaan tugas akhir ini.
1. Kedua Orang tua penulis yang sangat penulis sayangi dan hormati, beserta
seluruh keluarga besar yang tanpa henti-hentinya memberikan dukungan,
semangat dan kasih sayang kepada penulis agar dapat menyelesaikan Tugas
Akhir.
2. Bapak Dr. Wahyudi, S.T., M.T., selaku Ketua Departemen Teknik Elektro
Fakultas Teknik Universitas Diponegoro Semarang.
3. Bapak Achmad Hidayato, S.T., M.T., Bapak Yuli Christyono, S.T.,M.T.,.
selaku Dosen Pembimbing I, dan II.
4. Bapak Yuli Christiyono, S.T., M.T., selaku koordinator Tugas Akhir Teknik
Elektro Fakultas Teknik Universitas Diponegoro Semarang.
5. Budi Setyono, S.T., M.T., selaku Dosen Wali penulis yang memotivasi
untuk mengerjakan Tugas Akhir penulis.
6. Ferry Aditya Sandjojo yang telah memberi semangat kepada penulis selama
mengerjakan Tugas Akhir.
7. Teman-teman kontrakan Lulu, Sela, Elok, Momon, Iren yang telah memberi
motivasi penulis dalam mengerjakan Tugas Akhir.
8. Rekan - rekan konsentrasi Telekomunikasi 2013 yang telah bersama-sama
selama ini Albert Parlys, Erizco, Kresna, Rifqi Fadhilah, Menpo VDG, Arif
Munandar, Khusnil Mujib, Harry Bintang, Liya Yusrina, Aisya Fariza, Arki,
Denti AD, Diana Murianti, Lia K., Lulu M, dan Riska Aristantya.

vii
9. Semua rekan-rekan angkatan 2013 Teknik Elektro Universitas Diponegoro
semoga kita selalu kompak sampai seterusnya kelak.
10. Dan semua pihak yang tidak dapat penulis sebutkan satu persatu.

Penulis menyadari bahwa dalam penyusunan laporan Tugas Akhir ini masih
terdapat banyak kekurangan, walaupun demikian penulis berharap laporan Tugas
Akhir ini dapat memberikan manfaat dan menambah pengetahuan bagi kita semua
khususnya di bidang pengolahan citra digital.

Semarang, 26 Oktober 2017

Penulis

viii
DAFTAR ISI

HALAMAN JUDUL .............................................................................................. i


HALAMAN PERNYATAAN ORISINALITAS ................................................ ii
HALAMAN PENGESAHAN .............................................................................. iii
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI......................... iv
ABSTRAK ..............................................................................................................v
ABSTRACT .......................................................................................................... vi
KATA PENGANTAR ......................................................................................... vii
DAFTAR ISI ......................................................................................................... ix
DAFTAR GAMBAR ............................................................................................ xi
DAFTAR TABEL ............................................................................................... xii
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Tujuan ....................................................................................................... 3
1.3 Batasan Masalah ....................................................................................... 3
1.4 Sistematika Penulisan ............................................................................... 4
BAB II DASAR TEORI ........................................................................................ 5
2.1 Teori Dasar Ucapan .................................................................................. 5
2.1.1 Proses Produksi Ucapan .................................................................... 6
2.1.2 Bunyi dan Ciri Ucapan ...................................................................... 7
2.2 Pengenal Pengucap (Speaker Recognition) .............................................. 8
2.3 Ekstraksi Ciri Sinyal Suara..................................................................... 10
2.3.1 Frame Blocking ............................................................................... 11
2.3.2 Windowing ...................................................................................... 12
2.3.3 Discrete Fourier Transform dan Fast Fourier Transform ............. 13
2.3.4 Mel Frequency Wrapping ............................................................... 14
2.3.5 Cepstrum ......................................................................................... 15
2.4 Kuantisasi Vektor .................................................................................. 16
2.5 Perhitungan Jarak Penyimpangan .......................................................... 18
BAB III PERANCANGAN PERANGKAT LUNAK....................................... 20
3.1 Perangkat yang Digunakan ..................................................................... 20
3.2 Perancangan Perangkat Lunak ............................................................... 20
3.2.1 Tahap Pre Processing ...................................................................... 22
3.2.2 Proses Pelatihan .............................................................................. 22
3.2.3 Proses Pengujian ............................................................................. 29

ix
3.3 Perancangan Tampilan ........................................................................... 32
3.3.1 Rancangan Tampilan Menu Awal ................................................... 32
3.3.2 Rancangan Tampilan Menu Utama ................................................. 33
BAB IV PENGUJIAN DAN ANALISA ............................................................ 38
4.1 Pengujian dengan Variasi Sample rate ................................................... 38
4.1.1 Pengujian dengan Sample rate 8000Hz .......................................... 38
4.1.2 Pengujian dengan sample rate 16000Hz ......................................... 40
Tabel 4. 2 Data Pengujian dengan Sample rate 16000Hz. ................................ 41
4.1.3 Pengujian dengan sample rate 44100Hz ......................................... 42
4.2 Pengujian dengan Variasi ukuran Codebook.......................................... 45
4.2.1 Pengujian dengan ukuran codebook 4 ............................................. 46
4.2.2 Pengujian dengan ukuran codebook 8 ............................................. 48
4.2.3 Pengujian dengan ukuran codebook 16 ........................................... 50
4.3 Pengujian dengan kondisi salah.............................................................. 53
4.3.1 Pengujian dengan data yang tidak dilatih........................................ 53
4.4 Analisa Keandalan Jarak Euclidean dan Jarak Mahalanobis ................. 54
4.5 Rekapitulasi Hasil Pengujian.................................................................. 59
BAB V PENUTUP ............................................................................................... 61
5.1 Kesimpulan ................................................................................................ 61
5.2 Saran ........................................................................................................... 62
DAFTAR PUSTAKA .......................................................................................... 63
BIODATA MAHASISWA ............................................................................... 65
LAMPIRAN ......................................................................................................... 66

x
DAFTAR GAMBAR

Gambar 2. 1 Skema organ vokal manusia. .............................................................. 6


Gambar 2. 2 Diagram blok proses identifikasi pengucap. ...................................... 9
Gambar 2. 3 Diagram blok proses verifikasi pengucap. ......................................... 9
Gambar 2. 4 Proses MFCC. .................................................................................. 10
Gambar 2. 5 Mel Frequency Wrapping. ............................................................... 15
Gambar 2. 6 Ilustrasi pengelompokan codebook dan centroid. ............................ 17
Gambar 3. 1 Diagram blok pengenalan pengucap. ............................................... 21
Gambar 3. 2 Diagram alir proses pelatihan. .......................................................... 23
Gambar 3. 3 Diagram alir LBG (Rabiner and Juang, 1993). ................................ 26
Gambar 3. 4 Diagram alir proses pengujian.......................................................... 29
Gambar 3. 5 Tampilan GUI menu awal. ............................................................... 32
Gambar 3. 6 Tampilan Menu Utama..................................................................... 33
Gambar 3. 7 Tampilan proses pelatihan. ............................................................... 34
Gambar 3. 8 Tampilan proses perekaman suara. .................................................. 34
Gambar 3. 9 Tampilan proses penyimpanan suara. .............................................. 35
Gambar 3.10 Tampilan GUI proses pengujian ketika suara berhasil dikenali. ..... 36
Gambar 3. 11 Tampilan GUI proses pengujian ketika suara tidak dikenali. ........ 36
Gambar 4. 1 Pengaruh nilai Sample rate terhadap akurasi ................................... 43
Gambar 4. 2 Grafik Akurasi sistem terhadap ukuran Codebook .......................... 50
Gambar 4.3 perbandingan keberhasilan jarak Euclidean dan jarak Mahalanobis..58

xi
DAFTAR TABEL

Tabel 4. 1 Data Pengujian dengan sample rate 8000Hz........................................ 37


Tabel 4. 2 Data Pengujian dengan Sample rate 16000Hz. .................................... 39
Tabel 4. 3 Data Pengujian dengan Sample rate 44100Hz. .................................... 41
Tabel 4. 4 Data Pengujian dengan ukuran codebook 4. ........................................ 44
Tabel 4. 5 Data Pengujian dengan ukuran codebook 8. ........................................ 46
Tabel 4. 6 Data Pengujian dengan ukuran codebook 16. ...................................... 48
Tabel 4. 7 Data Pengujian dengan responden salah. ............................................. 51
Tabel 4. 8 Perbandingan hasil dari jarak Euclidean .............................................. 53
Tabel 4. 9 Perbandingan hasil dari jarak Mahalanobis ......................................... 55

xii
viii

Anda mungkin juga menyukai