Anda di halaman 1dari 4

PENCOCOKAN POLA SUARA (SPEECH RECOGNITION)

DENGAN ALGORITMA FFT DAN DIVIDE AND CONQUER

Gressia Melissa – NIM 13506017

Program Studi Teknik Informatika


Sekolah Teknik Elektro dan Informatika
Institut Teknologi Bandung
Jalan Ganesha nomor 10 Bandung
e-mail: if16017@students.if.itb.ac.id , ghe_gressia@yahoo.com

ABSTRAK seseorang dalam database berisi record karakter


seseorang. Sedangkan verifikasi adalah menentukan
Voice recognition dibagi menjadi dua jenis, yaitu apakah seseorang sesuai dengan apa yang dikatakan
speech recognition dan speaker recognition. Speech terhadap dirinya.
recognition adalah proses identifikasi suara Biometric recognition merupakan sistem pengenalan
berdasarkan kata yang diucapkan. Parameter yang atau identifikasi seseorang berdasarkan karakteristik
dibandingkan ialah tingkat penekanan suara yang biologis khusus yang dimiliki oleh orang tersebut.
kemudian akan dicocokkan dengan template database Fungsinya selain untuk sistem keamanan dengan
yang tersedia. Sedangkan sistem pengenalan suara mengenali identitas seseorang, juga untuk identifikasi
berdasarkan orang yang berbicara dinamakan penyakit yang diderita seseorang, keperluan militer, dan
speaker recognition. Pada makalah ini hanya akan lain-lain. Aplikasi biometric recognition antara lain
dibahas mengenai speech recognition karena retinal scan (identifikasi berdasarkan pola pembuluh
kompleksitas algoritma yang diimplementasikan darah pada retina mata), fingerprint recognition
lebih sederhana daripada speaker recognition. (identifikasi pola sidik jari unik pada setiap orang), face
recognition (pengenalan seseorang berdasarkan raut dan
Algoritma yang akan diimplementasikan pada ekspresi seseorang dengan kunci utama pada letak mata
bahasan mengenai proses speech recognition ini dan mulut), dan voice recognition.
adalah algoritma FFT (Fast fourier transform), yaitu Sedangkan voice recognition sendiri dibagi menjadi
algoritma yang cukup efisien dalam pemrosesan dua jenis, yaitu speech recognition dan speaker
sinyal digital (dalam hal ini suara) dalam bentuk recognition. Berbeda dengan speaker recognition yang
diskrit. Algoritma ini mengimplementasikan merupakan pengenalan identitas yang diklaim oleh
algoritma Divide and Conquer untuk pemrosesannya. seseorang dari suaranya (siri khusus dapat berupa
Konsep utama algoritma ini adalah mengubah sinyal intonasi suara, tingkat kedalaman suara, dan sebagainya),
suara yang berbasis waktu menjadi berbasis speech recognition adalah proses yang dilakukan
frekuensi dengan membagi masalah menjadi komputer untuk mengenali kata yang diucapkan oleh
beberapa upa masalah yang lebih kecil. Kemudian, seseorang tanpa mempedulikan identitas orang terkait.
setiap upa masalah diselesaikan dengan cara Implementasi speech recognition misalnya perintah suara
melakukan pencocokan pola digital suara. untuk menjalankan aplikasi komputer.
Algoritma FFT (Fast fourier transform) merupakan
Kata kunci: divide and conquer, FFT, identifikasi, salah satu metode untuk transformasi sinyal suara
perbandingan, recognition, speech, spektrum, suara, menjadi sinyal frekuensi. Artinya proses perekaman
transformasi. suara disimpan dalam bentuk digital berupa gelombang
spektrum suara berbasis frekuensi.
Sedangkan algoritma implementasi algoritma divide
and conquer terletak pada pembagian objek
permasalahan (data digital) menjadi upa masalah yang
1. PENDAHULUAN diselesaikan secara rekursif dan kemudian
menggabungkan solusi masing-masing upa masalah
Biometrik, termasuk di dalamnya speech recognition, sehingga membentuk solusi masalah semula pada tahap
secara umum digunakan untuk identifikasi dan verifikasi. akhir.
Identifikasi ialah mengenali identitas seseorang,
dilakukan perbandingan kecocokan antara data biometric

MAKALAH IF2251 STRATEGI ALGORITMIK TAHUN 2008


2. IDENTIFIK
KASI POLA
A Secaara umum, sppeech recognizzer memprosees sinyal
suara yang masuk dan menyimppannya dalam m bentuk
2.1
1 Skema Uta
ama Speech
h Recognitioon digitall. Hasil prosses digitalisassi tersebut kkemudian
dikonv versi dalam bbentuk spektrrum suara yanng akan
Terdapat 4 laangkah utama dalam sistem pengenalan dianallisa dengan m membandingkan nnya dengan template
suaara : suara pada databasse sistem. Seebelumnya, daata suara
[1] Penerimaan data input masukkan dipilah-piilah dan dipproses satu per p satu
[2] Ekstraksi, yaitu penyimpanaan data masukaan sekaligus berdassarkan urutannnya. Pemilahaan ini dilakukkan agar
pembuatan daatabase untuk template.
t prosess analisis dapatt dilakukan seccara paralel.
[3] Pembandingaan / pencocokan n, yaitu tahap pencocokan
p Prosses yang pertaama kali dilaku ukan ialah meemproses
data baru denggan data suaraa (pencocokan tata
t bahasa) gelommbang kontinu spektrum suuara ke dalam m bentuk
pada templatee. diskritt. Langkah berrikutnya ialah proses kalkullasi yang
[4] Validasi identtitas pengguna.. dibagii menjadi dua bbagian :
[1] Traansformasi gellombang diskriit menjadi arraay data.
[2] Unntuk masing-m masing elemen padap array datta, hitung
“keetinggian” geloombang (freku uensi).
Objek permasalahhan yang akan dibagi adalah masukanm
beruku uran n, berupa data diskrit geelombang suaraa.
Ketiika mengkonvversi gelombaang suara kee dalam
bentukk diskrit, geelombang dipperlebar dengan cara
mempperinci berdasaarkan waktu. Hal H ini dilakukkan agar
prosess algoritma sellanjutnya (pen ncocokan) lebihh mudah
dilakuukan. Namun, efek buruknyaa ialah array of array
data yang
y terbentuk akan lebih bannyak.

Fre
ekuensi

Gambarr 1. Skema Speeech Recognittion

2 Proses Pen
2.2 ncocokan Pola Suara
Wakttu

Gambar
G 3. Con
ntoh Hasil Konv
versi Sinyal Disk
krit

Daari tiap elemenn array data tersebut,


t dikonnversi ke
dalam
m bentuk bilanggan biner. Daata biner tersebbut yang
nantinnya akan dibanddingkan dengaan template datta suara.

Prooses divide andd conquer :


[1] Pillih sebuah anggka N, dimana N merupakan bilangan
buulat kelipatan 2. Bilangan ini berfungssi untuk
meenghitung jumllah elemen trannsformasi FFT.
[2] Bagi dua data diskrit secaraa (dengan mennerapkan
alggoritma dividee and conquerr) menjadi datta diskrit
yan ng lebih kecil bberukuran N = N1.N2 .
[3] Up pa masalah (obbjek data) dimaasukkan ke dallam tabel
(seebagai elemen tabel).
Gambar 2. Spekttrum Suara
[4] Untuk setiap elemen data, dicocokkan dengan d data
pada template (pada data template jugaa dilakukan
pemrosesan digitalisasi
d mennjadi data disk krit, dengan
cara yang sama
s dengan proses digitaalisasi data
masukan baruu yang ingin diccocokkan).
[5] Setiap upa masalah
m disatukkan kembali daan dianalisis
secara keselurruhan, kecoco okan dari segi tata bahasa
dan apakah data
d yang diucaapkan sesuai dengan
d kata
yang tersedia pada template data.
[6] Verifikasi datta. Jika sesuai, proses lebih laanjut, sesuai
dengan apllikasi yang mengimpleementasikan
algoritma ini.

Gambaar 5. Microsoft Dictation

Gambar
G 4. Perbaandingan Arrayy Data dengan Template
Gambar 6. Microsofft Voice

3. APLIKASII
Terdapat bebberapa pilihan n yang dapatt dilakukan 4. KE
ESIMPULA
AN
selaanjutnya, s
sesuai den
ngan aplikaasi yang
diim
mplementasikaan, di antaranyya ialah voicee command. Speech recogniition merupakkan salah saatu jenis
Komputer akan melakukan perintah sesu uai dengan biomeetric recognitioon, yaitu prosees komputer mengenali
m
maasukan penggu una. Contohnyaa pada aplikassi Microsoft apa yaang diucapkan seseorang berddasarkan intonnasi suara
Voiice, ketika peengguna menggatakan “Starrt Notepad” yang dikonversi
d ke ddalam bentuk digital
d print.
denngan intonasi dan tata bahassa yang sesuai, komputer Pengenalan pola suara adalah salah
s satu aplikkasi yang
akaan segera melakukan
m oses seperti yang telah
pro berkemmbang saat inii. Sistem ini mengijinkan
m kiita untuk
dijeelaskan pada bab sebelumnnya. Jika sesuai dengan berkommunikasi antarra manusia den ngan memasukkkan data
dafftar perintah yang tersedia, aplikasi
a akan memastikan
m ke komputer.
k Sallah satu funngsinya ialahh untuk
katta dengan men nampilkan tulissan “Do you asked
a me to meninngkatakan efisiensi industri manufaktur,
m meengontrol
‘Start Notepad’?”. Untuk mem mverifikasinyaa, pengguna mesin dengan berbiccara pada mesinn itu.
cukkup mengatak kan “Do it”. Dan lagi-llagi proses Algoritma yang diimplementaasikan untuk masalah
pennerimaan suaraa dilakukan seeperti yang teelah dibahas pengennalan suara ini adalah algoritma
a divvide and
padda bab sebelummnya. conquuer. Proses aawalnya ialah h mengkonverrsi data
Aplikasi lain
nnya adalah Microsoft
M Dicttation yang spektrrum suara ke ddalam bentuk digital dan mengubah
m
meerupakan aplikaasi speech-to-ttext, yaitu mennuliskan apa dalam
m bentuk diskritt.
yanng diucapkan oleh
o pengguna.. Jika dikembaangkan lebih Daari bentuk diskrit itulaah yang kkemudian
lanj
njut, software inni akan sangat berguna bagi orang-orang
o mengaaplikasikan algoritma dividde and conqueer untuk
yanng mempunyai keterbatasan fisik
f atau gerak
k.
mengoptimalkan waktu pencocokan (kompleksitas
berkurang).
Contoh aplikasi yang menerapkan speech recognition
antara lain Microsoft Voice dan Microsoft Dictation.

REFERENSI
[1] Munir, Rinaldi, “Diktat Kuliah IF2251 Strategi
Algoritmik”, Program Studi Teknik Informatika ITB,
2007.
[2] http://agusza.its-sby.edu/kuliah/citra/bab4_detail.html.
2004. Diakses pada tanggal 19 Mei 2008, pukul 15.05
[3] http://www.dspguru.com/info/faqs/fftfaq.htm. Diakses pada
tanggal 20 Mei 2008, pukul 14.00
[4] http://mathworld.wolfram.com/FastFourierTransform.html.
Diakses pada tanggal 19 Mei 2008, pukul 15.30
[5] http://en.wikipedia.org/wiki/Spectrum_analyzer. Diakses
pada tanggal 20 Mei 2008 pukul 12.15
[6] http://en.wikipedia.org/wiki/Speaker_recognition. Diakses
pada tanggal 15 Mei 2008 pukul 20.10
[7] http://www.relisoft.com/Science/Physics/fft.html. Diakses
pada tanggal 20 Mei 2008, pukul 14.30

MAKALAH IF2251 STRATEGI ALGORITMIK TAHUN 2008

Anda mungkin juga menyukai