2017 (U) Proposal Tesis V02 Fix
2017 (U) Proposal Tesis V02 Fix
Disusun oleh:
Nama : Rofiuddin
NIM : 14.77.0196
Konsentrasi : Sistem Informasi
Rofiuddin
14.77.0196
ii
1. LATAR BELAKANG MASALAH
sinyal (signal processing). di zaman modern seperti saat ini, tentu tidak asing lagi
dengan teknologi Cortana, Siri, Google Now, robot Asimo dari Honda, system
manusia yang dapat dibedakan dengan mudah. Aplikasi dirancang agar dapat
ekstraksi ciri sinyal ucapan dilakukan untuk mendapatkan data berupa magnitudo.
Pengenalan ucapan telah di teliti lebih dari 80 tahun, dan selama periode
perumusan. Pada tahun 2001, pengenalan ucapan telah mencapai akurasi 80%, dan
tidak ada kemajuan lebih lanjut hingga 2010. (Swamy & Ramakrishnan, 2013)
dilakukan pembelajaran terhadap fitur atau ciri dari suatu sinyal. Terdapat dua
metode untuk melakukan ekstraksi sinyal ucapan, yaitu metode Linear Predictive
Ekstraksi ciri sinyal ucapan dalam penelitian ini menggunakan metode Mel
mengalisis sinyal wicara yang sangat baik dalam mempresentasikan sinyal. Cara
kerja MFCC didasarkan pada perbedaan frekuensi yang di tangkap oleh telinga
1
manusia, sehingga mampu mempresentasikan sinyal suara sebagaimana manusia
kritis terhadap frekuensi pada telinga manusia yang merupakan filter yang bekerja
secara linier pada frekuensi rendah dan bekerja secara logaritmik pada saat
frekuensi tinggi. Filter ini digunakan untuk menangkap karakteristik fonetis penting
dari sinyal ucapan. Untuk meniru kondisi telinga, karakteristik ini di gambarkan
dalam skala Mel-Frequency yang merupakan frekuensi rendah dibawah 1000 Hz,
dan frekuensi logaritmik di atas 1000 Hz (Setiawan, Hidayatno, & Isnanto, 2011).
K-Nearest Neighbor (KKN) adalah salah satu metode yang paling popular
menyelesaikan kinerja yang sangat baik dalam penelitian mereka pada rangkaian
data yang berbeda. KNN merupakan metode pengelompokan data (data clustering)
baru berdasarkan jarak data tersebut ke beberapa data atau tetangga (neighbor)
terdekat. Dalam hal ini jumlah tetangga terdekat ditentukan oleh pengguna yang di
ucapan dan memverifikasi ucapan dengan sangat cepat dan tepat dengan
2
pengenalan ucapan dan memberikan keputusan dengan target yang telah di
tentukan.
2. RUMUSAN MASALAH
dan Mel Frequency Cepstrum Coefficients (MFCC) pada proses analisis pengenalan
ucapan.
3. BATASAN MASALAH
Beberapa hal yang menjadi batasan masalah dalam penelitian ini adalah:
a. Penelitian ini fokus pada pengenalan ucapan yang didapat dari hasil ekstraksi
b. Data set terdiri atas 4 variable ucapan yaitu “kanan, kiri, depan, dan belakang”
dimana setiap variable tersebut direkam sebanyak 20 kali dan terdiri dari 6 ciri.
20 data record di bagi menjadi 16 record data latih dan 4 record data uji.
3
4. TUJUAN PENELITIAN
(KNN) dan Mel Frequency Cepstrum Coefficients (MFCC) pada proses analisis
pengenalan ucapan.
5. MANFAAT PENELITIAN
a. Menghasilkan penerapan system dengan metode MFCC dan KNN pada proses
b. Mengetahui kekurangan dan kelebihan dari penerapan metode MFCC dan KNN
6. TINJAUAN PUSTAKA
Penelitian terdahulu dilakukan oleh (Putra & Adi, 2011). Pada penelitian ini
system verifikasi suara dengan MFCC dianggap baik dalam ekstraksi fitur dalam
pengenalan suara, semakin banyak uji coba yang dilakukan oleh seseorang, maka
semakin baik pula kemampuan sisten dalam mengenali suara, metode Dynamic
Time Wrapping digunakan untuk membandingkan dua buah fitur suara hasil proses
4
dari MFCC, nilai-nilai parameter MFCC yang di gunakan mempengaruhi hasil dari
proses MFCC itu sendiri, sehingga pengaruh saat pencocokan data sangat tinggi,
hal yang dapat berpengaruh pada system verifikasi suara adalah panjang frame,
Pada penelitian tersebut, hasil terbaik yang di berikan system adalah pada
saat digunakan nilai parameter sebagai berikut: N=30 ms, M=15 ms, 33 koefisien
filterbank dan 25 koefisien MFCC, pengujian dilakukan pada kata satu, dua, tiga,
empat dan lima, dengan 36 orang pengguna, dan 6 buah sample acuan dan 1 sample
uji, untuk masing-masing kata dan diperoleh akurasi rata-rata sebesar 80.508%.
system verifikasi suara menunjukan hasil yang buruk pada saat nilai paramerter
MFCC yang digunakan adalah N=20 ms, M=10 ms, 20 koefisien filterbank, 11
koefisien MFCC, diuji pada 35 orang pengguna, 210 sample acuan, 35 sample uji,
terdapat kata satu, dua, tiga, empat dan lima, didapat akurasi rata-rata sebesar
73.260%.
penelitian ini disimpulkan bahwa LPC dan ANN dapat mengenali ucapan dengan
baik. Tingkat akurasi tertinggi bisa mencapai 94%, ini dicapat dengan 1 layer
tersembunyi, 5 neuron per layer, tingkat pembelajaran proses pelatihan 0.1 dan JST
Neuro Fuzzy dan lainnya agar mendapatkan akurasi pengenalan suara yang labih
baik.
5
Penelitian lain yang dilakukan oleh (Walid & Darmawan, 2017) . Penelitian
ini menyatakan dengan metode LPC dan KNN mampu memberikan keputusan
pengenalan ucapa, yang mana dari 16 kali percobaaan system mampu mengenali
10 dari data uji, atau memiliki akurasi 62,5%. Aplikasi ini dinyatakan dapat
berbasis suara, atau robotika. Dinyatakan pula bahwa penelitian tersebut perlu
dilanjutkan untuk mengenali ucapan yang lebih kompleks dan data uji yang lebih
banyak, dan personil (orang) yang lebih banyak, serta diperlukan metode klasifikasi
Menyatakan bahwa pada tahapan identifikas bicara telah menggunakan MFCC dan
algoritma HMM. Disebutkan bahwa system dengan metode MFCC dan DMT
kombinasi kedua metode tersebut memberikan hasil terbaik dan akurat dengan nilai
efisiensi keseluruhan 95%. Algoritma HMM juga mampu mengenali kata terisolasi
yang sering digunakan, hasil pengenalan ucapan keseluran mencapai efisiensi 98%.
Penelitian lain yang dilakukan oleh (Kataria & Singh, 2013). Menyatakan
mata, dan verifikasi tanda tangan. Jika dibandingkan atara pengukuran jarak yang
lain, Euclidian memilki efisiensi yang lebih tinggi. Klasifikasi KNN merupakan
6
salah satu klasifikasi yang populer dalam pengenalan pola. Namun metode ini
data latih, dan tidak ada perbedaan berat antara kelas-kelas di dalamnya. Untuk
Genetic Algorithm (GA). Hasil setiap kasus memberikan efisiensi hamper 100%,
ini dikarenakan data latih dan sampel yang digunakan kecil dan jaraknya sangat
dekat.
Penelitian lain yang dilakukan oleh (Fetra & Irsyad, 2015). Menyatakan
bahwa setelah dilakukan proses dalam rancang bangun aplikasi pencarian chord
dalam membantu penciptaan lagu, menyimpulkan hasil pencarian chord suara vocal
7. LANDASAN TEORI
digunakan untuk memprosesn sinyal suara menjadi data sehingga dapat dikenali
oleh komputer. Pengenalan ucapan merupakan salah satau bagian dari teknologi
Wisesty, 2016)
7
Pengenalan suara (voice recognition) adalah proses identifikasi suara
jenis aplikasi. Secara umum tahapan pengenalan suara dibagi menjadi dua bagian,
yakni tahap pembelajaran pola, dan tahap pengenalan suara melalui perbandingan
pola. Blok diagaram pembelajaran pola dan pengenalan suara ditunjukan pada
Gambar 1.
Gambar 1. Blok diagram pembelajaran pola dan pengenalan suara. Commented [ra1]: Gambar di revisi
a. Pengekstraksi Ciri
sinyal masukan untuk dijakan sebagai pola pembelajaran atau pola uji.
Untuk sinyal suara, ciri-ciri besaran merupakan hasil dari bentuk teknik
b. Pembelajaran Pola
Satu pola uji atau lebih yang berhubungan dengan bunyi suara dari kelas
8
c. Perbandingan dengan pola model
Proses perbandingan pola uji yang dikenali dengan setiap kelas pola
model referensi.
d. Pengambilan keputusan
Proses menentukan kelas pola referensi mana yang paling cocok dengan
paling sering digunakan pada berbagai bidang pemprosesan suara, karena metode
ini cukup baik dalam merepresentasikan sinyal. Cara kerja MFCC didasarkan pada
perbedaan frekuensi yang dapat ditangkap oleh telinga manusia, sehingga mampu
beberapa frame yang saling tumpang tindih (overlap). Hal ini dilakukan agar tidak
ada sedikitpun sinyal yang hilang (deletion). Proses ini akan berlanjut sampai
9
seluruh sinyal sudah masuk ke dalam satu atau lebih frame seperti yang di
ketidakberlanjutan sinyal pada awal dan akhir setiap frame. Sinyal analog yang
sudah diubah menjadi sinyal digital dibaca frame demi frame dan pada setiap frame-
𝑦1 (𝑛) = 𝑥1 (𝑛)𝑤(𝑛), 0 ≤ 𝑛 ≤ 𝑁 − 1
2𝜋𝑛
𝑤(𝑛) = 0.54 − 0.46. 𝑐𝑜𝑠 ( ),0 ≤ 𝑛 ≤ 𝑁 − 1
𝑁−1
Fourier Transform (DFT) yang berguna untuk mengonversi setiap frame dengan N
sebagai berikut:
10
𝑁−1
𝑋1 = ∑ 𝑥𝑘 𝑒 −2𝜕𝑗𝑘𝑛/𝑁
𝑘=0
Hasil dari tahapan ini biasanya disebut dengan spectrum atau periodogram.
Persepsi system pendengaran manusia terhadap frekuensi sinyal suara tidak dapat
diukur dalam skala linier. Untuk setiap nada dengan frekuensi actual, f, diukur
dengan Hz, sebuah subjective pitch diukur dalam sebuah skala yang disebut “mel”.
Skala mel-frequency ialah sebuah frekuensi rendah yang bersifat linier dibawah
1000 Hz dan sebuah frekuensi tinggi yang bersifat logaritmik di atas 1000 Hz.
Persamaan berikut menunjukan hubungan skala mel dengan frekuensi dalam Hz:
𝐹𝐻𝑍
2595 ∗ 𝑙𝑜𝑔10 (1 + ) , 𝐹𝐻𝑍 > 1000
𝐹𝑚𝑒𝑙 ={ 700
𝐹𝐻𝑍, < 1000
persamaan berikut:
𝑁−1
Di mana i = 1,2, 3…, M (M adalah jumlah filter segitiga) dan Hi(k) adalah nilai
filter segitiga ke-i untuk frekuensi akustik sebesar k. (Mada Sanjaya, 2016)
objek tersebut. Jumlah data atau tetangga terdekat di tentukan oleh pengguna yang
11
KNN berdasarkan pada konsep “learning by analogy”. Data uji di
sebuah titik, yang di tandai dengan c, dalam ruang n-dimensi. Jika sebuah query
data yang labelnya tidak diketahui dimasukkan, maka KNN akan mencari k-buah
data uji yang jaraknya paling dekat dengan data dalam dimensi tersebut. Jarak
antara data query (data uji) dengan data learning (data latih) di hitung dengan cara
kesamaan dua vektor. Jarak Euclidian menghitung akar kuadrat dari dua vektor
(root of square differences between two vector). Persamaan dari jarak Euclidian
adalah sebagai berikut: (Wira Buana, Jannet D.R.M., & Ketut Gede Darma Putra,
2012)
2
𝑥𝑖𝑗 = √∑𝑛𝑘=1(𝑥𝑖𝑘 − 𝑥𝑗𝑘 ) atau 𝑑 = √∑𝑛𝑖=1(𝑎𝑖 − 𝑏𝑖 )2
12
5) Untuk masing-masing kelas yang terlibat dalam konflik, tentukan jarak
𝑑𝑖 atara 𝑥 dengan 𝜔𝑖 .
6) Jika pola pelatihan ke-𝑚 dari kelas 𝜔𝑖 yang terlibat dalam konflik di
1 𝑖𝑚
dengan kelas adalah 𝑑𝑖 = ∑𝑁
𝑗=1 |(𝑥𝑗 − 𝑦𝑗 ).
𝐸
13
8. KEASLIAN PENELITIAN
14
No Judul Peneliti, Tujuan Penelitian Kesimpulan Saran atau Kelemahan Perbandingan
Media
Publikasi, dan
Tahun
koefisien MFCC. daptkan rata-rata akurasi
Pengujian dilakukan sebesar 73.260%.
terhadapa kata satu,
dua, tiga, empat, lima
dengan 36 orang
pengguna, 6 buah
sampel acuan dan 1
buah sampel uji untuk
masing-masing kata,
diperoleh rta-rata
akurasi sebesar
88.508%.
2 Speech Recognition Thiang, Suryo Tujuan dari Dari hasil eksperiment, Untuk penelitian Penelitian ini memiliki
Using Linier Wijono, penerapan Artificial disimpulkan bahwa berikutnya, untuk perbedaan yang signifikan,
Predictive Coding and International neural network LPC dan ANN dapat mendapatkan pengenalan meski pada bidang yang
Artificial Neural Conference on adalah untuk mengenali ucapan yang lebih baik, sama, metode yang
Network for Information meningkatkan dengan baik. Tingkat disarankan untuk digunakan berbeda, tingkat
Controlling and tingkat pengenalan pengakuan tertinggi menggunakan metode kompleksitas proses-pun
Movement of Mobile Electronics ucapan. adalah 91.4%. Hasil ini lain. berbeda, dengan tujuan yang
Robot Engineering, dicapai dengan LPC dan sama. Hasil yang diberikan
Singapore, ANN dengan 1 lapisan tentu berbeda. Dan pada
2011 tersembunyi, 5 neuron penelitian yang akan
per lapisan, tingkat dilakukan tentu akan
pembelajaran proses menghasilkan hasil yang
pelatihan 0.1 dan JST lebih baik karena waktu yang
dilatih menggunakan 25 dibutuhkan dalam
sampel per perintah. pencocokan suara lebih cepat.
15
No Judul Peneliti, Tujuan Penelitian Kesimpulan Saran atau Kelemahan Perbandingan
Media
Publikasi, dan
Tahun
3 Pengenalan Ucapan Miftahul Pengenalan Ucapan Metode LPC dan KNN Perlu adanya riset lebih Penelitian ini dengan
Mengunakan Metode Walid & Menggunakan mampu memberikan lanjut untuk mengenali penelitian yang akan
Linier Predictive Aangkisnu Metode LPC dan keputusan pengenalan data ucapan yang lebih dilakukan memiliki
Coding (LPC) dan K- Darmawan, KNN ucapan, dimana dari 16 kompleks dan lebih perbedaan metode utama,
Nearest Neighbor Energi. kali percobaan 10 dapat banyak data ucapan yakni metode yang digunakan
(KNN) Universitas dikenali dan 6 tidak sebagai data training pada penelitian ini
Panca Marga, dapat dikenali, atau serta melibatkan banyak menggunakan LPC,
2017 memiliki akurasi personal dengan metode sedangkan yang pada
sebesar 62.5% yang lebih baik. penelitian berikutnya
menggunakan MFCC,
keduanya merupakan metode
untuk ekstraksi ciri ucapan,
namun MFCC memiliki
keunggulan, yaitu MFCC
bekerja mirip seperti cara
dengar telinga manusia,
sehiggga dimungkinkan dapat
menghasilkan hasil yang
lebih maksimal.
4 An Efficient Speech Suma Swamy Tujuan utama dari Pada identifikasi Tidak disebutkan saran Penelitian ini dengan
Recognition System & K.V makalah ini adalah pembicaraan, Teknik dan kelemahan dari penelitian yang akan
Ramakrishnan, implementasi MFCC dan Distance penelitian ini, namun dilakukan memiliki
Computer identifikasi Minimum telah penelitian ini perbedaan metode dalam
Science & pembicaraan dan digunakan. Kedua menggunakan beberapa pengenalan ucapan, yaitu
Engineering: peningkatan Teknik tersebut metode. metode yang digunakan
An pengenalan suara memberikan identifikasi dalam penelitian ini
International dengan pembicaraan yang lebih menggunakan metode HMM
menggunakan efisien. Tahap sebagai pengenalan ucpan.
16
No Judul Peneliti, Tujuan Penelitian Kesimpulan Saran atau Kelemahan Perbandingan
Media
Publikasi, dan
Tahun
Journal Teknik Hidden pengenalan ucapan Sedang kan pada penelitian
(CSEIJ), 2013 Markov Model menggunakan Teknik yang akan dilakukan
(HMM). algoritma HMM yang menggunakan metode KNN.
paling efisien. Semua
pengkodean
menggunakan
MATLAB. Ditemukan
bahwa kombinasi
MFCC dan Distance
Minimum memberikah
hasil terbaik dan hasil
yang akurat pada
sebagian besar kasus
dengan efisiensi
keseluruhan 95%. Studi
ini juga menjelaskan
bahwa Teknik HMM
mampu
mengindentifikasi kata
yang terisolasi yang
paling umum
digunakan. Secara
keseluruhan system
pengenalan suara
mencapai efisiensi 98%.
5 A Review of Data Aman Kataria Analisa data Bila dibandingkan, Kekurangan KNN ialah Pada penelitian ini KNN
Classification Using and M. D. menggunakan perhituangan jarak memiliki kerumtan yang disandingkan dengan metode
Singh, algoritma KNN dengan menggunakan sangat hebat. Bergantung Algoritma Genetika atau
17
No Judul Peneliti, Tujuan Penelitian Kesimpulan Saran atau Kelemahan Perbandingan
Media
Publikasi, dan
Tahun
K-Nearest Neighbor International Euclidiance memiliki sepenuhnya pada set Genetic Algorithm (GA),
Algorithm Journal of efisiensi yang lebih pelatihan, dan tidak ada yang mana kelemahan KNN
Engineering tinggi dibanding dengan perbedaan berat pada menjadi masalah dalam kasus
Technology perhitungan jarak yang masing-masing kelas. ini sehingga sepenuhnya
and Advance lain dan jika di KNN harus di bergantung pada metode GA,
Engineering, bandingkan dengan sandingkan dengan sedangkan pada penelitian
2013 algoritma Bayes, metode lain untuk berikutnya KNN merupakan
algoritma KNN lebih menangani metode yang digunakan
mempertahankan kelemahannya. sebagai pengambil keputusan
efisiensinya. KNN karena data yang masuk
adalah Teknik sudah di olah sebelumnya
klasifikasi yang paling menggunakan metode yang
popular dalam memang khusus untuk
pengenalan pola. ekstrasi ciri dalam
pengenalan ucapan yaitu
MFCC.
6 Aplikasi Pencarian Niky Fetra dan Menghasilkan Hasil pencarian chord Aplikasi selanjutnya
Chord Dalam Muhammad aplikasi pencarian suara vocal tanpa music dapat diterapkan pada
Membantu Penciptaan Irsyad, Journal chord dari masukan menghasilkan akurasi perangkat mobil.
Lagu Menggunakan CoreIT, UIN suara vocal. yang lebih baik Aplikasi dapat
Algoritma Fast Sultan Syarim dibandingkan dengan menemukan tempo dan
Fourier Transform Kasim Riau, menggunakan music birama secara otomatis.
dan Metode 2015. dimana tingkat akurasi Dan aplikasi dapat
Klasifikasi K-Neares mencapai 82.35% menghasilkan keluaran
Neighbor (KNN) dengan 7 ketetanggaan semua jenis chord.
terdekat dan tingkat
akurasi dengan
menggunakan music
18
No Judul Peneliti, Tujuan Penelitian Kesimpulan Saran atau Kelemahan Perbandingan
Media
Publikasi, dan
Tahun
mencapai 22.22%
dengan 7 ketetanggaan
terdekat
19
9. HIPOTESIS
suara menjadi data. Perubahan sinyal suara tersebut melalui dua tahap yaitu, tahap
tasikannya.
dengan nilai yang cukup tinggi, mengingat kedua metode tersebut sudah tidak
Untuk itu dalam penelitian ini mencoba menggunakan metode MFCC dan KNN
20
10. METODE PENELITIAN
penelitian ini mulai dari proses pengumpulan data sampai didapatkan hasil akhir
yang terdiri dari 4 kata, yakni “maju, mundur, kanan, dan kiri” setiap ucapan
koefisien, nilai koefisien tersebut akan digunakan sebagai data yang dijadikan
sebagai data latih pada system KNN. 4 macam ucapan tersebut akan direkam
21
berulang-ulang sebanyak 20 kali, sehingga jumlah total data latih sebanyak 80 data
ucapan. Setiap data dari setiap ucapan akan dibagi menjadi dua bagian, 16 data akan
dijadikan sebagai data latih dan sisanya yaitu 4 data akan dijakan sebagai data uji.
Total data latih adalah sebanyak 64 data ucapan dan total data uji adalah sebanyak
16 data ucapan.
melakukan proses analisa data disini peneliti menggunakan beberapa software dan
hardware pendukung.
2) Windows 10
5) Libre Office
2) Headset JBL
Hardware dan software tersebut digunakan sebagai alat untuk analisis dalam
penelitian ini. Selanjutnya dilakukan proses ekstraksi ciri. Tahapan ini merupakan
proses yang perlu dilakukan untuk mendapatkan nilai koefisien setiap data ucapan,
22
dimana data awal yang masuk berupa data sinyal suara yang kemudian dikonversi
berikut:
1) Preemphasis
sinyal suara yang lebih halus. Di mana bentuk spectral yang relative
bernilai tinggi untuk daerah rendah dan cenderung turun secara tajam
untuk daerah frekuensi di atas 2000 Hz. Filter preemphasis didasari oleh
23
hubungan input/output dalam domain waktu yang dinyatakan dalam
2) Frame Blocking
Pada proses ini, sinyal suara disegmentasi menjadi beberapa frame yang
saling tumpang tindih (overlap). Hal ini dilakukan agar tidak ada
sampai seluruh sinyal sudah masuk ke dalam satu atau lebih frame
3) Windowing
Sinyal analog yang sudah diubah menjadi sinyal digital dibaca frame
dimana N adalah jumlah sampel pada setiap frame-nya, maka hasil dari
𝑦1 = 𝑥1 (𝑛)𝑤(𝑛), 0 ≤ 𝑛 ≤ 𝑁 − 1
bentuk:
2𝜋𝑛
𝑤(𝑛) = 0.54 − 0.46. cos ( ),0 ≤ 𝑛 ≤ 𝑁 − 1
𝑁−1
24
4) Fast Fourier Transform (FFT)
𝑥𝑛 = ∑ 𝑥𝑘 𝑒 −2𝜕𝑗𝑘𝑛/𝑁
𝑘=0
5) Mel-Frequency Wrapping
tidak dapat diukur dalam skala linier. Untuk setiap nada dengan
dalam Hz:
𝐹𝐻𝑍
2595 ∗ 𝑙𝑜𝑔10 (1 + ) , 𝐹𝐻𝑍 > 1000
𝐹𝑚𝑒𝑙 ={ 700
𝐹𝐻𝑍, < 1000
25
𝑁−1
6) Cepstrum
di ekstraksi. Proses ini bertujuan untuk mengenali data ucapan, pengenalan ucapan
dalam penelitian ini dilakukan dengan cara membandingkan data latih paling
terdekat dengan data uji, dimana data latih yang paling terdekat akan dijadikan
acuan dalam mengambil keputusan, proses peritungan jarak terdekat yang paling
sering digunakan adalah Euclidian Distance. Dan metode Euclidian Distance yang
digunakan adalah KNN. Proses KNN akan di jelaskan melalui gambar flowchart
dibawah ini.
26
Gambar 6. Proses K-NN.
jaraknya paling dekat dengan obyek tersebu. KKN memerlukan dua model data
yaitu data latih dan data uji. Data pembelajaran di gambarkan kedalam ruang
data. Selanjutnya dua model data tersebut diproses untuk menentukan kelas data,
dengan obyek tersebut. Dekat atau jauhnya obyek tersebut dengan tetangga dihitung
berupa data putusan sesuai dengan jarak terdekat pada data latih berdasarkan
27
2) Dari k-buah tetangga terdekat tersebut, identifikasikan jumlah vektor 𝑘𝑖
𝑑𝑖 atara 𝑥 dengan 𝜔𝑖 .
6) Jika pola pelatihan ke-𝑚 dari kelas 𝜔𝑖 yang terlibat dalam konflik di
1 𝑖𝑚
dengan kelas adalah 𝑑𝑖 = ∑𝑁
𝑗=1 |(𝑥𝑗 − 𝑦𝑗 ).
𝐸
Bagian Alur dari penelitian ini peneliti gambarkan delam bentuk diagram
umum dari penelitian yang dilaksanakan. Diagram ini memberikan solusi langkah
demi langkah untuk menyelesaikan masalah yang ada pada algoritma tersebut.
28
Gambar 5. Diagram Alir Penelitian.
Dalam penelitian ini, data ucapan dibentuk deluar system dengan cara
merekam suara terlebih dahulu. Data terdiri dari dua jenis data latih dan data uji
dimana data latih merupakan data sampel atau dataset yang disimpan di database.
digunakan untuk proses pengenalan ucapan, pada proses ini metode KNN turut
didalamnya sebagai penentu keputusan dari kemiripan data latih dan data uji,
metode KKN memilah data masukan menjadi kelas-kelas sesuai dengan data latih
dan mencari nilai terdekat antara nilai koefisien data latih dan nilai koefisien data
uji. Hasilnya berupa keputusan data ucapan terdekat, atau bias disebut data ucapan
yang dikenali.
29
11. SISTEMATIKA PENULISAN
BAB I PENDAHULUAN
Bab ini berisi uraian latar belakang masalah, rumusan masalah, batasan
diperlukan.
Bab ini berisi tinjauan pustaka, keaslian penelitian, dan landasan teori.
berisi teori-teori atau konsep yang dibutuhkan untuk menyusun solusi pada
Bab ini berisi jenis, sifat, dan pendekatan penelitian, metode pengumpulan
Bab ini menjelaskan hasil penelitian dan pembahasan dari penelitian yang
telah dilakukan.
BAB V PENUTUP
Bab ini berisi kesimpulan dan saran yang diharapkan bermanfaat untuk
penelitian selanjutnya.
30
12. RENCANA JADWAL PENELITIAN
Bulan
No Tahapan Target Output September Oktober November Desember
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 Pencarian dan Pemilihan Obyek Penelitian Pproposal Tesis
2 Studi Literatur Pproposal Tesis
3 Perumusan Masalah Pproposal Tesis
4 Penyususnan Landasan Penelitian Pproposal Tesis
5 Penyusunan Metodologi Penelitian Pproposal Tesis
6 Penyusunan Naskah Proposal Tesis Naskah Proposal Tesis
7 Sidang Proposal Tesis Sidang Proposal Tesis
8 Pelaksanaan Pengumpulan Sampel Data Sampel Data
9 Analisis Data Hasil Analisa Data
10 Penyusunan Naskah Tesis Naskah Tesis
11 Sidang Tesis Sidan Tesis
12 Penyempurnaan Naskah Tesis Naskah Tesis
13 Penyusunan Paper Ringkasan Tesis Paper Ringkasan Tesis
14 Penyerahan Naskah Akhir Tesis dan Paper Naskah Akhir dan Paper
31
DAFTAR PUSTAKA
PUSTAKA BUKU
Bagus Prasetyo, H., & Novia Wisesty, U. (2016). Algoritma Pengenalan Ucapan
Huruf Hijaiyah Bertanda Baca Dengan Linear Predictive Coding (Lpc) Dan
Hidden Markov Model (Hmm). Indosc 2016, (August), 149–164.
https://doi.org/10.21108/INDOSC.2016.135
Fetra, N., & Irsyad, M. (2015). Aplikasi Pencarian Chord dalam Membantu
Penciptaan Lagu Menggunakan Algoritma Fast Fourier Transform ( FFT ) dan
Metode Klasifikasi K-Nearest Neighbor ( KNN ). Jurnal CoreIT, 1(2 ISSN:
2460-738X), 30–36.
Krisandi, N., Prihandono, B., & Helmi. (2013). Algoritma K - Nearest Neighbor
Dalam Klasifikasi Data Hasil Produksi Kelapa Sawit Pada PT. MINAMAS
Kecamatan Parindu. Buletin Ilmiah Math.Stat.dan Terapannya(Bimaster),
2(1), 33–38.
Putra, D., & Adi, R. (2011). Verifikasi Biometrika Suara Menggunakan Metode
MFCC dan DTW. Biometrika, Universitas Udayana, 2(1), 8–21.
Setiawan, A., Hidayatno, A., & Isnanto, R. R. (2011). Aplikasi Pengenalan Ucapan
dengan Ekstraksi Mel-Frequency Cepstrum Coefficients ( MFCC ) Melalui
Jaringan Syaraf Tiruan ( JST ) Learning Vector Quantization ( LVQ ) untuk
Mengoperasikan Kursor Komputer. Universitas Diponegoro Semarang, 13(3),
82–86. https://doi.org/Transmisi 1411 – 0814
Thiang, & Wijoyo, S. (2011). Speech recognition using linear predictive coding and
artificial neural network for controlling movement of mobile robot. … of
International Conference on Information and …, 6, 179–183. Retrieved from
http://cpfd.cnki.com.cn/Article/CPFDTOTAL-CDYA201105001036.htm
Wira Buana, P., Jannet D.R.M., S., & Ketut Gede Darma Putra, I. (2012).
Combination of K-Nearest Neighbor and K-Means based on Term Re-
weighting for Classify Indonesian News. International Journal of Computer
Applications, 50(11), 37–42. https://doi.org/10.5120/7817-1105