Anda di halaman 1dari 16

APLIKASI PENGOLAHAN SUARA

MAKALAH
Untuk memenuhi tugas matakuliah Pengolahan Suara Dosen Pengampu Totok Chamidy M.Kom

Oleh : Kelompok 7 Moh. Arif Samsul Rizal Fakri Fandy Nur Azizi Ali Saluki Ahmad Fuad Hariri 07650152 08650119 08650152 09650014

JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM MALANG 2012

BAB I PENDAHULUAN

1.1 Latar Belakang Pada dekade terakhir ini, sudah banyak kita temukan revolusi besar-besaran dalam dunia teknologi informasi dan ledakan dalam berbagai macam aplikasi yang mudah

digunakan.Revolusi ini masih berlanjut hingga saat ini dengan sistem komputer personal yang harganya relatif lebih murah dibandingkan dengan sebuah server workstation yang mahal. Teknologi ini sudah seharusnya dimanfaatkan untuk meningkatkan proses pembelajaran sedemikian hingga menghasilkan proses pembelajaran yang efektif. Saat ini ketika kita menelpon kebanyakan perusahaan besar, seseorang biasanya tidak menjawab telepon tersebut. Sebaliknya, jawabannya adalah rekaman suara otomatis jawaban dan memerintahkan anda untuk menekan tombol melalui pilihan menu. Seringkali Anda bisa berbicara kata-kata tertentu (sekali lagi, seperti yang diperintahkan oleh rekaman) untuk mendapatkan apa yang Anda butuhkan. Sistem yang membuat hal ini mungkin adalah jenis program pengenalan suara - sebuah sistem telepon otomatis. Anda juga dapat menggunakan perangkat lunak pengenalan suara di rumah-rumah dan bisnis. Berbagai produk perangkat lunak yang memungkinkan pengguna untuk mendikte komputer dan memiliki kata-kata untuk dikonversikan ke teks dalam pengolah kata atau e-mail dokumen. Anda dapat mengakses perintah fungsi, seperti membuka file dan mengakses menu, dengan petunjuk suara. Orangorang cacat yang membuat mereka tidak dapat mengetik juga telah mengadopsi sistem pengenalan ucapan. Jika seorang pengguna telah kehilangan fungsi tangannya, atau bagi pengguna tunanetra jika tidak mungkin atau mudah untuk menggunakan keyboard Braille, sistem memungkinkan ekspresi pribadi melalui dikte dan juga kontrol dari banyak tugas komputer. Perkembangan teknologi yang semakin pesat telah banyak membawa pengaruh dalam berbagai bidang kehidupan. Termasuk didalamnya penggunaan sinyal digital dalam pengolahan sinyal suara. Suara manusia yang ditangkap oleh mikrofon menghasilkan sinyal listrik yang dapat diolah lagi menjadi sinyal suara. Sinyal analog hasil tanggapan dari mikrofon, dapat dilakukan pengolahan secara digital. Masalah yang seringkali muncul adalah

suara yang dihasilkan speaker hasil dari tanggapan mikrofon, tidak sesuai dengan yang diharapkan. Terkadang kualiatasnya jauh dibawah dari kualitas sumber suara.

Rumusan Masalah 1. Apakah yang dimaksud dengan sistem tanggapan suara dan Bagaimanakah cara penggunaannya? 2. Apakah yang dimaksud dengan pengenalan suara dan Bagaimanakah cara penerapannya? 3. Apakah yang dimaksud dengan identifikasi suara dan Bagaimanakah cara penerapannya?? 4. Apakah yang dimaksud dengan kompresi suara dan Bagaimanakah cara penerapannya??

Tujuan 1. Untuk mengetahui pengertian sistem tanggapan suara dan cara penggunaannya 2. Untuk mengetahui pengertian pengenalan suara dan penerapannya 3. Untuk mengetahui pengertian identifikasi suara dan penerapannya 4. Untuk mengetahui pengertian penkompresi suara dan penerapannya

BAB II PEMBAHASAN

A. SISTEM TANGGAPAN SUARA Sistem tanggapan suara adalah sistem komputer yang merespon perintah suara, bukan masukan dari keyboard ataupun dari mouse. Digunakan untuk salah satu system untuk kebutuhan keamanan. Orang yang mempunyai kekurangan secara fisik adalah subjek utama untuk system tanggapan suara, dikarenakan mereka tidak dapat melihat atau mengakses keyboard atau mouse secara langsung. Mereka tidak dapat mengakses computer secara langsung kecuali dengan system tanggapan suara, kecuali mereka bergantung kepada orang lain. Mampu secara harfiah untuk memberitahu komputer apa yang harus dilakukan dapat menjadi kebanggaan tersendiri bagi seseorang yang biasanya memiliki sedikit harapan untuk mengendalikan komputer. Sebuah sistem respon suara juga akan berguna bagi seseorang yang secara fisik tidak terganggu. Dengan sistem respon suara, Anda tidak akan harus sangat dekat dengan komputer Anda untuk mengakses atau memberikan perintah. Selama Anda berada dalam jarak pendengaran dari PC, dapat menggunakan sistem tanggapan suara untuk menerima perintah suara dari Anda dalam cara yang sama yang secara tradisional menerima inputan dari keyboard ataupun mouse. Penggunaan utama yang lain dari sistem tanggapan suara adalah untuk proses pencatatan. Protokol perangkat lunak tertentu dapat mengubah entri data dari suara diubah dalam bentuk data yang kita inginkan, memungkinkan kita untuk memasukkan data tanpa menggunakan tangan kita. Karena kita telah memberikan protocol kepada komputer untuk menafsirkan perintah suara kita, Hal ini dapat lebih efektif dibandingkan cara manual karena, dengan ketidakmampuan komputer untuk membuat kesalahan mengetik seperti manusia. Sekarang, lebih dari sebelumnya, kita dapat dengan mudah menggunakan suara kita untuk mengaktifkan dan menjalankan program perangkat lunak. Aplikasi yang sekarang tersedia untuk sistem tanggapan suara untuk menjalankan fungsi dasar rumah tangga, seperti menyalakan lampu dan mematikan atau membuka dan menutup pintu garasi. Para futuristik

film yang menggambarkan karakter menggunakan perintah suara untuk melakukan hampir segala sesuatu mungkin lebih mendekati kenyataan daripada yang anda pikirkan.

Blok diagram sistem tanggapan suara digital

B. KONVERSI SUARA b. Konversi Analog to Digital Saat ini perkembangan audio digital sudah pesat, walaupun file audio digital banyak jenisnya tetapi teori dasar tentang proses bekerjanya adalah sama. Dimana file diproses dengan pengklasifikasian sinyal analog (dalam bentuk voltase) lalu disandikan, diproses, disimpan, dan akhirnya di produksi berulang-ulang kali kedalam suatu sistim bilangan biner. Pada perangkat digital sistem bilangan yang digunakan sistem bilangan binary (basis 2) dalam bekerja, dengan sistem bilangan ini perangkat tersebut dapat bekerja secara cepat dan lebih efisien. Sedangkan pada dua puluh enam (26) bilangan alphabet yang kita kenal, menggunakan sistem bilangan desimal (basis 10). Oleh karena itu bilangan alphabet harus di ubah dahulu (diterjemahkan) kedalam sistem bilangan yang dapat dimengerti oleh perangkat digital, yakni bilangan biner dan data tersebut dapat di encoded kan pada beberapa bentuk media seperti: Logika 1 atau 0 On atau Off Voltage atau no voltage

Gambar 2.2 Proses Digital Audio Analog to digital conversion (ADC) adalah proses mengubah amplitude gelombang bunyi ke dalam waktu interval tertentu (disebut juga sampling), sehingga menghasilkan representasi digital dari suara, dimana sampling rate adalah beberapa gelombang yang diambil dalam satu detik (Standar sampling rate untuk berbicara 11,025 kHz) Berikut proses Analog to digital conversion (ADC) :

1. Membuang frekuensi tinggi dari source signal 2. Mengambil sample dengan interval waktu tertentu (sampling) 3. Menyimpan amplitudo sample dan mengubahnya ke dalam bentuk diskrit (kuantisasi) 4. Merubah bentuk menjadi nilai biner.

Proses Analog to Digital Conversion (ADC)

C. PENGENALAN SUARA Pengenalan suara merupakan teknik untuk mengenali masukan yang berupa suara untuk menghasilkan respon yang sesuai dengan masukan tersebut.Pengenalan suara juga merupakansuatu proses untuk mengenali huruf, kata atau kalimat yang diucapkan. Pengenalan suara lebih dikenal dengan istilah Automatic SpeechRecognition atau Computer Speech Recognition dimana penggunaan sebuah mesin/komputer untuk mengenali sebuah suara atau identitas seseorang dari suara yang diucapkan. Umumnya pengucap berbicara di depan komputer/mesin kemudian komputer/mesin mengenali suara/identitas seseorang dengan tepat sesuai yang diucapkan. Pengenalan pola suara dikenali ke dalam berbagai level tugas, pengenalan dalam tingkat sinyal akustik berupa uji tingkatan dalam susunan unit sub kata berupa fonem, kata, frase dan kalimat. Pengenalan suara huruf vokal merupakan dasar dari pengenalan suara sebab susunan kata merupakan susunan dari beberapa huruf salah satunya adalah huruf vokal sehingga jika diperoleh prinsip dasar proses pengenalan dari suara huruf vokal dapat digunakan dalam penelitian lebih lanjut. Secara garis besar, cara kerja sistem pengenalan suara ini ialah mula-mula sinyalsuara manusia yang diterima dengan menggunakan microphone (sinyal analog) dicupliksehingga menjadi sinyal digital dengan bantuan sound card pada Personal Computer.Sinyal digital hasil cuplikan ini terlebih dulu dinormalisasi (disamakan panjang sinyalyang satu dengan yang lain) kemudian diproses awal menggunakan metode LinierPredictive Coding (LPC) sehingga didapat beberapa koefisien LPC yang merupakanfeature (ciri) dari suara pembicaraan. Kemudian koefisien LPC tersebut diproses

denganFast Fourier Transform (FFT) untuk mendapatkan sinyal pada domain frekuensi. Hal inibertujuan agar perbedaan antar pola kata yang satu dengan yang lain terlihat lebih jelassehingga ekstraksi parameter sinyal memberikan hasil yang lebih baik. Hasil keluaranFFT ini merupakan masukan bagi jaringan saraf tiruan Back Propagation dimanajaringan saraf tiruan ini sebagai fungsi utama dari sistem untuk proses pengenalan suara. 1. Pencuplikan Sinyal Suara Dalam tahap ini merupakan penentuan jumlah sampel dalam satu detik. Jikapencuplikan dilakukan dengan frekuensi cuplik 8000Hz, maka dalam satu detik terdapat8000 sampel. Perlu diperhatikan komponen utama frekuensi sinyal suara berada pada kisaran 3003400 Hz. Menurut Nyquist, frekuensi sampling dalam pencuplikan haruslebih besar 2 kali dari frekuensi sinyal aslinya.Semakin tinggi frekuensi sampling maka sinyal digital yang dihasilkan semakinbagus. Kemudian proses selanjutnya adalah kuantisasi, yaitu membatasi amplitude ataunilai aksis sinyal. Jika sinyal dicuplik dengan menggunakan resolusi 8 bit, maka terdapat28 atau 256 nilai batas sinyal. Langkah terakhir adalah konversi analog ke digital adalah tahap coding. Karena memori computer menyimpan data berupa tipe data biner, makanilai amplitude tiap sampel sinyal akan dikonversi kedalam bentuk biner. Jika sinyaldicuplik dalam resolusi 8bit, maka nilai amplitude akan disimpan pada ukuran 8bit kodebiner atau 1 byte data.

2. Normalisasi Normalisasi adalah proses yang sangat penting dalam rangkaian sistem pengenalan suara. Terkadang kita kesusahan untuk menyamakan suara dalam proses perekaman. biarpun kata ataukalimat yang diucapkan sama. Bahkan untuk satu suku kata atau vocal yang samaseringkali proses perekaman terjadi dalam durasi yang berbeda. Akibatnya pada proses penyamaan matching antara sinyal uji dengan sinyal referansi (template) seringkali tidakmenghasilkan nilai yang optimal. Dalam permasalahan ini biasanya digunakan teknik dynamic-programing yangjuga lebih dikenal sebagai dynamic time warping (DTW). Teknik ini ditujukan untukmengakomodasi perbedaan waktu antara proses perekaman saat pengujian dengan yangtersedia pada template sinyal referensi.

3. Untuk pengenalan suara terdapat tiga langkah yang digunakan yaitu spectral analisis, filtering, dan auto correlation. Spektral analisis merupakan proses analisa spektrum frekuensi suara yang sering terkait dengan transformasi. Filtering berguna untuk membuang bagian yang tidak berguna dan untuk memodifikasi frekuensi untuk mendapat informasi. Sedangkan auto correlation berguna untuk mencari karateristik rongga suara manusia. Analisa specktrum suara dapat dilakukan dengan menggunakan transformasi fourier waktu diskrit (DFT), Linier Predictive Coding (LPC), Mel Scala dan sebagainya. Dari proses ini dapat dianalisa magnitude, energi, atau phase dari suatu sinyal. Algoritma yang digunakan speech recognition: Alat pengenal ucapan memiliki empat tahapan dalam prosesnya, yaitu : 1. Tahap penerimaan masukan Masukan berupa kata-kata yang diucapkan lewat pengeras suara. 2. Tahap ekstraksi Tahap ini adalah tahap penyimpanaan masukan yang berupa suara sekaligus pembuatan basis data sebagai pola. Proses ekstraksi dilakukan berdasarkan metode Model Markov Tersembunyi atau Hidden Markov Model (HMM), yang merupakan model statistik dari sebuah sistem yang diasumsikan oleh Markov sebagai suatu proses dengan parameter yang tidak diketahui. Tantangan dalam model statistik ini adalah menentukan parameter-parameter tersembunyi dari parameter yang dapat diamati. Parameter-parameter yang telah kita tentukan kemudian digunakan untuk analisis yang lebih jauh pada proses pengenalan kata yang diucapkan. Berdasarkan HMM, proses pengenalan ucapan secara umum menghasilkan keluaran yang dapat dikarakterisasikan sebagai sinyal. Sinyal dapat bersifat diskrit (karakter dalam abjad) maupun kontinu (pengukuran temperatur, alunan musik).Sinyal dapat pula bersifat stabil (nilai statistiknya tidak berubah terhadap waktu) maupun nonstabil (nilai sinyal berubah-ubah terhadap waktu). Dengan melakukan pemodelan terhadap sinyal secara benar, dapat dilakukan simulasi terhadap masukan dan pelatihan sebanyak mungkin melalui proses simulasi tersebut sehingga model dapat diterapkan dalam sistem prediksi, sistem pengenalan, maupun sistem identifikasi. Secara garis besar model sinyal dapat dikategorikan menjadi dua

golongan, yaitu: model deterministik dan model statistikal. Model deterministik menggunakan nilai-nilai properti dari sebuah sinyal seperti: amplitudo, frekuensi, dan fase dari gelombang sinus.

Model statistikal menggunakan nilai-nilai statistik dari sebuah sinyal seperti: proses Gaussian, proses Poisson, proses Markov, dan proses Markov Tersembunyi. Suatu model HMM secara umum memiliki unsur-unsur sebagai berikut: - N, yaitu jumlah bagian dalam model. Secara umum bagian tersebut saling terhubung satu dengan yang lain, dan suatu bagian bisa mencapai semua bagian yang lain, serta sebaliknya (disebut dengan model ergodik). Namun hal tersebut tidak mutlak karena terdapat kondisi lain dimana suatu bagian hanya bisa berputar ke diri sendiri dan berpindah ke satu bagian berikutnya. Hal ini bergantung pada implementasi dari model.

- M, yaitu jumlah simbol observasi secara unik pada tiap bagiannya, misalnya: karakter dalam abjad, dimana bagian diartikan sebagai huruf dalam kata.

- Probabilita Perpindahan Bagian { } = ij A a

- Probabilita Simbol Observasi pada bagian j, { } () = j Bb k Inisial Distribusi Bagian i p p Setelah memberikan nilai N, M, A, B, dan p , maka proses ekstraksi dapat diurutkan. Berikut adalah tahapan ekstraksi pengenalan ucapan berdasarkan HMM : - Tahap ekstraksi tampilan Penyaringan sinyal suara dan pengubahan sinyal suara analog ke digital

- Tahap tugas pemodelan Pembuatan suatu model HMM dari data-data yang berupa sampel ucapan sebuah kata yang sudah berupa data digital

- Tahap sistem pengenalan HMM

Penemuan parameter-parameter yang dapat merepresentasikan sinyal suara untuk analisis lebih lanjut. 3. Tahap pembandingan Tahap ini merupakan tahap pencocokan data baru dengan data suara (pencocokan tata bahasa) pada pola. Tahap ini dimulai dengan proses konversi sinyal suara digital hasil dari proses ekstraksi ke dalam bentuk spektrum suara yang akan dianalisa dengan membandingkannya dengan pola suara pada basis data. Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkan urutannya. Pemilihan ini dilakukan agar proses analisis dapat dilakukan secara paralel. Proses yang pertama kali dilakukan ialah memproses gelombang kontinu spektrum suara ke dalam bentuk diskrit. Langkah berikutnya ialah proses kalkulasi yang dibagi menjadi dua bagian : - Transformasi gelombang diskrit menjadi data yang terurut Gelombang diskrit berbentuk masukan berukuran n yang menjadi objek yang akan dibagi pada proses konversi dengan cara pembagian rincian waktu - Menghitung frekuensi pada tiap elemen data yang terurut Selanjutnya tiap elemen dari data yang terurut tersebut dikonversi ke dalam bentuk bilangan biner. Data biner tersebut nantinya akandibandingkan dengan pola data suara dan kemudian diterjemahkan sebagai keluaran yang dapat berbentuk tulisan ataupun perintah pada perangkat. 4. Tahap validasi identitas pengguna Alat pengenal ucapan yang sudah memiliki sistem verifikasi/identifikasi suara akan melakukan identifikasi orang yang berbicara berdasarkan kata yang diucapkan setelah menerjemahkan suara tersebut menjadi tulisan atau komando.

D. IDENTIFIKASI SUARA Automatic Speech Recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan

diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara. Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata. Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu: pengenalan pengguna (identifikasi suara berdasarkan orang yang berbicara). pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan). Speech Recognition yang ada sekarang ini masih rawan terhadap noise, baik noise yang benar-benar berupa gangguan (misalnya kegaduhan) atau noise. Speech

recognition bekerja dengan cara mencari kemiripan dengan library potongan kata yang ada di dalam databasenya (corpus). Ketika sebuah sistem dilatih dengan korpus British English, akan sulit mengenali ucapan Inggris-Jawa, Inggris-Sunda, Inggris-Cina, dan sebagainya. Walaupun sama-sama bahasa Inggris, Speech Recognition yang ada saat ini masih sulit (bukan tidak mungkin) untuk diaplikasi pada aplikasi yang diharapkan dapat mengenali seluruh kata. Namun, sangat mungkin untuk digunakan dalam aplikasi yang jumlah kosa katanya terbatas. Mengapa? Mengidentifikasikan, katakanlah 40 kata jauh lebih mudah dari

pada mengidentifikasikan 100 ribu kata. Banyak aplikasi dengan jumlah kata terbatas yang sudah menggunakan teknologi ini untuk layanan telekomunikasi. Telinga dan Otak Manusia sebagai prosesornya mempunyai kemampuan yang lebih superior. Manusia dengan mudah memisahkan antara pembicara dengan suara musik di latar belakang, asal suara musik tersebut tidak melampaui intensitas tertentu yang mengganggu. Komputer masih sangat sulit melakukan itu. Bahkan manusia mempunyai kemampuan untuk fokus (berusaha fokus). Misalkan dalam satu keramaian konser musik, anda berbicara dengan teman di sebelah, masih bisa memahami apa yang diucapkan. Semuanya berhubungan dengan pemrosesan sinyal suara. Pemrosesan sinyal yang dilakukan sekarang masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara mempunyai banyak komponen frekuensi yang sama dengan komponen frekuensi noise-nya, jadi sulit memisahkannya, sementara telinga dan otak manusia masih bisa melakukannya dengan mudah. Jadi, kesimpulannyaTelinga dan otak manusia mungkin bekerja dengan prinsip yang berbeda. Sensor dalam telinga manusia berupa rambut-rambut halus yang jumlahnya sangat banyak, sementara sensor komputer hanya satu buah mikrofon. Oleh karena itu, salah satu arah riset yang berkembang adalah penggunaan array mikrofon untuk menirukan banyaknya sensor dalam telingan manusia.

Jenis-jenis identifikasi ucapan Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis

identifikasi kata, yaitu : 1. Kata-kata yang terisolasi Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata 2. Kata-kata yang berhubungan Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat

3. Kata-kata yang ber kelanjutan Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan

metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural 4. Kata-kata spontan Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata 5. Identifikasi Pengirim Perintah Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.

BAB III PENUTUP

E. KESIMPULAN Sistem tanggapan suara adalah sistem komputer yang merespon perintah suara, bukan masukan dari keyboard ataupun dari mouse. Digunakan untuk salah satu system untuk kebutuhan keamanan. Identifikasisuara atauAutomatic Speech Recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kompresi Audio adalah bentuk kompresi data yang dirancang untuk mengurangi kebutuhan bandwidth transmisi digital audio stream dan ukuran penyimpanan file audio.Video kompresi mengacu untuk mengurangi jumlah data yang digunakan untuk mewakili video digital gambar, dan merupakan kombinasi dari ruang kompresi gambar dan temporal kompensasi gerak.