Anda di halaman 1dari 2

Sejarah Speech Recognition

Satu fitur terbaru yang diperkenal di iPhone 4S adalah SIRI. Apakah sebenarnya Siri itu? Secara sederhana Siri adalah sebuah aplikasi terbaru di iPhone 4S yang berguna untuk mengontrol iPhone menggunakan perintah suara. Jika selama ini kita hanya menggunakan perintah sentuh (touch), dengan fitur Siri, kita bisa memerintah iPhone menggunakan suara kita. Hebat bukan? Istilah SIRI sebenarnya berasal dari SRI (Standford Research Institute Artificial Intelligence) yang merupakan nama sebuah lembaga riset yang didanai oleh pemerintah Amerika Serikat. Siri sendiri awal mulanya merupakan software Artificial Intelligence atau kecerdasan buatan yang dikembangkan untuk keperluan militer. Lalu bagaimana cara kerja Siri? Siri bekerja berdasarkan perintah suara yang diterimanya. Misalkan, ketika ada sebuah SMS masuk ke iPhone 4S, kamu bisa memerintahkan Siri untuk membaca SMS tersebut, dan bahkan kemudian kamu bisa memerintah Siri untuk membalas SMS tersebut, dengan kata-kata yang kamu ucapkan. Alhasil, kamupun tidak harus selalu melihat layar iPhone untuk membaca dan kemudian membalas SMS, karena sudah ada Asisten Pribadi di iPhone 4S yang bernama Siri. Namun tahukah kamu bagaimana sebenarnya asal mula penemuan speech recognition sebagai dasar cikal bakal Siri? Voice recognition dibagi menjadi dua jenis yaitu speech recognition dan speaker recognition. Speech recognition adalah jenis pengenalan suara oleh perangkat elektronik tanpa memperdulikan identitas orang yang mengucapkannya. Sedangkan speaker recognition adalah kemampuan perangkat elektronik untuk mengenali suara orang-orang tertentu yang biasa digunakan sebagai alat identifikasi keamanan. Lalu bagaimana sebenarnya awal mula ditemukan teknologi speech recognition ini? 1874 : Alexander Graham Bell berhasil membuktikkan bahwa frekuensi harmoni dari sebuah sinyal elektrik dapat dibagibagi yang kemudian hari berlanjut pada digitalisasi ucapan. 1952 : Bell Labs mengembangkan speech recognizer pertama dengan menggunakan teknologi pemisah frekuensi yang serupa dengan teknologi yang dikembangkan oleh Alexander Graham Bell. 1971-1976 : Defence Advance Research Project Agency dibentuk yang merupakan proyek riset dengan dana dari pemerintah AS. Tujuan dari proyek ini adalah untuk melakukan penelitian teknologi speech recognition. Penemuan terbesar yang dihasilkan proyek ini adalah peningkatan dalam menekan permasalahan variabilitas suara. Pada rentang tahun yang sama pula ditemukan :

Pemrograman dinamik oleh tiga peneliti asal Jepang, Itakura, Skoe, dan Chiba yang dikemudian hari menjadi dasar bagi deret waktu non-linier. Pemodelan Makov oleh Jim Baker dan Fred Jelinek dari IBM yang merupakan pemodelan untuk menentukan letak informasi tetap dalam sebuah sinyal wicara (speech signal). Pertengahan tahun 1970-an : Itakura mengadakan sebuah riset untuk mengembangkan sebuah produk yang berbasis pada asumsi bahwa noise itu walaupun terdengar sama namun pada kenyataannya tidak demikian. Produk tersebut akurasinya mencapai 97,3% saat diuji menggunakan 200 kosakata. Bell Labs mengembangkan sistem yang mampu mengenali suara dari orang-orang yang berbeda dengan akurasi hingga 97,1%. Akhir 1970-an :

Produk speech recognition pertama mulai dipasarkan dengan harga mulai $259 hingga $100.000. 1980-an : Pasaran speech recognition mulai digolongkan menjadi dua, yaitu Call Center Speech Recognition System dan Speech-to-Text Application. 1990-an : Prosesor sebuah personal computer telah sanggup memenuhi level minimal yang diperlukan agar sebuah software speech recognition dapat berjalan dengan lancar serta efektif untuk penggunaan pribadi. 1999 : Sebuah program speech recognition baru telah mampu memahami pembicaraan manusia secara berkesinambungan dengan tingkat akurasi hingga 99% yang membuatnya dapat dengan mudah digunakan oleh pengguna awam sekaligus.

Anda mungkin juga menyukai