PENGANTAR Kita tidak menyadari bahwa ujaran yang diwujudkan dalam bentuk bunyi- bunyi yang melewati udara itu sebenarnya merupakan suatu hal yang sangat komplek. Bahkan yang sering terjadi ialah bahwa belum lagi kita menangkap dan memahami suatu deretan kata yang diucapkan, pembiacara tadi telah berlanjut dengan kata-kata yang lain sehingga akhirnya kita ketinggalan. 1. PENELITIAN MENGENAI PERSEPSI UJARAN Meskipun Willis tahun 1829 dan Helmholtz tabun 1859 telah mempelajari ciri fisik dari bunyi, penelitian menge- nai bagaimana kita mempersepsi ujaran baru mulai menjelang Perang Dunia II (Gleason dan Ratner 1998). Dari tahun 1936-39 Dudly dari Bell Telephone Laboratory, Amerika, mengembangkan mesin yang dinamakan vocoder. Mesin ini mulanya adalah untuk menyampaikan signal melalui kabel telepun jarak jauh. Akan tetapi, kualitasnya tidak cukup baik sebagai piranti komunikasi. Pada tahun 1940-an perusahaan telepun ini mengembangkan spektogram, yakni, alat untuk merekam suara dalam bentuk garis-garis tebal-tipis dan panjang-pendek yang dinamakan spektogram, Kualitas bunyi makin lama makin dapat dijadikan lebih baik dan peralatan untuk kajian mengenai bunyi juga makin menjadi canggih. 2. MASALAH DALAM MEMEPERSEPSI UJARAN Dalam bahasa Inggris orang rata-ratanya mengeluarkan 125-180 kata tiap menit. Penyaji berita di televisi mencapai 210 kata telah menelitinya, tetapi karena kata-kata dalam bahasa Indonesia dan pelelang bisa mencapai lebih dari itu (Gleason dan Ratner 1998). Maka dapat diduga bahwa orang Indonesia pun mengeluarkan jumlah bunyi vang sama tiap detiknya, yakni, antara 25-30 bunyi. Dengan demi- kian, tiap kali kita berbicara satu menit kita telah akan mengeluarkan antara 1500 -1800 bunyi. Getar pita Suara untuk wanita berkisar antara 200-300 per detik, sedangkan untuk pria hanya sekitar 100. Karena itu, suara seorang pria kedengaran lebih "berat." Suara anak lebih tinggi dari suara wanita karena getaran pita suaranya DIsa mencapai 400 per detik. Perbedaan-perbedaan ini tentu saja memunculkan bunyi vang berbeda-beda, meskipun kata yang diucapkan itu sama. 3. MEKANISME UJARAN Sumber dari bunyi adalah paru-paru. Paru-paru kita berkembang dan berkempis untuk menyedot dan mengeluarkan udara Melalui saluran di tenggorokan, udara ini keluar melalui mulu atau hidung. Dalam perjalanan melewati mulut atau ada kalanya udara itu dibendung oleh salah satu bagian dari mulut kita sebelum kemudian dilepaskan. Hasil bendungan udara inilah yang menghasilkan bunyi. Pada mulut terdapat dua bagian: bagian atas dan bagian ba- wah mulut. Bagian atas mulut umumnya tidak bergerak sedang- kan bagian bawah mulut bisa digerakkan. Bagian-bagian ini adalah: 1. Bibir: atas dan bibir bawah dapat membentuk bunyi yang dinamakan bilabial. Bunyi seperti [p], [b], dan [m] adalah bunyi bilabial 2. Gigi: gigi ini dapat membentuk bunyi labiodental. Contoh untuk bunyi seperti ini adalah bunyi [f] dan [v]. gigi juga dapat membentuk bunyi dental seperti bunyi [f] dan [d] dalam bahasa indonesia 3. Alveolar. Bunyi [t] dan [d] dalam bahas inggris adalah contoh bunyi alveolar 4. Palatal keras (hard palate): daerah ini ada di rongga atas mulut, persis di belakang daerah alveolar. Bentuk bunyi yang dinamakan alveopalatal seperti bunyi [c] dan [j] 5. Palatal lunak (soft palate): palatal lunak dapat diletakkan bagian belakang lidah untuk membentuk bunyi yang dinamakan velar seperti bunyi [k] dan [g] 6. Uvula: bila uvula berlekatan dengan dinidng laring maka udara disalurkan melalui mulut dan menghasil bunyi yang dinamakan oral. 7. Lidah: lidah dibagi menjadi beberapa bagian (a) Ujung lidah (tip of tounge) (b) Mata lidah (blade) (c) Depan lidah (front) (d) Belakang lidah 8. Pita suara menentukan perbedaan antara satu konsonan dengan konsonan yang lain. 9. Faring (pharynx): saluran udara menuju ke rongga mulut atau rongga hidung. 10. Rongga hidung: rongga untuk bunyi-bunyi nasal seperti /m/ dan /n/. 11. Rongga mulut: untuk bunyi-bunyi oral seperti /p/, /bl, lal, dan /i/. 3.1 BAGAIMANA BUNYI DIBUAT Di samping pembagian bunyi menjadi bunyi nasal dan oral seperti dinyatakan di atas, bunyi juga dapat dibagi menjadi dua kelompok besar: konsonan dan vokal. Perbedaan antara kedua macam bunyi ini terletak pada cara pembuatannya. 3.1.1 PEMBUATAN BUNYI KONSONAN Bunyi dibuat dengan memanfaatkan bagian mulut seperti lidah, bibir, dan gigi. Bagian-bagian ini dinamakan artikulator. Untuk membuat bunyi konsonan perlu diperhatikan tiga faktor. Perta- ma adalah titik artikulasi, yakni, tempat di mana artikulator itu berada, berdekatan, atau berlekatan. Faktor kedua dalam membuat bunyi konsonan adalah cara artikulasi, yakni, bagaimana caranya udara dari paru-paru itu kita lepaskan. Apabila udara itu kita tahan dengan ketat di mulut lalu kemudian kita lepaskan dengan serentak maka bunyi tadi akan menimbulkan semacam letupan. Karena itu, bunyi ini dinamakan bunyi plosif atau stop. Dalam bahasa Indonesia sering dipakai istilah bunyi hambat. Masing-masing pasangan bunyi mrmang berbeda dan perbedaan ini disebabkan oleh faktor ketiga, yakni, status pita suara. 3.1.2 PEMBUATAN BUNYI VOKAL Berbeda dengan konsonan, kriteria yang dipakai untuk mem- bentuk bunyi vokal adalah (1) tinggi-rendahnya lidah, (2) posisi lidah, (3) ketegangan lidah, dan (4) bentuk bibir. Karena lidah itu lentur, maka lidah dapat digerakkan untuk dinaikkan atau diturunkan. Naik-turunnya lidah menyebabkan ukuran rongga mulut berubah. Bila lidah berada di posisi tinggi, maka ruang yang akan dilalui oleh udara dari paru-paru menjadi sempit. 3.1.3 FONOTAKTIK Tiap bahasa memiliki sistem sendiri-sendiri untuk mengga- bungkan fonem agar menjadi suku dan kemudian kata. Dengan demikian maka tidak mustahil adanya dua bahasa yang memi- liki beberapa fonem yang sama tetapi fonotaktiknya, yakni, sistem pengaturan fonemnya, berbeda. Bahasa Inggris sangat kaya dengan gugus kosonan: ada 45 gugus yang dapat berada di awal, dan 190 gugus di akhir kata (Fries 1945). Bahasa Indonesia tidak kaya dengan gugus konsonan, tetapi bahasa Indonesia moderen kini telah menyerap gugus asing sehingga memungkinkan adanya tiga konsonan di awal suku, meskipun bentuk-bentuk ini hanya terdapat pada kata-kata pinjaman. Di akhir suku, kalau pun ada, kata-kata ini sangat jarang ditemukan. 3.1.4 STRUKTUR SUKUKATA Suatu sukukata terdiri dari dua bagian utama, yakni, onset (pembuka) dan rima (rhyme). Rima terdiri dari nukleus (nucleus) dan koda (coda). Suatu suku dapat memiliki ketiga- tiganya: onset, nukleus, dan koda. Dalam bahasa Indonesia, dan bahasa manapun, bila ada dua konsonan atau lebih yang mendahului nukleus maka konsonan yang lebih dekat dengan nukleus selalu lebih sonoran – suatu sifat bunyi yang kadar fonetiknya didominasi oleh ciir-ciri yang berkaitan dengan vois. 3.1.5 FITUR DISTINGIF Fitur-fitur distingtif yang ada pada konsonan adalah: a. Vokalik dan Konsonantal: semua konsonan adalak [+konsonantal) dan |-vokalik] sedangkan semua vokal adalah [+vokalik] dan [-konsonantal] b. Anterior: bunyi yang dibuat di bagian depan mulut adalah [+anterior]. Jadi, bunyi /p/ adalah [+anteriorl sedangkan /k/ adalah [-anterior]. c. Koronal (coronal): bunyi yang dibuat di bagian tengah atas mulut adalah [+koronal]. Jadi, bunyi se perti /p/ adalah [- koronal] tetapi /s/ adalah [+koro- a. b. nal). d. Kontinuan (continuant): bunyi yang dibuat dengan aliran udaranya bisa terus berlanjut. Tentu saja bunyi Id/ adalah [- kontinuan] sedangkan /f/ adalah [+konti- nuan]. e. Straiden (strident): bunyi yang dibuat dengan iring- an desahan suara. Dengan definisi ini maka /g/ ada- lah [- straiden] sedangkan /s/ adalah [+straiden]. f. Nasal: bunyi yang dibuat dengan udara keluar mela- lui hidung. Karena itu, /m/ adalah [+nasal] tetapi /t/ adalah [- nasal]. g. Vois: bunyi yang disertai getaran pada pita suara. Semua vokal adalah [+vois] sedangkan /s/ adalah [- vois] dan /z/ adalah [+vois]. 3.1.6 VOICE ONSET TIME Voice Onset Time masing suku terdiri dari beberapa fonem. Kata ban sepen atas, misalnya, terdiri dari tiga fonem /b/, la/, dan /n/. T dari satu bunyi ke bunyi yang lain tentunya memerlukan w masing-masing bunyi. Transisi dari /b/ ke /an/ pada /ban sama dengan transisi /p/ ke /an/ seperti pada kata pan. Voice Onset Time, yang sering disingkat sebagai VOT lah waktu antara (a) lepasnya udara untuk pengucapan sU konsonan dengan (b) getaran pita suara untuk bunyi vokal va mengikutinya. Dari eksperimen yang dilakukan orang didapati bahwa untuk bahasa Inggris suatu bunyi yang VOTnya antara 0-20 milisekon akan terdengar sebagai bunyi [+vois] sedangkan yang 40-60 milisekon adalah [-vois].
3.2 DIGNIFIKASI BAGI PSIKOLINGUISTIK
Telinga orang Indonesia, misalnya, tidak terlatih untuk mendengar bunyi [p] yang diikuti oleh aspirasi (yakni, getaran udara pula oleh bagaimana bunyi-bunyi itu dibuat, fitur-fitur mana Signifikansinya ang keras waktu kita mengucapkan bunyi tertentu) seperti pada ahasa Inggris. Bila kita mengucapkan bunyi /p/ bahasa Inggris senerti pada kata pan dengan benar, dan di dekat mulut kita ada sudut kertas yang kita siapkan, maka sudut kertas itu pasti akan tersentak dan bergerak. Hal ini tidak terjadi pada bahasa kita kalau kita mengucapkan kata yang sama ini. Karena itu, orang Indonesia pada umumnya tidak dapat pula mendengar adanya aspirasi ini waktu mendengar kata-kata Inggris seperti pat, pick, dan pass. 3.3 TRANSMISI BUNYI Bunyi yang dikeluarkan oleh manusia ditransmisikan ke telinga pendengar melalui gelombang udara. Pada saat suatu bunyi di- keluarkan, udara tergetar olehnya dan membentuk semacam ge- lombang. Gelombang yang membawa bunyi ini bergerak dari depan mulut pembicara ke arah telinga pendengar. Dengan mekanisme yang ada pada telinga, manusia menerima bunyi ini dan dengan melalui syaraf-syaraf sensori bunyi ini kemudian "dikirimkan" ke otak kita untuk diproses dan kemudian ditang- kapnya. Lihatlah visualisasi di halaman berikut (mengikuti Garman, 1994: 4). Pemrosesan di otak dibimbing oleh pengetahuan kita tentang bahasa tersebut, termasuk pengetahuan kita tentang bagaimana bunyi- bunyi itu dibuat dan fitur apa saja yang terlibat. 4. PERSEPSI TERHADAP UJARAN Pada dasarnya ada tiga tahap dalam pemrosesan persepsi bunyi (Clark & Clark 1977): 1. Tahap auditori: Pada tahap ini manusia menerima ujaran sepotong demi sepotong. Ujaran ini kemudian ditanggapi dari segi fitur akustiknya. Konsep-konsep seperti titik artikulasi, cara artikulasi, fitur distingtif, dan VOT sangat bermanfaat di sini karena ihwal seperti inilah yang memisahkan satu bunyi dari bunyi yang lain. Bunyi-bunyi dalam ujaran itu kita simpan dalam memori auditori kita. 2. Tahap fonetik: bunyi-bunyi itu kemudian kita identifikasi. Kemudian VOT-nya juga diperhatikan karena VOT inilah yang akan menentukan kapdan getaran pada pita suara itu terjadi. Segemen-segmen bunyi ini kemudian kita simpan di memori fonetik. Perbedaan antara memori auditori dengan memori fonetik adalah bahwa pada memori auditori semua variasi alofonik yang ada pada bunyi itu kita simpan sedangkan pada memori fonetik hanya fitur-fitur yang sifatnya fonemik saja. 3. Tahap fonologis: Pada tahap ini mental kita menerapkan aturan fonologis pada deretan bunyi yang kita dengar untuk menentukan apakah bunyi-bunyi tadi sudah mengikuti aturan fonotaktik yang pada bahasa kita. Untuk bahasa Inggris, bunyi /n/ tidak mungkin memulai suatu suku kata. Karena itu, penutur Inggris pasti tidak akan menggabungkannya dengan suatu vokal. Seandainya ada urutan bunyi ini dengan bunyi yang berikutnya, dia pasti akan menempatkan bunyi ini dengan bunyi di mukanya, bukan di belakangnya. Dengan demikian deretan bunyi /b/, lal, Inl, lil, dan /s/ pasti akan dipersepsi sebagai beng dan is, tidak mungkin be dan ngis. 5. MODEL-MODEL UNTUK PERSEPSI Dalam rangka memahami bagaimana manusia mempersepsi bunyi sehingga akhirnya nanti bisa terbentuk komprehensi, para ahli psikolonguistik mengemukakan model-model teoritis yang diharapkan dapat menerangkan bagaimana proses persepsi itu terjadi. Sampai saat ini ada empat model teoritis yang telah diajukan orang. 5.1 MODEL TEORI MOTOR UNTUK PERSEPSI UJARAN Model yang diajukan oleh Liberman dkk ini, yang dalam bahasa Inggris disebut sebagai Motor Theory of Speech Perception, menyatakan bahwa manusia mempersepsi bunyi dengan mema- kai acuan seperti pada saat dia memproduksi bunyi itu (Liberman dkk 1967 dalam Gleason dan Ratner, 1998). Seperti dinyatakan sebelumnya, bagaimana suatu bunyi diucapkan dipengaruhi oleh bunyi-bunyi lain di sekitarnya. Namun demikian, bunyi itu akan tetap merupakan fonem yang sama, meskipun wujud fonetiknya berbeda. Persamaan ini disebabkan oleh arti- kulasinya yang sama pada waktu mengucapkan bunyi tersebut. Jadi, meskipun bunyi /b/ pada kata /buka/ dan /bisa/ tidak persis sama dalam pengucapannya, kedua bunyi ini tetap saja dibuat dengan titik dan cara artikulasi yang sama. 5.2 MODEL ANALISIS DENGAN SINTESIS Dalam model ini dinyatakan bahwa pendengar mempunyai sistem produksi yang dapat mensintesisikan bunyi sesuai dengan mekanisme yang ada padanya. Hasil dari analisis dipakai untuk memunculkan atau mensintesiskan suatu ujaran yang kemudian dibandingkan dengan ujaran yang baru dipersepsikan. Bila antara ujaran yang dipersepsi dengan ujaran yang disintesiskan itu cocok maka terbentuklah persepsi yang benar. 5.3 FUZZY LOGICAL MODEL Menurut model ini (Massaro, 1987, 1989) persepsi ujaran terdiri dari tiga proses: evaluasi fitur, integrasi fitur, dan kesimpulan Dalam model ini ada bentuk prototipe, yakni, bentuk yane memiliki semua nilai ideal yang ada pada suatu kata, termasuk fitur-fitur distingtifnya. Informasi dari semua fitur yang masuk dievaluasi, diintegrasi, dan kemudian dicocokkan dengan deskripsi dari prototipe yang ada pada memori kita. Setelah dicocokkan lalu diambil kesimpulan apakah masukan tadi cocok dengan yang terdapat pada prototipe. Model ini dinamakan fuzzy (kabur) karena bunyi, sukukata, atau kata yang kita dengar tidak mungkin persis 100% sama dengan prototipe kita. 5.4 MODEL COHORT Model untuk mengenal kata ini (Marslen-Wilson dan Welsh, 1978 dan Marslen-Wilson, 1987 dalam Gleason dan Ratner, 1998; lihat juga Dominic W. Massaro 1994) terdiri dari dua tahap. Pertama, tahap di mana informasi mengenai fonetik dan akustik bunyi-bunyi pada kata yang kita dengar itu memicu ingatan kita untuk memunculkan kata- kata lain yang mirip dengan kata tadi. Pada tahap kedua, terjadilah semua kata yang mulai dengan /p/ akan teraktifkan: pahala, ngar bunyi /r/ maka kata pahala dan pujaan akan tersingkirkan proses eliminasi secara bertahap. 5.5 MODEL TRACE Model ini mula-mulanya adalah model untuk persepsi huruf tetapi kemudian dikembangkan untuk mempersepsi bunyi (McClelland dan Rumelhart 1981; Elman dan McClelland 1984; 1986). Model TRACE berdasarkan pada pandangan yang koneksionis dan mengikuti proses top-down. Artinya, konteks leksikal dapat membantu secara langsung pemrosesan secara perseptual dan secara akustik. 6. PERSEPSI UJARAN DALAM KONTEKS Bunyi selalu diujarkan secara berurutan dengan bunyi yang lain sehingga bunyi-bunyi itu membentuk semacam deretan bunyi. Lafal suatu bunyi yang diujarkan secara berurutan dengan bunyi yang lain tidak sama dengan lafal bunyi itu bila dilafalkan secara sendiri-sendiri. Karena itulah maka betapa pun berbedanya lafal suatu bunyi, pendengar akan tetap menganggapnya sama bila perbedaan itu merupakan akibat dari adanya bunyi lain yang mempengaruhinya. Akan tetapi, sebagai pendengar kita tetap saja dapat memilah- milahnya dan akhirnya menentukannya. Pengetahuan kita sebagai penutur bahasa membantu kita dalam proses persepsi. Faktor lain yang membantu kita dalam mempersepsi suatu ujaran adalah pengetahuan kita tentang sintaksis maupun semantik bahasa kita. Suatu bunyi yang terucap dengan tidak jelas dapat diterka dari wujud kalimat di mana bunyi itu terdapat.