Anda di halaman 1dari 4

JUDUL : Suara fleksibel: Persepsi identitas dari sinyal vokal variabel

Abstrak

Suara manusia sangat bervariasi: Orang yang sama dapat terdengar sangat berbeda tergantung pada
apakah mereka berbicara, tertawa, berteriak atau berbisik. Agar berhasil mengenali seseorang dari
suaranya, pendengar harus bisa menggeneralisasikan seluruh sinyal vokal yang berbeda ini
('menyatukan orang-orang') Namun, dalam sebagian besar studi pengolahan identitas suara Saat ini,
variabilitas dalam-orang yang substansial telah dihilangkan melalui penggunaan rangsangan yang sangat
terkontrol, sehingga berfokus pada bagaimana kita membedakan orang. Kami berpendapat bahwa ini
mengaburkan pemahaman kami tentang pemrosesan identitas suara dengan mengendalikan suatu fitur
penting dari rangsangan vokal yang dapat mencakup informasi diagnostik. Dalam makalah ini, kami
mengusulkan bahwa kami perlu memperpanjang fokus penelitian identitas suara untuk menjelaskan
baik orang Btelling bersama ^ maupun orang Btelling terpisah. ^ Artinya, kita haru menjelaskan apakah,
dan sejauh mana, pendengar dapat mengatasi variabilitas dalam-orang untuk mendapatkan persepsi
orang yang stabil identitas dari isyarat vokal. Untuk melakukan ini, kerangka teoritis dan metodologis
kami perlu disesuaikan agar secara eksplisit memasukkan studi variabilitas dalam-orang.

Kata kunci Suara. Identitas. Variabilitas. Keakraban

PENGANTAR

Suara manusia menyediakan banyak isyarat untuk identitas orang - dari hanya rekaman suara pendek,
pendengar bisa membedakan antara penutur, mengenalinya sebagai akrab dan mengidentifikasi mereka
dengan nama mereka (Kreiman & Sidtis, 2011). Variasi dalam anatomi alat vokal masing-masing
individu, seperti ketebalan lipatan vokal, perbedaan dalam bentuk langit-langit seseorang, dan
penggunaan vokal yang dinamis traktat, menimbulkan perbedaan dalam pelafalan, aksen, dan fitur
lain yang ditandai secara khusus dari inventori vokal seseorang (lihat Scott & McGettigan, 2015, untuk
ulasan). Konsekuensi akustik dari perbedaan-perbedaan ini antara individu memungkinkan pendengar
untuk memproses identitas pembicara dari vokal mereka hanya sinyal Pengenalan suara adalah prestasi
yang luar biasa: Perilaku vokal manusia sebenarnya sangat bervariasi dan kompleks. Misalnya, tindakan
berbicara membutuhkan koordinasi temporal dan spasial yang tepat dari sejumlah struktur anatomi
termasuk bibir, rahang, lidah, dan pita suara di dalam laring (atau Bvoice kotak ^) untuk menghasilkan
sinyal bahasa yang kaya dan dinamis. Lebih lanjut, fleksibilitas produksi suara manusia memungkinkan
kita untuk dengan lancar menggabungkan suara ucapan menjadi kata-kata baru, dan kata-kata menjadi
ucapan unik, serta untuk mengatasi berbagai tekanan komunikatif, seperti berbicara dengan audiens
yang berbeda (mis., hewan peliharaan, petugas polisi, pelajar bahasa) dan berbicara dalam konteks yang
berbeda (mis., di kafe yang bising vs. di perpustakaan yang sunyi). Secara keseluruhan, sifat-sifat sistem
vokal ini diperkenalkan variabilitas dalam-orang yang cukup besar dalam suara manusia, sehingga sifat
fisiknya sangat tergantung pada konten dan konteks perilaku yang dilakukan. Untuk sebagian Sejauh ini,
pendengar dapat mengatasi variabilitas ini untuk mengekstraksi persepsi individu yang relatif stabil.
Namun, ada yang mencolok contoh kapan kemampuan ini gagal, seperti bidang saksama penelitian
dapat dengan mudah membuktikan (Read & Craik, 1995; Saslove & Yarmey, 1980).
Dijelaskan secara luas, persepsi identitas tergantung pada dua proses mendasar: membedakan orang
yang berbeda, sementara juga menjaga keteguhan dalam persepsi individu di berbagai instansi yang
berbeda dan beragam (mis., Btelling orang bersama ^, Burton, 2013). Anehnya, bagaimanapun,
ituPengenalan suara adalah pencapaian yang luar biasa: Perilaku manusia yang sangat bervariasi dan
kompleks. Misalnya tindakan berbicara membutuhkan perdebatan temporal dan spasial yang tepat dari
struktur anatomi termasuk bibir, rahang, lidah, dan pita suara di dalam laring (atau Bvoice kotak ^)
untuk menghasilkan bahasa isyarat kaya dan dinamis. Lebih lanjut, Dapat memproduksi suara manusia
yang dapat kita perbarui dengan suara yang menjadi kata-kata baru, dan kata-kata menjadi ucapan unik,
juga untuk mengatasi berbagai tekanan komunikatif, seperti berbicara dengan audiens yang berbeda
(mis., hewan peliharaan, petugas polisi, pelajar bahasa) dan berbicara dalam konteks yang berbeda (mis.,
di kafe yang berisik vs di perpustakaan yang sunyi). Secara keseluruhan, sifat-sifat sistem vokal ini
diluncurkan variabilitas dalam-orang yang cukup besar dalam suara manusia, Jadi sifat fisiknya sangat
tergantung pada konten dan konteks yang dilakukan. Untuk sebagian Sejauh ini, pendengar dapat
mengatasi variabilitas ini untuk mengekstraksi persepsi individu yang relatif stabil. Namun, ada yang
menonjol contoh kapan saja kemampuan ini gagal, seperti bidang saksama penelitian dapat dengan
mudah membuktikan (Read & Craik, 1995; Saslove & Yarmey, 1980). Dijelaskan secara luas, persepsi
identitas tergantung pada dua proses mendasar: membedakan orang yang berbeda, sementara juga
menyangkut keteguhan dalam persepsi individu di berbagai lembaga yang berbeda dan beragam (mis.,
Btelling orang bersama ^, Burton, 2013). Anehnya, belum, itu Sumber variabilitas dalam-orang dalam
suara Keragaman dalam-orang dalam sinyal suara kami sangat besar: kami dengan sukarela memodulasi
suara kami untuk mengekspresikan pikiran kami dan bermaksud atau menyesuaikan output vokal kami
agar sesuai dengan yang khusus audiens, lingkungan berbicara, atau situasi. Suara dar suara-suara kita
dan jenis vokalisasi yang kita hasilkan juga dipengaruhi oleh proses-proses yang sedikit atau tidak kita
miliki kontrol kehendak, seperti perubahan dalam keadaan emosi atau kita keadaan kesehatan (lihat
Tabel 1). Gambar 1 lebih lanjut menggambarkan bagaimana berbeda susunan fisik vokalisasi dapat:
meskipun dengan durasi yang sama, jelas bahwa ketiganya digambarkan vokalisasi berbeda secara
substansial satu sama lain dalam struktur fisik. Perbedaan dalam jumlah onsets, ketik dan laju modulasi
sinyal dan sifat spektral keseluruhan dari segmen yang berbeda dapat dilihat dari bentuk gelombang
(kiri) dan spektrogram (kanan) dari bunyi. Dalam penelitian terbaru, Kreiman, Park, Keating dan Alwan
(2015) berusaha untuk mengukur secara empiris variabilitas orang dalam sampel yang diambil dalam
situasi berbicara sehari-hari yang dikumpulkan di berbagai sesi perekaman - sampel disertakan pidato
netral, valensi positif, dan valensi negatif tanpa naskah, serta pidato yang diarahkan pada hewan
peliharaan. Mengukur variabilitas, penulis mengekstraksi sejumlah tindakan akustik, seperti rata-rata
F0, ukuran forant, dan puncak cepstral menonjol (CPP - periodisitas pengindeksan) dan menghitung
rata-rata jarak Euclidean di dalam dan di antara pembicara. Mereka melaporkan bahwa variabilitas
dalam-orang dalam rangkaian pidato ini vokalisasi memang besar, tetapi tidak melebihi variabilitas
antara pembicara dalam studi mereka. Khususnya, bagaimana ini contoh tertentu dari variabilitas
yang diinduksi laboratorium berkaitan dengan variabilitas dalam-orang dalam pengaturan naturalistik,
sehari-hari tetap tidak jelas, dan studi tambahan diperlukan untuk sepenuhnya menggambarkan
sejauh mana variabilitas dalam-orang alami dalam suara. Bagian di bawah ini akan memberikan
gambaran tentang beberapadari sumber perubahan suara kehendak dan spontan.
Menjelaskan suara menggunakan komputer: apakah ada yang unik? Bvoice-cetakan ^? Upaya di
pertengahan hingga akhir abad ke-20 bertujuan menciptakan keunikan Bvoice mencetak ^ yang
merupakan representasi visual yang berasal sinyal vokal, analog dengan sidik jari unik. Validitas
pendekatan ini, bagaimanapun, sebagian besar dipecat sebagai akibat dari studi yang menunjukkan
kecocokan yang buruk pada cetakan suara dari sinyal vokal variabel (mis., suara yang disamarkan) -
selanjutnya, di waktu ada batasan teknis penghalang pada melakukan analisis akustik skala besar yang
diperlukan karena kurangnya sumber daya komputasi yang cocok (Hollien, 2002). Lebih tahun-tahun
terakhir, bagaimanapun, pengenalan dan pengeras suara otomatis algoritma verifikasi (dikembangkan
untuk tujuan forensik dan non-forensik) telah memperkenalkan kembali gagasan Bvoice cetak, ^
gunakan algoritma pengenalan pola untuk mengidentifikasi fitur diagnostik dalam suara individu. Bvoice
ini dicetak ^ mewakili model atau templat abstrak pembicara menyuarakan, dan menyarankan bahwa,
dalam batasan algoritma yang diberikan, templat khusus-speaker memang dapat diturunkan sinyal vokal.
Mengingat variabilitas dalam-orang yang besar dalam sinyal vokal, pendekatan komputasi mungkin
dapat secara formal menetapkan apakah variabilitas dalam-orang benar-benar spesifik untuk seseorang
dan, jika ini masalahnya, jelaskan sifatnya variabilitas (lihat Burton et al., 2016 untuk wajah). Namun,
harus dicatat bahwa sambil mengukur variabilitas dalam-orang dalam suara mungkin, tidak jelas apakah
dan bagaimana representasi suara tersebut berhubungan dengan identitas manusia

Persepsi: algoritma dapat menyertakan fitur akustik di dalamnya perhitungan yang tidak menonjol dan
karena itu non-diagnostik untuk pendengar manusia. Lebih jauh, itu mungkin bahwa pendengar secara
fleksibel menimbang isyarat akustik dalam idiosinkratik cara, membuatnya menjadi tugas yang sangat
kompleks untuk mengukur deskriptor akustik identitas suara yang benar-benar dapat digeneralisasikan.
Peneliti persepsi manusia mungkin tetap dapat mengambil keuntungan dari pendekatan tersebut,
menggunakannya sebagai bukti konsep menunjukkan bahwa masing-masing suara memang unik (diberi
cukup besar Sampel). Apakah dan bagaimana representasi suara seperti itu dan variabilitasnya
kemudian selaras dengan mentalrepresentasi identitas suara pada manusia adalah pertanyaan terbuka
yang kemudian dapat diuji secara empiris

Kesimpulan

Suara manusia adalah sumber informasi yang kaya dan kompleks ke pendengar. Di sini, kami telah
berdebat untuk kepentingan kritis variabilitas dalam-orang sebagai faktor kunci yang harus diatasi dalam
setiap akun tentang bagaimana, dan sejauh mana, kita bisa berhasil mengekstrak informasi tentang
identitas orang dari suara. Kami berpendapat bahwa pendekatan yang ditekankan variabilitas antar-
orang tidak cukup, dan kami melaporkannya semakin banyak pekerjaan yang menunjukkan pengaruh
signifikan dari variabilitas orang dalam terhadap persepsi keberhasilan identitas dari sinyal suara
manusia. Ke depan, itu akan menjadi penting untuk mengukur dan menggambarkan variabilitas dalam-
orang dalam suara dan untuk menentukan hubungannya dengan antara pembicara perbedaan, untuk
berbagai jenis perilaku vokal alami. Di studi persepsi suara-identitas, kita harus menjelaskan bagaimana
variabilitas dalam diri seseorang menantang pemrosesan identitas, tetapi juga menyelidiki bagaimana
hal itu dapat membantu proses terkait, misalnya pembentukan representasi orang berdasarkansuara.
Akhirnya, menarik untuk mempertimbangkan apakah pengamatan kami terkait dengan pemrosesan
identitas suara didasarkan proses persepsi akustik, atau apakah mereka lebih secara luas mencerminkan
proses kognitif amodal dalam pembelajaran dan pembentukan identitas orang dari suara, wajah, atau
tubuh.

Anda mungkin juga menyukai