1.0 Pengenalan
Artikel ini bertajuk Pengecaman Automatik Suprasegmental Dalam Ucapan. Artikel ini ditulis
oleh Jiahong Yuan , Neville Ryant , Xingyu Cai , Kenneth Church, dan Mark Liberman dari
Baidu Research USA Linguistic Data Consortium, University of Pennsylvania. Kajian ini
dilaksanakan untuk meningkatkan pengecaman automatik suprasegmental dengan
menggabungan dua perisian yang bernama Wav2Vec 2.0 dan Connectionist Temporal
Classification (CTC). Penggunaan perisian ini merupakan satu kaedah yang telah berjaya
dalam mengecam dan meningkatkan intonasi dalam ujaran secara automatik. Wav2Vec 2.0
dan CTC juga merupakan perisian yang digunakan untuk meningkatkan pengecaman
suprasegmental dari segi suku kata, nada dan aksen pic secara automatik. CTC pula
merupakan satu rangkaian neural yang membantu menangani masalah seperti pengecaman
penulisan dan pertuturan. Kajian ini mengadaptasi sebuah kajian yang menggunakan TIMIT
iaitu satu perisian yang direka bentuk untuk pengecaman fonem dalam pertuturan.
2.0 Idea teori atau soalan kajian yang memberi inspirasi kepada kajian ini
Suprasegmental ialah unit fonologi dalam pertuturan yang lebih besar daripada segmen
iaitu, konsonan dan vokal, seperti suku kata, tekanan leksikal, nada, dan intonasi. Persoalan
utama kajian ini adalah untuk mengkaji bahawa perisian ini dapat membezakan intonasi
ujaran supaya dapat mengesan ujaran dalam ucapan mengikut emosi. Berdasarkan hasil
kajian, perisian ini membantu mengecam suprasegmental dalam ujaran secara automatik
apabila tona syllabel digunakan sebagai unit utama kerana dapat memisahkan ayat kepada
syllabel supaya penterjemahan suara dilakukan dengan betul. Ia juga tidak membantu
sekiranya menggunakan ton sbagai unit utama. Hal ini membantu kita untuk mengesan
nada, jeda, tona dan intonasi dalam ujaran mengikut emosi dan membetulkan kesilapannya
yang terdapat dalam ujaran. Perisian ini juga dapat menterjemahkan satu perkataan yang
sama tetapi diujarkan dalam intonasi yang berbeza. Tambahan pula, perisian ini juga dapat
menterjemahkan ujaran yang mengandungi bahasa campuran kepada bahasa yang betul.
Contohnya, satu ujaran yang mengandungi gabungan dua bahasa seperti bahasa inggeris
dan Mandarin dapat diterjemahkan kepada bahasa Mandarin yang betul.
Kaedah yang digunakan dalam kajian ini adalah kaedah kuantitatif. Pengkaji memaparkan
hasil dapat secara signifikan dengan menggunakan numeral. Kebolehpercayaan dan
kesahan kajian ini amat tinggi kerana menggunakan kaedah kuantitatif. Pengkaji telah
menggunakan unit dalam bahasa mandarin yang dicipta sendiri olehnya untuk
penterjemahan.
Kajian ini menunjukkan tiga keputusan ketara. Pertamanya ialah, apabila perisian CTC
bergabung dengan Wav2vec 2.0 dapat meningkatkan pengecaman automatik
suprasegmental dalam ucapan. Jika CTC diletakkan pada tahap kehilangan (CTC LOSS), ia
dapat mengecam dan meningkatkan suprasegmental dari segi syllabel, pic iaitu intonasi
menaik atau menurun dan tona. Mengikut pengkaji penggunaan kedua-dua perisian ini
dapat meningkatkan ujaran bahasa mandarin dengan intonasi yang betul. Yang keduannya
adalah, penggunaan tona syllabel sebagai unit utama dapat membantu meningkatkan
pengecaman automatik suprasegmental dalam ucapan. Sebaliknya, ia tidak membantu
sekiranya tona digunakan sebagai unit utama. Ketiganya pula, perisian ini dapat mengecam
ton bahasa mandarin dan bahasa inggeris semasa menterjemahkan ujaran. Ia berupaya
untuk menterjemahkan ujaran kepada intonasi yang dimaksudkan. Secara keseluruhannya,
penggunaan perisian ini dapat mengurangkan ralat sebanyak 70 % berbanding dengan
penggunaan perisian yang sebelumnya.
Kajian ini dapat meningkatkan pengecaman suprasegmental yang betul dalam ujaran
dengan mengurangkan ralat yang terdapat dalam ujaran oleh seseorang penutur
terutamanya dalam bahasa mandarin dengan kejituan yang tinggi. Bagi seorang guru,
suprasegmental dalam pengajaran kemahiran lisan amat penting bagi para guru agar dapat
memberikan kefahaman yang baik kepada para murid dan seterusnya menjadikan sistem
pengajaran dan pembelajaran lebih berkesan agar apa yang disampaikan oleh guru dapat
difahami dan murid boleh menggunakan ciri-ciri suprasegmental yang betul dalam
penggunaan penuturan bahasa Melayu. Antara kepentingan suprasegmental dalam
Pengajaran Kemahiran Lisan adalah seperti memahami penggunaan intonasi yang betul
apabila bercakap atau berucap di kalangan orang ramai mengikut kesesuaian apa yang
ingin diujarkan. Melalui pengajaran tatabahasa fonem suprasegmental amat penting
terutamanya untuk membezakan maksud ayat. Murid juga akan diberi kefahaman tentang
perbezaan perkataan yang lazimnya mempunyai makna yang berbeza tetapi mempunyai
sebutan dan ejaan yang sama. Dalam pengajaran dan pembelajaran apabila mereka dapat
mengetahui dan memahami perbezaan-perbezaan yang wujud dalam sistem bahasa itu
sendiri secara khusus.
BAHAGIAN B
1.1 Kaitan kajian dengan kursus
Suprasegmental merupakan salah satu subtopik yang terdapat dalam kursus Psikolinguistik.
Dalam kajian ini, pengkaji membincangkan tentang pengiktirafan automatik suprasegmental
dalam ucapan bahasa Mandarin. Suprasegmental terbahagi kepada tiga bahagian. Yang
pertama fokus kepada bunyi yang bersifat tekanan atau stress iaitu yang berkaitan masalah
keras lunaknya bunyi. Yang kedua, fokus kepada nada ataupun pic yang berkenaan dengan
tinggi rendahnya bunyi, lantunan suara ketika membunyikan bahasa. Fokus suprasegmental
yang ketiga ialah, berkenaan dengan jeda atau persendian iaitu mengenai hentian bunyi
dalam arus ujar atau juga dinamakan dalam bahasa Mandarin. Contohnya jeda antara kata
diberi tanda (-) jeda antara frasa diberi tanda (//), jeda antara perkataan diberi tanda (h).
3.0 Adakah penulis telah menerangkan dan menganalisis dapatan kajian dengan baik?
Penulis telah menerangkan dan menganalisis dapatan kajian dengan baik. Penulis telah
menggunakan jadual dan gambar rajah untuk menerangkan model yang digunakan dan
dapatan. Di samping itu, penulis juga menganalisis setiap aspek secara berasingan dan
terperinci seperti unit mengecam nada, fonem Inggeris yang membantu pengecaman nada
mandarin dan sebagainya.
Penulis meletakkan skop dan ruang yang agak sempit dalam batasan kajian, namun begitu
keseluruhan aspek dalam teks karya tersebut merupakan intipati yang menyeluruh. Penulis
telah mengehadkan kajian terhadap pengecaman automatik suprasegmental dalam ucapan
satu bahasa sahaja iaitu bahasa Mandarin.
7.0 Adakah sebarang tafsiran yang dibuat oleh penulis yang anda fikirkan salah, tidak
wajar atau keterlaluan?
Segala tafsiran yang dibuat oleh penulis adalah wajar dan tidak keterlaluan kerana tiada
fakta yang boleh menyinggung perasaan pembaca digunakan dalam artikel ini. Tafsiran
yang digunakan juga sangat mudah untuk membaca dan memahaminya. Data yang
diperoleh melalui perisian Wav2vec 2.0 dengan CTC diterangkan sangat sesuai dengan
bidang pendidikan.
8.0 Adakah anda mempunyai sebarang persoalan apabila membaca artikel ini?
Adakah perisian ini sesuai digunakan untuk setiap tahap terutamanya kanak-kanak?
Adakah perisian ini boleh digunakan untuk bahasa lain?
Adakah perisian ini dapat mengurangkan ralat kepada tahap yang lebih rendah?
Adakah perisian ini dapat dipasarkan?