Anda di halaman 1dari 4

Tajuk jurnal :Pengecaman Automatik Suprasegmental Dalam Ucapan

Nama Penulis :Jiahong Yuan , Neville Ryant , Xingyu Cai , Kenneth


Church, Mark Liberman

1.0 Pengenalan

Artikel ini bertajuk Pengecaman Automatik Suprasegmental Dalam Ucapan. Artikel ini ditulis
oleh Jiahong Yuan , Neville Ryant , Xingyu Cai , Kenneth Church, dan Mark Liberman dari
Baidu Research USA Linguistic Data Consortium, University of Pennsylvania. Kajian ini
dilaksanakan untuk meningkatkan pengecaman automatik suprasegmental dengan
menggabungan dua perisian yang bernama Wav2Vec 2.0 dan Connectionist Temporal
Classification (CTC). Penggunaan perisian ini merupakan satu kaedah yang telah berjaya
dalam mengecam dan meningkatkan intonasi dalam ujaran secara automatik. Wav2Vec 2.0
dan CTC juga merupakan perisian yang digunakan untuk meningkatkan pengecaman
suprasegmental dari segi suku kata, nada dan aksen pic secara automatik. CTC pula
merupakan satu rangkaian neural yang membantu menangani masalah seperti pengecaman
penulisan dan pertuturan. Kajian ini mengadaptasi sebuah kajian yang menggunakan TIMIT
iaitu satu perisian yang direka bentuk untuk pengecaman fonem dalam pertuturan.

2.0 Idea teori atau soalan kajian yang memberi inspirasi kepada kajian ini

Suprasegmental ialah unit fonologi dalam pertuturan yang lebih besar daripada segmen
iaitu, konsonan dan vokal, seperti suku kata, tekanan leksikal, nada, dan intonasi. Persoalan
utama kajian ini adalah untuk mengkaji bahawa perisian ini dapat membezakan intonasi
ujaran supaya dapat mengesan ujaran dalam ucapan mengikut emosi. Berdasarkan hasil
kajian, perisian ini membantu mengecam suprasegmental dalam ujaran secara automatik
apabila tona syllabel digunakan sebagai unit utama kerana dapat memisahkan ayat kepada
syllabel supaya penterjemahan suara dilakukan dengan betul. Ia juga tidak membantu
sekiranya menggunakan ton sbagai unit utama. Hal ini membantu kita untuk mengesan
nada, jeda, tona dan intonasi dalam ujaran mengikut emosi dan membetulkan kesilapannya
yang terdapat dalam ujaran. Perisian ini juga dapat menterjemahkan satu perkataan yang
sama tetapi diujarkan dalam intonasi yang berbeza. Tambahan pula, perisian ini juga dapat
menterjemahkan ujaran yang mengandungi bahasa campuran kepada bahasa yang betul.
Contohnya, satu ujaran yang mengandungi gabungan dua bahasa seperti bahasa inggeris
dan Mandarin dapat diterjemahkan kepada bahasa Mandarin yang betul.

3.0 Kaedah digunakan untuk meneliti topik tersebut

Kaedah yang digunakan dalam kajian ini adalah kaedah kuantitatif. Pengkaji memaparkan
hasil dapat secara signifikan dengan menggunakan numeral. Kebolehpercayaan dan
kesahan kajian ini amat tinggi kerana menggunakan kaedah kuantitatif. Pengkaji telah
menggunakan unit dalam bahasa mandarin yang dicipta sendiri olehnya untuk
penterjemahan.

4.0 Keputusan yang paling ketara

Kajian ini menunjukkan tiga keputusan ketara. Pertamanya ialah, apabila perisian CTC
bergabung dengan Wav2vec 2.0 dapat meningkatkan pengecaman automatik
suprasegmental dalam ucapan. Jika CTC diletakkan pada tahap kehilangan (CTC LOSS), ia
dapat mengecam dan meningkatkan suprasegmental dari segi syllabel, pic iaitu intonasi
menaik atau menurun dan tona. Mengikut pengkaji penggunaan kedua-dua perisian ini
dapat meningkatkan ujaran bahasa mandarin dengan intonasi yang betul. Yang keduannya
adalah, penggunaan tona syllabel sebagai unit utama dapat membantu meningkatkan
pengecaman automatik suprasegmental dalam ucapan. Sebaliknya, ia tidak membantu
sekiranya tona digunakan sebagai unit utama. Ketiganya pula, perisian ini dapat mengecam
ton bahasa mandarin dan bahasa inggeris semasa menterjemahkan ujaran. Ia berupaya
untuk menterjemahkan ujaran kepada intonasi yang dimaksudkan. Secara keseluruhannya,
penggunaan perisian ini dapat mengurangkan ralat sebanyak 70 % berbanding dengan
penggunaan perisian yang sebelumnya.

5.0 Implikasi dapatan kajian terhadap kehidupan sebenar

Kajian ini dapat meningkatkan pengecaman suprasegmental yang betul dalam ujaran
dengan mengurangkan ralat yang terdapat dalam ujaran oleh seseorang penutur
terutamanya dalam bahasa mandarin dengan kejituan yang tinggi. Bagi seorang guru,
suprasegmental dalam pengajaran kemahiran lisan amat penting bagi para guru agar dapat
memberikan kefahaman yang baik kepada para murid dan seterusnya menjadikan sistem
pengajaran dan pembelajaran lebih berkesan agar apa yang disampaikan oleh guru dapat
difahami dan murid boleh menggunakan ciri-ciri suprasegmental yang betul dalam
penggunaan penuturan bahasa Melayu. Antara kepentingan suprasegmental dalam
Pengajaran Kemahiran Lisan adalah seperti memahami penggunaan intonasi yang betul
apabila bercakap atau berucap di kalangan orang ramai mengikut kesesuaian apa yang
ingin diujarkan. Melalui pengajaran tatabahasa fonem suprasegmental amat penting
terutamanya untuk membezakan maksud ayat. Murid juga akan diberi kefahaman tentang
perbezaan perkataan yang lazimnya mempunyai makna yang berbeza tetapi mempunyai
sebutan dan ejaan yang sama. Dalam pengajaran dan pembelajaran apabila mereka dapat
mengetahui dan memahami perbezaan-perbezaan yang wujud dalam sistem bahasa itu
sendiri secara khusus.

BAHAGIAN B
1.1 Kaitan kajian dengan kursus

Suprasegmental merupakan salah satu subtopik yang terdapat dalam kursus Psikolinguistik.
Dalam kajian ini, pengkaji membincangkan tentang pengiktirafan automatik suprasegmental
dalam ucapan bahasa Mandarin. Suprasegmental terbahagi kepada tiga bahagian. Yang
pertama fokus kepada bunyi yang bersifat tekanan atau stress iaitu yang berkaitan masalah
keras lunaknya bunyi. Yang kedua, fokus kepada nada ataupun pic yang berkenaan dengan
tinggi rendahnya bunyi, lantunan suara ketika membunyikan bahasa. Fokus suprasegmental
yang ketiga ialah, berkenaan dengan jeda atau persendian iaitu mengenai hentian bunyi
dalam arus ujar atau juga dinamakan dalam bahasa Mandarin. Contohnya jeda antara kata
diberi tanda (-) jeda antara frasa diberi tanda (//), jeda antara perkataan diberi tanda (h).

2.0 Kekuatan artikel

Pengkaji menggunakan kaedah kuantitatif yang membantu untuk mendapatkan dapatan


yang jitu dan signifikan. Perisian ini juga dapat dipasarkan kerana dapat menurunkan ralat
dalam ujaran dengan ketara berbanding dengan perisian lain. Penggunaan perisian
Wav2vec 2.0 dengan CTC dalam artikel ini dapat membantu pembaca untuk meningkatkan
tahap pengecaman automatik suprasegmental termasuk suku kata, nada dan aksen pic
dengan lebih lanjut. Ia juga membantu pembaca untuk mengenal pasti ralat yang ada pada
pengecaman nada dan loghat nada dan mengurangkannya. Penulis menggunakan gambar
rajah untuk menerangkan proses penggunaan perisian Wav2vec 2.0 dan jadual untuk
menerangkan hasil dapatannya. Ia membantu pembaca untuk lebih memahami tentang
prosedur penggunaan model ini serta kelebihannya. Sebagi seorang guru, penggunaan
perisian ini dapat membantu kita membaiki aspek suprasegmental murid-murid dalam
proses pengajaran dn pembelajaran di dalam bilik darjah. Contohnya, guru juga boleh
menggunakannya dalam melatih murid-murid yang mengambil bahagian dalam
pertandingan seperti pidato. Penulis juga telah menggunakan sumber rujukan yang
mempunyai banyak fakta dan dapatan kajian yang menyokong penulisannya. Cara susunan
fakta dan maklumat penulis juga merupakan salah satu kekuatan dalam artikel ini. Penulis
menyusun maklumat beliau dengan menarik di mana tajuk utama dan sub topik dipisahkan.
Data fakta teks juga penting dalam sesuatu artikel dan penulis telah membuat yang terbaik
dalam memudahkan ayat-ayat dan idea supaya lebih senang difahami oleh pembaca
walaupun dalam bahasa Inggeris.

3.0 Adakah penulis telah menerangkan dan menganalisis dapatan kajian dengan baik?

Penulis telah menerangkan dan menganalisis dapatan kajian dengan baik. Penulis telah
menggunakan jadual dan gambar rajah untuk menerangkan model yang digunakan dan
dapatan. Di samping itu, penulis juga menganalisis setiap aspek secara berasingan dan
terperinci seperti unit mengecam nada, fonem Inggeris yang membantu pengecaman nada
mandarin dan sebagainya.

4.0 Kelemahan artikel

Penggunaan koding yang terlalu banyak menyukarkan pembaca. Walaupun penggunaan


koding merupakan cara yang baik untuk menerangkan fikiran penulis, ia juga boleh
membosankan serta mengelirukan pembaca. Penggunaan bahasa yang agak tinggi juga
menyukarkan pemahaman pembaca terhadap kandungan artikel. Tambahan pula perisian
ini hanya boleh digunakan untuk satu bahasa sahaja iaitu bahasa mandarin. Kelemahan lain
dalam artikel ini ialah penulis tidak memberi cadangan yang bersesuaian dengan masalah
yang dihadapi. Pada pendapat saya, selepas mengenalpasti isu dan masalah dalam
penggubalan kurikulum, seharusnya dikuti dengan cadangan kritikal yang boleh digunakan
dalam membendung masalah-masalah tersebut. Penulis seharusnya memberi pendapat
beliau dalam menangani masalah atau isu dalam kurikulum kita pada masa kini.

6.0 Batasan kaedah yang digunakan

Penulis meletakkan skop dan ruang yang agak sempit dalam batasan kajian, namun begitu
keseluruhan aspek dalam teks karya tersebut merupakan intipati yang menyeluruh. Penulis
telah mengehadkan kajian terhadap pengecaman automatik suprasegmental dalam ucapan
satu bahasa sahaja iaitu bahasa Mandarin.

7.0 Adakah sebarang tafsiran yang dibuat oleh penulis yang anda fikirkan salah, tidak
wajar atau keterlaluan?

Segala tafsiran yang dibuat oleh penulis adalah wajar dan tidak keterlaluan kerana tiada
fakta yang boleh menyinggung perasaan pembaca digunakan dalam artikel ini. Tafsiran
yang digunakan juga sangat mudah untuk membaca dan memahaminya. Data yang
diperoleh melalui perisian Wav2vec 2.0 dengan CTC diterangkan sangat sesuai dengan
bidang pendidikan.

8.0 Adakah anda mempunyai sebarang persoalan apabila membaca artikel ini?

Semasa membaca artikel ini, terdapat beberapa soalan seperti berikut:

 Adakah perisian ini sesuai digunakan untuk setiap tahap terutamanya kanak-kanak?
 Adakah perisian ini boleh digunakan untuk bahasa lain?
 Adakah perisian ini dapat mengurangkan ralat kepada tahap yang lebih rendah?
 Adakah perisian ini dapat dipasarkan?

Anda mungkin juga menyukai