com
Isi
a) Tidak perlu memikirkan kesempurnaan kalimat saat memotong audio. ........................................................ ........... 4
c) Bagian dari area abu-abu tumpang tindih (2 atau lebih pembicara berbicara secara bersamaan). ......................... 4
d) Bagian dari wilayah abu-abu adalah musik, melodi, lagu, suara binatang atau suara alam: 5
h) Dialek (kata-kata bahasa lokal) dan Bahasa Asing: Tidak diperlukan transkrip dialek dan bahasa asing. ..... 7
3.3 Mentranskripsikan teks. ........................................................ ........................................................ ......................... 7
b) Hasil akhir audio harus mengandung setidaknya dua kata (≥2). .................................................. 7
c) Angka-angka dalam bahasa Arab harus ditranskripsikan ke dalam kata-kata Melayu. "1 satu". ............... 7
d) Tidak ada tanda baca dalam teks kecuali tanda hubung (-) dan koma atas (') .............................. ..... 7
e) Kata dan kalimat yang berulang harus ditranskripsikan sesuai dengan jumlah pengulangannya. .................................................. 8
h) Kata-kata informal (sekarang kata-kata terkenal yang tidak ada dalam kamus) dan kata-kata tanpa pengucapan
Keterangan
• Area abu-abu: audio dicegat secara default, kami HANYA diizinkan untuk mengubah area abu-abu
saja.
• Area biru: hasil segmentasi Anda, Anda juga perlu menyalin bagian ini ke dalam teks.
• Area putih: audio sebelum dan sesudah area abu-abu, tidak perlu transkrip atau/dan segmen
bagian ini, namun Anda dapat mendengarkannya untuk referensi.
• Klasifikasi audio:
Pintasan keyboard:
1 - melanjutkan pemutaran audio yang Anda tinggalkan.
2 - jeda.
• Langkah 3-1. Jika Anda memilih klasifikasi'membuang ', lanjutkan untuk mengirimkan
tugas. Tidak dibutuhkan ubah teks di bawah ini.
• Langkah 3-2. Jika Anda memilih klasifikasi'pidato ', Anda perlu menentukan apakah audio harus
dipotong atau tidak. Kemudian, transkrip audio.
3. Pedoman Anotasi
3.1 Membuang (membuang)Itu
• Semua audio tidak dalam bahasa Melayu.
Catatan: Jika Anda memilih “membuang ", tidak perlu transkrip, hanya perlu menekan tombol “Kirimkan " dan
pergi ke audio berikutnya.
3.2 SegmenItu
a) Tidak perlu memikirkan kesempurnaan kalimat saat memotong audio.
c) Bagian dari area abu-abu tumpang tindih (2 atau lebih pembicara berbicara secara bersamaan).
• Membuang: seluruh audio tumpang tindih, tidak dapat menentukan isi percakapan.
• Pangkas audio: membicarakan hal-hal yang berbeda secara bersamaan, tetapi tidak dapat
menentukan isi percakapan - harap potong bagian ini dan pertahankan bagian yang jelas
untuk transkripsi.
d) Bagian dari wilayah abu-abu adalah musik, melodi, lagu, suara binatang atau suara alam:
• Membuang:
- Jika seluruh audio adalah lagu atau suara non-manusia, seperti musik,
melodi, suara binatang serta suara alam dan sebagainya -
'Membuang' audionya.
- Jika pembicara bernyanyi sesuai dengan lagu dengan lirik (= 2 suara manusia) - 'Membuang'.
• Pangkas audio:
- Jika kebisingan latar belakang adalah lagu dengan lirik, 'Membuang'Seluruh audio
jika sulit untuk memotong audio.
- * * * TETAPI, jika kebisingan latar belakang tidak mengganggu kejelasan ucapan
pembicara, potong bagian ini dan jaga agar bagian ucapan manusia tetap jelas,
lalu transkripsikan ucapan tersebut (abaikan kebisingan latar belakang).
• Simpan dan Transkrip:
- Jika kebisingan latar belakang adalah melodi tanpa lirik dan ucapan manusia jelas,
dipertahankan, dan ditranskripsikan ke seluruh audio.
- Jika pembicara bernyanyi mengikuti melodi tanpa lirik, harap transkrip audio jika jelas.
e) Jeda/gangguan di awal, tengah, dan akhir klip audio.
- Jika suara mengganggu isi percakapan, potong bagian, simpan audio dalam
bahasa Melayu dan transkrip audio. Jika derau tidak mengganggu isi
- percakapan (tidak peduli berapa lama derau itu terjadi), abaikan saja, dan
transkrip seluruh audio.
ItuMisalnya: “Ucapan 1 + jeda/diam/suara ( bukan ucapan manusia dan bukan
memotong isi pembicaraan ) + Ucapan 2 ”. Transkrip “Pidato 1 + Pidato 2”.
ItuMisalnya: “Ucapan 1 + jeda/diam/suara ( mengganggu kejelasan isi percakapan ) +
Pidato 2”. Apakah "Ucapan 1" atau "Ucapan 2" diterima sebagai segmen, Anda dapat
memilih salah satunya. Tapi, jangan transkrip keduanya sekaligus.
* * Jika suara itu adalah ucapan manusia yang tidak jelas, Anda harus memotong bagian
itu (jangan diabaikan !!).
f) Kata kapital
• Kata-kata kapital yang tidak dapat dihitung
Baik di awal dan akhir atau di tengah, jangan transkrip dan potong bagiannya.
Itu Misalnya: "Pidato 1 + kata-kata kapital yang tak terhitung + Pidato 2". Apakah "Ucapan 1"
atau "Ucapan 2" diterima sebagai segmen, Anda dapat memilih salah satu yang lebih jelas
dari yang lain. Jangan menyalin keduanya sekaligus.
Itu Misalnya “kata kapital tak terhitung + Pidato 1”, simpan saja “Ucapan 1” dan transkripnya.
• Kata-kata kapital yang dapat
dihitung Di awal dan akhir:
Pidato yang dipilih harus dimulai (dan diakhiri) maksimal 2 kata kapital.
Itu Misalnya: Ada suara tawa (10 “ha”) di awal pidato, cukup
hanya mempertahankan sebagian suara tawa di audio (sekitar 2 “ha ha”
di audio).
Di tengah-tengah:
Jika kamu bisa menghitung jumlah kata kapital, Anda memerlukan transkrip berdasarkan
jumlah itu. *** Seperti biasa, semua kata kapital harus dipisahkan dalam transkripsi jika
diulang.
Itu Untuk kata-kata kapital yang berulang, transkrip dengan jumlah yang sama terdengar
• “Bahasa Inggris + Bahasa Melayu” atau “Melayu + Bahasa Inggris” atau “Bahasa
Inggris + Bahasa Melayu + Bahasa Inggris”
- - - - Segmen dan transkrip bagian Melayu. Untuk proyek ASR, menulis transkrip bahasa
Inggris dapat diterima, asalkan jumlah kata tidak boleh lebih dari atau sama dengan tiga
kata dan kata tidak terletak di awal dan akhir audio.
Itu Misalnya: Jika Anda mendengar kalimat:- "Aku mencintaimu, Jenny aku bersumpah", potong bagian bahasa
Inggris dan transkrip "Jenny aku bersumpah".
Tolong hati-hati:
1. Semua kata bahasa Inggris harus mengikuti ejaan Inggris seperti yang dipraktikkan di Malaysia:
: warna : warna
2. Jika sebuah kata memiliki pengucapan yang sama dalam bahasa Melayu dan bahasa Inggris, harap
ditranskripsikan menurut ejaan bahasa Melayu:
: baterai : baterai:
hai : Hai
: ukuran : ukuran
: dengan serius :
serius : iya: Tipe
3. Dalam situasi di mana kata dalam bahasa Inggris digabungkan dengan sufiks bahasa Melayu, harap
transkripsikan kata tersebut seperti biasa dalam bahasa Melayu.
Contoh: saya + lapor = lapor
h) Dialek (kata-kata dari bahasa daerah lain) dan bahasa asing: Tidak diperlukan transkrip dialek dan bahasa asing.
* * * Bahasa Indonesia
Kami memahami bahwa Bahasa Indonesia sangat mirip dengan Bahasa Malaysia/
Melayu, karena keduanya berasal dari rumpun bahasa Austronesia.
Secara umum, kami tidak menganjurkan transkrip bahasa Indonesia .
* * * Kami
hanya menerima jika ejaan transkrip sama dengan yang tercantum (termasuk penggunaan
huruf besar/kecil). Jika ejaannya berbeda dari daftar, itu akan dianggap salah mengeja.
Mengutip kitab suci seperti membaca harus dianggap sebagai bahasa asing, mengingat ayat-ayat
tersebut aslinya dalam bahasa Arab.
d) Tidak ada tanda baca dalam teks kecuali tanda hubung (-) dan koma atas (').
1. Kata ganda harus ditulis dengan tanda penghubung
* * * Pastikan
hanya menggunakan tanda hubung (-) jika penggunaan kata rangkap terlihat jelas dalam konteks kalimat.
Jika kata yang sama diulang beberapa kali tetapi tidak mengandung arti kata rangkap, maka kita hanya perlu menyalin
kata tersebut tanpa harus membubuhkan tanda hubung (-).
e) Kata dan kalimat yang berulang perlu ditranskripsikan berdasarkan jumlah pengulangannya.
f) Singkatan
• Singkatan untuk frase seperti gws, otw, btw, imo, lol, dll (cepat sembuh, dalam perjalanan, omong-omong, menurut
saya, tertawa terbahak-bahak, dll), singkatan ini harus ditranskripsi dalam huruf kecil.
g) Huruf kapital
• Jangan menggunakan huruf kapital pada huruf pertama kalimat kecuali kata benda khusus.
• Kata benda khusus seperti nama, nama jalan dan sebagainya. Harus ditulis dengan huruf kapital
dengan benar.
Secara umum, kami menggunakan huruf kapital pada nama, lokasi, merek, gelar, dan kata lain
orang tertentu yang harus benar secara tata bahasa:
: Ketua Menteri : Ketua Menteri
• FB dan IG adalah singkatan dari kata benda khusus, tulis saja apa adanya.
• Tidak semua istilah harus ditulis dengan huruf kapital, terutama jika digunakan sebagai referensi
umum daripada referensi khusus:
: tok guru di kampung / Tok Mat: : Tok Guru di desa :
ustaz itu / Ustaz Rafizi Guru itu
h) Kata-kata informal (sekarang kata-kata terkenal yang tidak ada dalam kamus) dan kata-kata yang tidak memiliki pengucapan
yang baku.
• Jika pengucapannya tidak baku tetapi kata yang sebenarnya masih dapat
diidentifikasi, transkrip kata yang sebenarnya. Jika tidak dapat diidentifikasi,
anggap itu sebagai kata yang tidak jelas dan potong bagiannya.
Sebagai contoh: : kah : Ka
: kena : Di Sini
: lah : La
: Pon
: permainan kata-kata
2. Jika kata yang tidak lengkap pengucapannya bisa ada dengan sendirinya, kita bisa mempertahankan
dan mentranskripnya.
Misalnya: "di bawah sinar mata" (seharusnya 'matahari'), harus ditranskripsikan "di bawah sinar mata".
• Di tengah-tengah:
1. Kata yang pengucapannya tidak lengkap tidak dapat berdiri sendiri, mengabaikan dan menyalin
sisanya.
Misalnya: "kamu ben membenciku", transkripsi yang benar adalah "kamu
membenciku".
2. Kata yang pengucapannya tidak lengkap mungkin ada dengan sendirinya, transkrip dari keseluruhan kalimat.
• Jika ada beberapa homofon dan semuanya memiliki arti yang sesuai dengan
kalimat deduksi default, Anda dapat menyalin sesuai pilihan Anda.
Itu Sebagai contoh. "Masih ada telur." Kedua kata ini sesuai dengan arti kalimat,
Anda bisa memilih salah satu.
* Pengecualian: kata ganti pendek harus digunakan dengan tanda hubung (-) dan
huruf kapital jika mengacu pada konteks agama:
m) Bahasa kasar, kalimat kasar, audio yang dipercepat, suara yang dihasilkan dari mesin
• Jika audio yang dipercepat dapat didengar dengan jelas, harap transkrip.
• Jika suara dihasilkan dari mesin seperti Siri dan Google, harap transkripsikan jika dapat didengar dengan jelas.
3.5 Referensi
Dewan Bahasa dan Pustaka: https://prpm.dbp.gov.my/