Anda di halaman 1dari 10

Diterjemahkan dari bahasa Melayu ke bahasa Indonesia - www.onlinedoctranslator.

com

Aturan Transkripsi Melayu

Isi

1. Pengantar Panduan Platform .................................................. ................................................................... ............. 3

Keterangan ................................................. ........................................................ ........................................................ ..... 3

Pintasan keyboard: ............................................................ . ........................................................ . ........................................ 3


2. Alur kerja ............................................................. . ........................................................ . ........................................................ . .4
3. Pedoman Anotasi ............................................. . ........................................................ . ................................... 4
3.1 Buang: ............................................ ... ................................................................... ........................................ 4
3.2 Segmen: ............................................................... ........................................................ ................................................... 4

a) Tidak perlu memikirkan kesempurnaan kalimat saat memotong audio. ........................................................ ........... 4

b) Bagian dari area abu-abu tidak jelas. ........................................................ ................................................... 4

c) Bagian dari area abu-abu tumpang tindih (2 atau lebih pembicara berbicara secara bersamaan). ......................... 4

d) Bagian dari wilayah abu-abu adalah musik, melodi, lagu, suara binatang atau suara alam: 5

e) Jeda/gangguan di awal, tengah, dan akhir klip audio. ........................................................ ..5

f) Kata-kata kapital ................................................................... ........................................................ ........................................ 5

g) Bahasa Inggris dalam audio: ........................................ . ........................................................ . ........................ 6

h) Dialek (kata-kata bahasa lokal) dan Bahasa Asing: Tidak diperlukan transkrip dialek dan bahasa asing. ..... 7
3.3 Mentranskripsikan teks. ........................................................ ........................................................ ......................... 7

a) Spasi diperlukan di antara kata-kata. Jangan menggabungkan kata-kata. ........................................................ .......... 7

b) Hasil akhir audio harus mengandung setidaknya dua kata (≥2). .................................................. 7

c) Angka-angka dalam bahasa Arab harus ditranskripsikan ke dalam kata-kata Melayu. "1 satu". ............... 7

d) Tidak ada tanda baca dalam teks kecuali tanda hubung (-) dan koma atas (') .............................. ..... 7

e) Kata dan kalimat yang berulang harus ditranskripsikan sesuai dengan jumlah pengulangannya. .................................................. 8

f) Singkatan ............................................................... ........................................................ ........................................ 8

g) Huruf Kapital .................................................. ........................................................ ................................................... 8

h) Kata-kata informal (sekarang kata-kata terkenal yang tidak ada dalam kamus) dan kata-kata tanpa pengucapan

standar. ........................................................ ........................................................ ................................................... 8

Saya) Kata-kata dengan pengucapan yang tidak lengkap ................................................... . ........................................................ . .8

J) Homofon ................................................................... ........................................................ ................................................... 9

k) Singkatan kata/bahasa lisan .............................................. ........................................................ 9

l) Aksen lokal ................................................... ........................................................ ................................... 10


m) Bahasa kasar, kalimat kasar, audio yang dipercepat ........................................ ................................................... 10

n) Puisi perlu ditranskripsikan seperti biasa. ........................................................ ........................................................ ..... 10

o) Spasi ganda antar kata dapat diterima. ........................................................ ................................. 10

p) Kata-kata yang dieja ................................................. . ........................................................ . ................................... 10


3.4 Kata Khusus ............................................................... ........................................................ ................................................... 10
3.5 Referensi ................................................... ........................................................ ................................................... 10
1. Pengantar Panduan Platform
Potong bagian yang jelas dari ucapan manusia dari audio dan transkripsikan audio menjadi teks.

Keterangan
• Area abu-abu: audio dicegat secara default, kami HANYA diizinkan untuk mengubah area abu-abu
saja.

• Area biru: hasil segmentasi Anda, Anda juga perlu menyalin bagian ini ke dalam teks.

• Area putih: audio sebelum dan sesudah area abu-abu, tidak perlu transkrip atau/dan segmen
bagian ini, namun Anda dapat mendengarkannya untuk referensi.

• Klasifikasi audio:

kan Pidato (pidato) - suara manusia yang jelas


kan Membuang (buang) -audio tidak memenuhi persyaratan ASR.

• Kotak teks: teks transkrip dimasukkan di sini.

• Video: tidak digunakan dalam proyek ini.

Pintasan keyboard:
1 - melanjutkan pemutaran audio yang Anda tinggalkan.

2 - jeda.

3 - putar seluruh audio.

5 - putar audio default (area abu-abu)

a - putar audio yang dipotong (potong saat ini - bagian biru)

s - tempat klip audio dimulai.

e - tempat cuplikan audio berakhir.


2. Alur kerja
• Langkah 1. Dengarkan audio default (area abu-abu)

• Langkah 2. Pilih kelas audio (pidato atau membuang)

• Langkah 3-1. Jika Anda memilih klasifikasi'membuang ', lanjutkan untuk mengirimkan
tugas. Tidak dibutuhkan ubah teks di bawah ini.

• Langkah 3-2. Jika Anda memilih klasifikasi'pidato ', Anda perlu menentukan apakah audio harus
dipotong atau tidak. Kemudian, transkrip audio.

3. Pedoman Anotasi
3.1 Membuang (membuang)Itu
• Semua audio tidak dalam bahasa Melayu.

• Seluruh audio tidak jelas atau ucapan tidak terdengar.


• Seluruh audio adalah lagu dengan lirik di latar belakang atau ucapan
non-manusia, termasuk melodi, suara binatang, dan suara alam.
• Hanya ada satu kata Melayu.
• Seluruh audio menggunakan kata-kata kapital.

• Seluruh audio menggunakan dialek negara.

Catatan: Jika Anda memilih “membuang ", tidak perlu transkrip, hanya perlu menekan tombol “Kirimkan " dan
pergi ke audio berikutnya.

3.2 SegmenItu
a) Tidak perlu memikirkan kesempurnaan kalimat saat memotong audio.

b) Bagian dari area abu-abu tidak jelas.


• Segmen harus dimulai dengan kata yang jelas, jika kata tersebut tidak jelas di bagian depan
atau belakang, Anda perlu memotongnya.
• Jika kata tidak jelas di tengah pidato, Anda dapat memilih salah satu bagian yang jelas untuk
ditranskripsi.
Misalnya: "Jelaskan ucapan 1 + tidak jelas + Ucapan yang jelas 2" - apakah Anda memilih "Hapus ucapan
1" atau "Hapus ucapan 2", itu diterima sebagai segmen. Jangan menyalin keduanya sekaligus.

c) Bagian dari area abu-abu tumpang tindih (2 atau lebih pembicara berbicara secara bersamaan).
• Membuang: seluruh audio tumpang tindih, tidak dapat menentukan isi percakapan.
• Pangkas audio: membicarakan hal-hal yang berbeda secara bersamaan, tetapi tidak dapat
menentukan isi percakapan - harap potong bagian ini dan pertahankan bagian yang jelas
untuk transkripsi.

• Simpan dan transkrip:


- Bicara kalimat yang sama simultan dan kata terdengar jelas , Anda
perlu menyimpan bagian ini dan menyalinnya.
- Tidak berbicara pada saat yang sama , audio perlu dipertimbangkan sebagai
kasus pidato umum dan perlu ditranskripsikan;
- Hanya punya suara kunci dalam percakapan grup , suara lain
kelambatan dan kejelasan suara bicara pembicara utama tidak terganggu oleh suara
lain. Jadi, transkrip suara utama dan anggap suara lain sebagai kebisingan atau
kebisingan latar belakang.
- Jika 2 pembicara berbicara (kata-kata terpisah dan terdengar, tidak tumpang tindih) → transkrip
setiap kata yang dapat Anda dengar dari kedua pembicara. Jika Pembicara 2 berbicara dengan
lambat dan tidak dapat didengar dengan jelas, anggap sebagai bagian yang tidak jelas dan
harus dipotong. Menjaga bagian tidak jelas tetapi tidak melakukan transkripsi akan
menyebabkan kesalahan.

d) Bagian dari wilayah abu-abu adalah musik, melodi, lagu, suara binatang atau suara alam:
• Membuang:

- Jika seluruh audio adalah lagu atau suara non-manusia, seperti musik,
melodi, suara binatang serta suara alam dan sebagainya -
'Membuang' audionya.
- Jika pembicara bernyanyi sesuai dengan lagu dengan lirik (= 2 suara manusia) - 'Membuang'.
• Pangkas audio:
- Jika kebisingan latar belakang adalah lagu dengan lirik, 'Membuang'Seluruh audio
jika sulit untuk memotong audio.
- * * * TETAPI, jika kebisingan latar belakang tidak mengganggu kejelasan ucapan
pembicara, potong bagian ini dan jaga agar bagian ucapan manusia tetap jelas,
lalu transkripsikan ucapan tersebut (abaikan kebisingan latar belakang).
• Simpan dan Transkrip:
- Jika kebisingan latar belakang adalah melodi tanpa lirik dan ucapan manusia jelas,
dipertahankan, dan ditranskripsikan ke seluruh audio.
- Jika pembicara bernyanyi mengikuti melodi tanpa lirik, harap transkrip audio jika jelas.
e) Jeda/gangguan di awal, tengah, dan akhir klip audio.
- Jika suara mengganggu isi percakapan, potong bagian, simpan audio dalam
bahasa Melayu dan transkrip audio. Jika derau tidak mengganggu isi
- percakapan (tidak peduli berapa lama derau itu terjadi), abaikan saja, dan
transkrip seluruh audio.
ItuMisalnya: “Ucapan 1 + jeda/diam/suara ( bukan ucapan manusia dan bukan
memotong isi pembicaraan ) + Ucapan 2 ”. Transkrip “Pidato 1 + Pidato 2”.
ItuMisalnya: “Ucapan 1 + jeda/diam/suara ( mengganggu kejelasan isi percakapan ) +
Pidato 2”. Apakah "Ucapan 1" atau "Ucapan 2" diterima sebagai segmen, Anda dapat
memilih salah satunya. Tapi, jangan transkrip keduanya sekaligus.
* * Jika suara itu adalah ucapan manusia yang tidak jelas, Anda harus memotong bagian
itu (jangan diabaikan !!).

f) Kata kapital
• Kata-kata kapital yang tidak dapat dihitung
Baik di awal dan akhir atau di tengah, jangan transkrip dan potong bagiannya.

Itu Misalnya: "Pidato 1 + kata-kata kapital yang tak terhitung + Pidato 2". Apakah "Ucapan 1"
atau "Ucapan 2" diterima sebagai segmen, Anda dapat memilih salah satu yang lebih jelas
dari yang lain. Jangan menyalin keduanya sekaligus.
Itu Misalnya “kata kapital tak terhitung + Pidato 1”, simpan saja “Ucapan 1” dan transkripnya.
• Kata-kata kapital yang dapat
dihitung Di awal dan akhir:
Pidato yang dipilih harus dimulai (dan diakhiri) maksimal 2 kata kapital.
Itu Misalnya: Ada suara tawa (10 “ha”) di awal pidato, cukup
hanya mempertahankan sebagian suara tawa di audio (sekitar 2 “ha ha”
di audio).
Di tengah-tengah:
Jika kamu bisa menghitung jumlah kata kapital, Anda memerlukan transkrip berdasarkan
jumlah itu. *** Seperti biasa, semua kata kapital harus dipisahkan dalam transkripsi jika
diulang.

Itu Untuk kata-kata kapital yang berulang, transkrip dengan jumlah yang sama terdengar

seperti pada audionya. Misalnya: 3 "ha" di tengah audio, Anda memerlukan


transkrip "ha ha ha" di kotak teks.
g) Bahasa Inggris dalam audio:
Kata bahasa Inggris di awal dan akhir audio:

• “Bahasa Inggris + Bahasa Melayu” atau “Melayu + Bahasa Inggris” atau “Bahasa
Inggris + Bahasa Melayu + Bahasa Inggris”
- - - - Segmen dan transkrip bagian Melayu. Untuk proyek ASR, menulis transkrip bahasa
Inggris dapat diterima, asalkan jumlah kata tidak boleh lebih dari atau sama dengan tiga
kata dan kata tidak terletak di awal dan akhir audio.
Itu Misalnya: Jika Anda mendengar kalimat:- "Aku mencintaimu, Jenny aku bersumpah", potong bagian bahasa
Inggris dan transkrip "Jenny aku bersumpah".

Kata bahasa Inggris di tengah audio:

• “Melayu + Inggris + Melayu”


Bagian bahasa Inggris 3 kata, segmen dan transkrip “Melayu 1 + Bahasa Inggris +
Bahasa Melayu 2”. Bagian bahasa Inggris harus ditranskripsikan sesuai dengan
ejaan dalam bahasa Inggris.
Itu Misalnya: "jalan satu dua tiga habis", simpan dan transkrip (transkrip jika Anda
benar-benar yakin, potong bagian itu jika Anda tidak yakin dengan ejaannya).
Bagian Bahasa Inggris kan3 kata, Pilih hanya Segmen “Bahasa Melayu 1”
atau “Bahasa Melayu 2”
Itu Misalnya: "jalan satu dua tiga empat habis", potong bagian bahasa Inggris dan transkrip
bagian bahasa Melayu yang dipilih saja.

Tolong hati-hati:
1. Semua kata bahasa Inggris harus mengikuti ejaan Inggris seperti yang dipraktikkan di Malaysia:
: warna : warna
2. Jika sebuah kata memiliki pengucapan yang sama dalam bahasa Melayu dan bahasa Inggris, harap
ditranskripsikan menurut ejaan bahasa Melayu:
: baterai : baterai:
hai : Hai
: ukuran : ukuran
: dengan serius :
serius : iya: Tipe
3. Dalam situasi di mana kata dalam bahasa Inggris digabungkan dengan sufiks bahasa Melayu, harap
transkripsikan kata tersebut seperti biasa dalam bahasa Melayu.
Contoh: saya + lapor = lapor
h) Dialek (kata-kata dari bahasa daerah lain) dan bahasa asing: Tidak diperlukan transkrip dialek dan bahasa asing.

Dialek/bahasa asing di awal dan akhir audio:


• “Dialek/Bahasa Asing + Melayu” atau “Melayu + Dialek/Bahasa Asing” atau
“Dialek/Bahasa Asing + Melayu + Dialek/Bahasa Asing”
---- Segmen dan transkrip bagian Melayu.
Dialek/bahasa asing di tengah audio:
• “Melayu A + Dialek/Bahasa Asing + Melayu B”
- - - - Segmen hanya “Bahasa Melayu A” atau “Bahasa Melayu B” dan transkrip

* * * Bahasa Indonesia

Kami memahami bahwa Bahasa Indonesia sangat mirip dengan Bahasa Malaysia/
Melayu, karena keduanya berasal dari rumpun bahasa Austronesia.
Secara umum, kami tidak menganjurkan transkrip bahasa Indonesia .

3.3 Teks Transkripsi.


a) Spasi diperlukan di antara kata-kata. Jangan gabungkan kata-kata.
b) Hasil akhir audio harus mengandung setidaknya dua kata (≥2).
Setidaknya harus ada 1 kata yang bermakna dalam bahasa Melayu (bukan kata kapital).
c) Angka-angka dalam bahasa Arab harus ditranskripsikan ke dalam kata-kata Melayu. “1 satu ".
1. Diizinkan: Bahasa Arab yang umum digunakan

• Allah Taala / Allah Subhanahuwataala


• Almarhum
• assalamualaikum
• bismillah
• bismillahirrahmanirrahim
• insya Allah
• waalaikummusalam
• warahmatullahi wabarakatuh

* * * Kami
hanya menerima jika ejaan transkrip sama dengan yang tercantum (termasuk penggunaan
huruf besar/kecil). Jika ejaannya berbeda dari daftar, itu akan dianggap salah mengeja.

2. Tidak diperbolehkan : Kutipan ayat-ayat suci umat Islam (al-Quran/al-Hadits)

Mengutip kitab suci seperti membaca harus dianggap sebagai bahasa asing, mengingat ayat-ayat
tersebut aslinya dalam bahasa Arab.

d) Tidak ada tanda baca dalam teks kecuali tanda hubung (-) dan koma atas (').
1. Kata ganda harus ditulis dengan tanda penghubung

(-):: cucu : cucu


: paru-paru : paru paru
: kerabat : kerabat: tiba-tiba
: tiba-tiba
2. Prinsip yang sama digunakan jika kata benda khusus diulang sebagai kata ganda:

Misalnya: “Saya tidak melihat Honda-Honda ini "

* * * Pastikan
hanya menggunakan tanda hubung (-) jika penggunaan kata rangkap terlihat jelas dalam konteks kalimat.
Jika kata yang sama diulang beberapa kali tetapi tidak mengandung arti kata rangkap, maka kita hanya perlu menyalin
kata tersebut tanpa harus membubuhkan tanda hubung (-).

e) Kata dan kalimat yang berulang perlu ditranskripsikan berdasarkan jumlah pengulangannya.

f) Singkatan
• Singkatan untuk frase seperti gws, otw, btw, imo, lol, dll (cepat sembuh, dalam perjalanan, omong-omong, menurut
saya, tertawa terbahak-bahak, dll), singkatan ini harus ditranskripsi dalam huruf kecil.
g) Huruf kapital
• Jangan menggunakan huruf kapital pada huruf pertama kalimat kecuali kata benda khusus.

• Kata benda khusus seperti nama, nama jalan dan sebagainya. Harus ditulis dengan huruf kapital
dengan benar.
Secara umum, kami menggunakan huruf kapital pada nama, lokasi, merek, gelar, dan kata lain
orang tertentu yang harus benar secara tata bahasa:
: Ketua Menteri : Ketua Menteri

• FB dan IG adalah singkatan dari kata benda khusus, tulis saja apa adanya.

• Tidak semua istilah harus ditulis dengan huruf kapital, terutama jika digunakan sebagai referensi
umum daripada referensi khusus:
: tok guru di kampung / Tok Mat: : Tok Guru di desa :
ustaz itu / Ustaz Rafizi Guru itu

h) Kata-kata informal (sekarang kata-kata terkenal yang tidak ada dalam kamus) dan kata-kata yang tidak memiliki pengucapan
yang baku.

• Kata-kata informal yang umum digunakan dapat ditranskripsikan saat didengar.


• Kata-kata yang tidak ada tidak dapat diterima. Hanya kata-kata standar dan kata-kata
informal yang umum digunakan yang dapat diterima dalam transkripsi.

• Jika pengucapannya tidak baku tetapi kata yang sebenarnya masih dapat
diidentifikasi, transkrip kata yang sebenarnya. Jika tidak dapat diidentifikasi,
anggap itu sebagai kata yang tidak jelas dan potong bagiannya.
Sebagai contoh: : kah : Ka
: kena : Di Sini
: lah : La
: Pon
: permainan kata-kata

i) Kata-kata dengan pengucapan yang tidak lengkap:

• Di awal atau akhir:


1. Jika sebuah kata yang pengucapannya tidak lengkap tidak dapat berdiri sendiri, kita perlu memotong
bagian itu.
Misalnya: "Saya terus ber", perlu memotong "ber" dan transkrip "Saya melanjutkan".

2. Jika kata yang tidak lengkap pengucapannya bisa ada dengan sendirinya, kita bisa mempertahankan
dan mentranskripnya.

Misalnya: "di bawah sinar mata" (seharusnya 'matahari'), harus ditranskripsikan "di bawah sinar mata".
• Di tengah-tengah:

1. Kata yang pengucapannya tidak lengkap tidak dapat berdiri sendiri, mengabaikan dan menyalin
sisanya.
Misalnya: "kamu ben membenciku", transkripsi yang benar adalah "kamu
membenciku".

2. Kata yang pengucapannya tidak lengkap mungkin ada dengan sendirinya, transkrip dari keseluruhan kalimat.

Misalnya: "di bawah mata mentari yang bersinar"


j) Homofon:
• Dengarkan cuplikan default untuk memahami konteks seluruh kalimat, transkripsikan
kata yang benar berdasarkan konteks itu.
Itu Misalnya: massa/waktu, Anda dapat mendengar "isu bullying yang diperdebatkan dengan
hangat di media massa" di audio, jadi kita perlu mentranskripsikan kata tersebut sebagai "massa"
berdasarkan konteks kalimatnya.

• Jika ada beberapa homofon dan semuanya memiliki arti yang sesuai dengan
kalimat deduksi default, Anda dapat menyalin sesuai pilihan Anda.
Itu Sebagai contoh. "Masih ada telur." Kedua kata ini sesuai dengan arti kalimat,
Anda bisa memilih salah satu.

k) Singkatan kata/bahasa lisan


• Transkrip bentuk kata yang diucapkan oleh pembicara. Transkrip apa yang
Anda dengar, jangan perbaiki kesalahan tata bahasa.
Itu Sebagai contoh: "Saya akan melakukan beberapa olahraga”. Berdasarkan audio, Anda harus transkrip sebagai "akan",

tidak dapat ditranskripsikan sebagai"pergi ke”

Kata ganti pendek: -ku, -mu, -nya


* Secara umum, kata ganti pendek harus digabungkan dengan kata-kata yang
datang sebelum atau sesudah:

saya: hatiku, milikku, bisikanku, aku mengerti, aku ingin, aku

memelukmu: untukmu, untukmu, pikiranmu

dia: kecepatannya, harganya, rumahnya

* Pengecualian: kata ganti pendek harus digunakan dengan tanda hubung (-) dan
huruf kapital jika mengacu pada konteks agama:

My : Hambaku, Bumiku, Pahalaku Kau:

Hambamu, untukmu, Nabimu Nya:

Izin-Nya, Kehendak-Nya, sisi-Nya

Partikel -lah, -kah, -tah


* Secara umum, partikel -lah, -kah, atau -tah harus digabungkan dengan kata
yang mendahuluinya:
kah : kenapa, gimana : biasa
aja, biarin : apalagi
* Pengecualian: partikel dapat dipisahkan dari kata sebelumnya, jika kata
sebelumnya merupakan kata yang umum digunakan dalam percakapan
sehari-hari:
pergi: pi lah
hanya: je lah
l) Aksen lokal
Kata-kata aksen perlu ditranskripsikan ke dalam bahasa Melayu standar.

m) Bahasa kasar, kalimat kasar, audio yang dipercepat, suara yang dihasilkan dari mesin

• Baik bahasa kasar dan kalimat kasar perlu ditranskripsikan.

• Jika audio yang dipercepat dapat didengar dengan jelas, harap transkrip.
• Jika suara dihasilkan dari mesin seperti Siri dan Google, harap transkripsikan jika dapat didengar dengan jelas.

n) Puisi perlu ditranskripsikan seperti biasa.

o) Spasi ganda antar kata dapat diterima.


p) Kata-kata yang dieja
Ketika seseorang mengeja kata huruf demi huruf, sangat penting bagi Anda untuk memastikan setiap
huruf ditulis dengan huruf kapital dan pisahkan huruf dengan spasi.
Misalnya: Jika seseorang mengeja TikTok huruf demi huruf, Anda harus menuliskannya sebagai
TIKTOK

3.4 Kata Khusus


Silakan merujuk ke spreadsheet "istilah & penyelarasan kebijakan" (FAQ).

3.5 Referensi
Dewan Bahasa dan Pustaka: https://prpm.dbp.gov.my/

Anda mungkin juga menyukai