Anda di halaman 1dari 12

APLIKASI VOICE TO TEXT SEBAGAI SOLUSI WAWANCARA

BERFORMAT TXT

TUGAS AKHIR

Oleh :

HANIF ARKHAN AL ASYRAFI


19090020

PROGRAM STUDI DIV TEKNIK INFORMATIKA POLITEKNIK


HARAPAN BERSAMA TEGAL
2022
1. APLIKASI VOICE TO TEXT SEBAGAI SOLUSI
WAWANCARA BERFORMAT TXT

2. PENDAHULUAN
2.1 Latar Belakang Masalah
Wawancara atau interview merupakan kemampuan dasar
jurnalistik yang sangat penting. Wawancara merupakan kegiatan
komunikasi melalui proses pertukaran informasi antara reporter dan
narasumber. Berita yang baik adalah berita yang dihasilkan dari
sebuah penggalian informasi yang terampil. Oleh karena itu
dibutuhkan jurnalis yang harus benar-benar fokus dan memperhatikan
jawaban narasumbernya. Banyak wartawan yang pada saat
melakukan wawancara tidak mampu fokus dengan pernyataan yang
dikemukakan oleh narasumber yang disebabkan karena fokus
mencatat . Oleh karena permasalahan tersebut, dibutuhkan alat
perekam untuk merekam jawaban dari narasumber. Akan tetapi
menggunakan alat perekam membutuhkan waktu lagi untuk
mendengarkan hasil rekaman kemudian mencatatnya, padahal
wartawan dituntut untuk mengumpulkan berita sebanyak 3 sampai 4
dalam sehari.
Di dalam ilmu komputer terdapat bidang ilmu yang disebut
dengan Speech to Text. Speect to Text mengonversi teknis ke teks
yang mengambil input dari microphone dalam bentuk suara kemudian
dikonversi ke tulisan yang ditampilkan di desktop . Pengenalan suara
merupakan istilah ilmu komputer dan juga dikenal sebagai
pengenalan suara otomatis. Ini adalah fitur untuk mengubah suara
menjadi teks.
Salah satu keunggulan utama untuk layanan pengenalan suara
adalah pengurangan kesalahan ejaan kata-kata yang mungkin terjadi
oleh seseorang saat mengetik. Disisi lain, penerapan Speect to Text
akan sangat berguna bagi kaum disabilitas. Karena user atau
pengguna hanya perlu menggunakan suara untuk melakukan aktivitas
mengetik selayaknya orang normal pada umumnya. Keuntungan
keseluruhan adalah manajemen waktu. Kebanyakan orang dapat
berbicara lebih cepat daripada mereka melakukan pengetikan.
Dari permasalahan yang dialami oleh wartawan pada saat
mengolah hasil rekaman yang dituangkan dalam bentuk tulisan, maka
dibuatkan aplikasi yang bisa mengubah suara yang berasal dari
narasumber ke dalam suatu teks/tulisan. Dalam pembuatan aplikasi
penulis menggunakan bahasa pemrograman Python 3.8.1.
2.2 Rumusan Masalah
1. Bagaimana membangun aplikasi Web yang mampu mengubah
input suara dan merubah menjadi teks ?

2.3 Batasan Masalah


1. Aplikasi dibangun dengan menggunakan Python dan HTML
sebagai antarmuka.
2.4 Tujuan Dan Manfaat Penelitian
2.4.1. Tujuan Penelitian
1. Membangun aplikasi Web yang mampu mengubah suara
menjadi teks dan hasilnya berformat TXT.
2.4.2Manfaat Penelitian
1. Mempermudah pengguna membuat berita, atau merangkum sebuah
wawancara
2. Peneliti memperoleh pengetahuan baru mengenai studi kasus yang
di buat.
3. Tinjauan Pustaka
3.1. Penelitian Terdahulu
1. Penelitian oleh Supriyanta and Widodo (2017),
membuat Aplikasi Konversi Suara Ke Teks Berbasis
Android Menggunakan Google Speech API. Penelitian
tersebut memanfaatkan Google Speech API sebagai
media input suara. Aplikasi yang dikembangkan dapat
mengurangi kesalahan input pada bidang teks dan
merekam pembicaraan yang hasil rekamanya sudah
langsung berbentuk teks. Penelitian tersebut juga, dapat
menulis Short Messange Service (SMS) tanpa di ketik.
Melainkan dengan mengucapkan pesan pada smartphone
kemudian oleh server Google dikonversikan menjadi
teks. Aplikasi pada penelitian tersebut dapat berjalan
dengan maksimal jika terhubung dengan jaringan internet
yang baik.
2. Penelitian Oleh Wendy Liga,Erick Fernando,dan
Hendri (2017), Perancangan Aplikasi Komunikasi
Penyandang Tunarungu Berbasis Android. Penelitian
tersebut di utamakan untuk memudahkan penyandang
tunarungu untuk berkomunikasi dengan orang sekitar
tanpa menggunakan bahasa isyarat dan merepson balik
dengan Text to Speech.
3. Penelitian Oleh I Komang Setia Buana (2020),
Implementasi Aplikasi Speech to Text untuk
Memudahkan Wartawan Mencatat Wawancara dengan
Python. Yang berguna untuk membantu jurnalis merekap
jawaban narasumber dengan cepat.
4. Penelitian Oleh Ayushi Trivedi,Navya Pant, Pinal
Shah,Simran Sonik and Supriya Agrawal (2018), Pidato
ke teks dan teks ke sistem pengenalan untuk
menyampaikan dan memahami informasi yang benar,
menghindari salah kutipan.
5. Penelitian Oleh Denisya Umam Hasbyalloh, Primaadi
airlangga (2020), Aplikasi perpustakaan digital ini
merupakan wadah yang memudahkan penulis dalam
mempublish hasil karyanya.
4. Landasan Teori
4.1 Speech Recognition (Pengenalan Suara)
4.1.1 Produksi Suara
Suara diproduksi oleh organ vokal, sumber utama suara
adalah yaitu paru- paru dan diafragma. Ketika bersuara, udara

dilewatkan glottis yang berada di antara pita suara dan laring


menuju tiga rongga utama sistem vokal yaitu : pharynx, mulut
dan rongga nasal, yang kemudian keluar melalui mulut dan
hidung.
Gambar 1.1. Organ vokal di dalam tubuh manusia.

Bentuk “V” yang terbuka diantara glottis merupakan sumber


suara yang terpenting. Pita suara dapat bekerja dengan berbagai
cara saat bersuara. Fungsi utama pita suara adalah modulasi aliran
udara yang dengan sangat cepat membuka dan menutup rongga,
sehingga suara dapat dihasilkan. Faktor lain yang mempengaruhi
proses produksi suara adalah hidung dan mulut yang merupakan
tempat filtrasi suara. Gambar 1.1. merupakan gambar organ vokal
pada manusia.
4.1.2 Definisi Speech Recognition
Speech recognition atau voice recognition adalah
kemampuan sebuah mesin atau program untuk mengenali dan
menjalankan perintah suara. Secara umum speech recognition
melibatkan kemampuan untuk mencocokkan pola suara dengan
kosakata yang disediakan. Pada umumnya beberapa kosakata
telah disediakan dalam suatu produk, dan penggunanya bisa
menambahkan rekaman tambahan. Perangkat lunak yang lebih
canggih memiliki kemampuan untuk menerima bahasa natural
atau dialek (berbicara menggunakan cara bicara masing-masing
orang berdasarkan daerah tinggalnya).
Speech recognition adalah proses identifikasi suara
berdasarkan kata yang diucapkan dengan melakukan konversi
sebuah sinyal akuistik, yang ditangkap oleh audio device
(perangkat input suara). Speech Recognition juga merupakan
sistem yang digunakan untuk mengenali perintah kata dari suara
manusia dan kemudian diterjemahkan menjadi suatu data yang
dimengerti oleh computer. Tujuan dari speech recognition
system ialah mengonversi sinyal suara menjadi bentuk text
sesuai dengan kata yang diucapkan, tidak tergantung dari device
yang digunakan untuk merekam suara (Rabiner, 1989).
Pengenalan ucapan atau pengenalan wicara dalam istilah
bahasa inggrisnya, automatic speech recognition (ASR) adalah
suatu pengembangan teknik dan system yang memungkinkan
computer untuk menerima masukan berupa kata yang diucapkan.
Teknologi ini memungkinkan suatu perangkat untuk mengenali
dan memahami huruf- huruf yang diucapkan dengan cara
digitalisasi huruf dan mencocokkan sinyal digital tersebut dengan
suatu pola tertentu yang tersimpan dalam suatu perangkat. Huruf-
huruf yang diucapkan diubah bentuknya menjadi sinyal digital
dengan cara mengubah gelombang suara menjadi sekumpulan
angka atau huruf yang kemudian disesuaikan dengan kode-kode
tertentu untuk mengidentifikasi huruf-huruf tersebut. Hasil dari
identifikasi huruf yang diucapkan dapat ditampilkan dalam
bentuk tulisan atau dapat dibaca oleh peragkat teknologi sebagai
sebuah perintah untuk melakukan suatu pekerjaan (Jaya,
Puspitaningrum, & Susilo, 2016).
2.7.3. Definisi Python
“Apa itu Python? Python adalah bahasa pemrograman yang
sangat powerfull, serta sangat mudah dipelajari dan dibaca,
karena mendekati bahasa manusia. Python merupakan bahasa
pemrograman yang cukup diminati, terbukti Python berada di
urutan...”. Dari hasil pada Gambar 5, terlihat bahwa dari 32 kata
dengan durasi 20 detik, dapat menerjemah secara benar sebanyak
28 kata. Dari data tersebut, hasil dari aplikasi 87,5 % berhasil
diterjemahkan ke teks.
4.2 Metodologi Penelitian
Metodologi penelitian merupakan tahapan-tahapan yang
dilalui oleh peneliti dari perumusan masalah sampai kesimpulan,
yang membentuk sebuah alur hingga sistematis. Metodologi ini
digunakan sebagai pedoman peneliti dalam pelaksanaan penelitian ini
agar hasil yang dicapai tidak menyimpang dari tujuan. Metodologi
penelitian meliputi pengumpulan data hingga terbentuknya sebuah
perangkat lunak.
Perancangan sistem dalam penelitian ini dibagi menjadi dua
kegiatan yaitu pengambilan data dan pengolahan data. Pengambilan
data adalah hal yang dilakukan pertama kali, setelah itu data yang
sudah diambil diolah menggunakan aplikasi.
4.2.1 Pengambilan Data
Data didapat dari hasil rekaman suara orang atau
merekam suara berita dari Youtube dengan menggunakan
aplikasi handphone.
4.2.2 Pengolahan Data
Dalam melakukan pengolahan data, rekaman suara harus
sudah disiapkan terlebih dahulu. Sebenarnya aplikasi yang
dibuat bisa secara realtime mengubah suara ke teks dengan
menyiapkan microphone. Akan tetapi karena aplikasi berupa
desktop sehingga sangat menyusahkan kalau membawa
komputer atau laptop ke mana-mana, sehingga lebih efisien
hasil rekaman diolah langsung ke laptop.
4.2.3 Alat dan Bahan Penelitian
Software
Software adalah perangkat Lunak yang akan dibutuhkan dalam
pembuatan aplikasi. Perangkat keras yang digunakan pada
penelitian ini adalah sebagai berikut:
1. Python Versi 3.9
2. Visual Studio Code 1.67.2
Hardware
Hardware adalah perangkat keras yang akan dibutuhkan dalam
pembuatan aplikasi. Perangkat keras yang digunakan pada
penelitian ini adalah sebagai berikut:
1. Laptop Hp cm0075au
2. RAM 8GB
3. SSD 128GB

4.3 Jadwal Penelitian


Minggu Ke
No Uraian Kegiatan
1 2 3 4 5 6 7 8
1 Menyusun Proposal                
2 Pengajuan Proposal                
3 Observasi Objek                
Pengumpulan dan
4
analisa                
Prancangan dan
5
pembuatan aplikasi                
6 Implemantasi aplikasi                
7 Penyusunan laporan                

4.4 Daftar Pustaka


4.5 Lampiran
Gambar 1.2 Arsitektur Sistem

Gambar 1 memperlihatkan arsitektur sistem, di mana hasil rekaman


yang sudah didapat diproses oleh aplikasi Python.

Pengambilan data

Pengolahan data

Output

Gambar 1.3 Alur kerja sistem.


Tahap pengolahan merupakan tahap inti dari sistem yang akan
dirancang. Tahap pengolahan dibagi menjadi beberapa proses:
1. Tahap Ekstraksi Fitur
Ekstraksi Fitur adalah bagian terpenting dari pengenalan suara karena
ia memainkan peran penting untuk memisahkan satu ucapan dari
yang lain. Karena setiap suara memiliki karakteristik yang berbeda
yang tertanam dalam signal suara [5]. Untuk ekstraksi fitur dilakukan
perbaikan noise dengan menggunakan algoritma FastICA. FastICA
merupakan suatu algoritma yang ditujukan untuk melakukan proses
ekstraksi berdasarkan algoritma ICA. Metode ICA akan diterapkan
untuk memisahkan antara suara asli atau suara baik dengan suara
gangguan (noise), sehingga dapat diperoleh suara yang mempunyai
kualitas yang lebih bagus. File yang akan diperbaiki sudah tercampur
dengan noise, maka diasumsikan proses pencampuran file dengan
noise adalah untuk membuat sebuah variabel yang mempunyai nilai
BA (dominan noise). Prinsip ICA untuk memisahkan dua sumber
bunyi adalah dengan diketahui kedua variabel sumber tercampur AB
dan sumber tercampur BA. Dengan pencampuran dua sumber itu
maka variabel yang dibutuhkan sudah terpenuhi, sehingga persamaan
FastICA dapat dilakukan untuk mendapatkan nilai A dengan B. File
yang rusak pada mulanya mempunyai nilai AB dengan persamaan
ICA nilai B pada AB semakin direduksi sehingga didapatkan nilai A
yang hampir independent [6][7].
2. Tahap Deteksi Suara
Tahap deteksi suara menggunakan bahasa pemrograman Python
dengan menggunakan modul speech recognition. Untuk
menggunakan modul speech recognition, di dalam source code import
modul tersebut. Perintah awal yang diperlukan dalam speech
recognition adalah Recognizer(). Karena akan menggunakan suara
rekaman sehingga menggunakan method record() yang berada di
Recognizer(). Try & Except digunakan untuk deteksi error yang
terjadi pada saat proses deteksi suara.
3. Tahap Deteksi Bahasa
Pada tahap ini suara yang berasal dari narasumber dideteksi dan
hanya menggunakan bahasa Indonesia. Ketika menggunakan bahasa
Inggris atau bahasa lain, hasil tulisan yang didapat kurang sempurna
karena di dalam coding speech recognition sudah diset ke bahasa
Indonesia. Untuk melakukan deteksi bahasa harus terkoneksi internet
karena modul speech recognition terhubung dengan Google
SpeechRecognition dengan sintak recognize_Google (audio, language
= 'in').
4. Output
Output yang dihasilkan berupa tulisan yang akan digunakan oleh
wartawan untuk membuat berita.

Desain website
Tampilan pada halaman start (Gambar 1) memiliki beberapa tombol
yaitu Tombol daftaryang berfungsi untuk masuk ke halaman daftar
dan tombol login untuk masuk ke halaman login. Pada bagian navbar
terdapat menu jadwal rilis yang berfungsi untuk melihat informasi
tentang jadwal perilisan novel. Halaman berikutnya menampilkan
halaman daftar dimana terdapat form yang diisi dengan data
pengguna, seperti nama, username, email, dan password. Jika sudah
diisi penggunan dapat menekan tombol daftar dan akan muncul
sebuah notifikasi bahwa pendaftaran telah berhasil dan pengguna
dapat login. Halaman berikutnya menampilkan halaman login yang
terdapat 2 form yaitu email dan password, dihalaman ini pengguna
dibedakan menjadi 2 yaitu sebagai admin atau pembaca. Setelah
mengisi form pengguna dapat menekan tombol Home.

Halaman home (Gambar) menampilkan menu agar si pengakses dapat


langsung merekamkan suaranya yang akan di jadikan teks dengan
format txt.

Anda mungkin juga menyukai