Anda di halaman 1dari 5

Berdasarkan data World Health Organization (WHO), pada tahun 2021

diperkirakan terdapat sekitar sekitar 5.5% persen penduduk dunia atau sekitar
466 juta orang mengalami gangguan pendengaran
Di indonesia sendiri fasilitas atau infrastruktur untuk penyandang disabilitas
masih belum memadai, Penyandang disabilitas rungu dapat terkena risiko yang
dapat membahayakan nyawa mereka akibat gagal mengenali sinyal suara yang
menyiratkan situasi berbahaya
Pada penelitian ini mengusulkan suatu sistem yang mampu mengenali dan
mengklasifikasikan jenis suara alarm yang dapat membahayakan bagi
penyandang tunarungu. Jenis suara alarm berbahaya yang menjadi dataset adalah
alarm kebakaran, alarm evakuasi dan alarm bencana alam. Model yang dibuat
akan diimplementasikan pada sebuah device seperti Raspberry Pi sehingga dapat
mengenali suara alarm yang telah disebutkan sebelumnya dan mengkonversi
informasi tersebut dalam visual berupa lampu indikator.
Dataset tersebut akan dilatih menggunakan deep neural network dengan
algoritma CNN (Convolutional Neural Network) dan STFT (short time fourier
transform) sebagai ekstraksi fitur.

1. Klasifikasi suara jantung menggunakan convolutional neural network Li,


Fan. Dkk (2020).
Pada penelitian ini membahas mengenai Bunyi jantung memainkan peran
penting dalam diagnosis kondisi jantung. Karena rasio signal-to-noise (SNR)
yang rendah, bermasalah dan memakan waktu bagi para ahli untuk membedakan
berbagai jenis suara jantung.
Auskultasi adalah cara utama dimana dokter mendengarkan suara jantung. Hasil
auskultasi kemudian digunakan oleh dokter untuk mendeteksi penyakit jantung.
Proses ini subjektif, memakan waktu dan membutuhkan pelatihan dan
pengalaman yang luas dalam auskultasi [5]. Oleh karena itu, perlu
dikembangkan suatu metode untuk klasifikasi otomatis bunyi jantung.
Dalam penelitian ini, menggabungkan metode rekayasa fitur konvensional
dengan algoritma deep learning untuk mengklasifikasikan suara jantung normal
dan abnormal secara otomatis. Pertama, 497 fitur diekstraksi dari delapan
domain.
Metode yang digunakan CNN
Dataset:
Rekaman PCG sebanyak 3153 dari PhsioNet Computing
Hasil : Akurasi rata-rata, sensitivitas, spesifisitas dan koefisien korelasi
Matthews yang diamati pada kumpulan data PhysioNet/CinC Challenge 2016
masing-masing adalah 86,8%, 87%, 86,6% dan 72,1%.

2. Klasifikasi suara paru normal dan abnormal menggunakan deep neural


network dan support vector machine. Adnan Hassal Falah dan Jondri
(2019)
Penyakit pernapasan masih menjadi pembunuh tertinggi setelah stroke dan
penyakit jantung, hal ini disebabkan teknik diagnosis yang masih terbatas pada
auskultasi. Melalui auskultasi ditemukan bahwa paru-paru memiliki suara yang
berbeda-beda, sesuai dengan kondisi kesehatan seseorang.
pada penelitian ini menggunakan salah satu arsitektur Deep Neural Network
yaitu Autoencoder sebagai metode ekstraksi ciri yang akan diuji menggunakan
Support vector machine (SVM).
Metode: DNN dan SVM
Dataset: Total data yang digunakan 68 suara, terdiri dari 21 suara normal, 12
wheeze, dan 35 crackle.
Hasil : Dari dua macam pengujian, sistem klasifikasi AE-SVM berhasil
mencapai akurasi sebesar 82,38%.

3. Klasifikasi jenis burung berdasarkan suara burung berbasis Deep


Learning. Muhammad Fakhri Ali (2020)
Jenis burung biasa dikenali dengan melihat secara fisik burung. Untuk
mengenali jenis burung melalui suara kicaunya tidak mudah, karena jenis
burung yang beragam. Namun seiring dengan berkembangnya zaman, teknologi
pun semakin berkembang dan canggih yang kemudian dapat membantu
memudahkan para pecinta burung dalam membedakan jenis-jenis burung
melalui suara kicaunya.
Penelitian ini menggunakan metode deep learning, STFT (Short Time Fourier
Transform) untuk ektraksi ciri dan CNN untuk training dataset.
Metode: CNN dan STFT
Dataset: 1000 dataset dari 4 Jenis Burung yaitu burung cendet, kenari, burung
sirpu dan burung trucuk
Hasil: Hasil training menampilkan akurasi sebesar 99% dan akurasi testing data
sebesar 92.5%

4. Klasifikasi suara binatang menggunakan CNN (Convolutional Neural


Network). Neha Singh (2020).
Tujuan dari penelitian ini adalah untuk mengklasifikasikan kumpulan data
suara hewan menggunakan pola gambar (mel-spektogram yang dihasilkan dari
fitur audio) dan training data menggunakan algoritma CNN.
Metode: CNN
Dataset: 4500 Suara binatang dari berbagai spesies
Hasil : Akurasi yang didapatkan mencapai 98%.

5. Perangkat Portabel Berbasis Deep Learning untuk Pengenalan Sinyal


Audio Distress di Daerah Perkotaan. Jorge Felipe Gaviria (2020)
Penelitian ini mengusulkan implementasi untuk mendeteksi dan mengklasifikasi
sinyal suara distress (meminta pertolongan) di daerah perkotaan dengan
menggunakan metode CNN. Dimana kontribusi penelitian ini ada dua hal:
1. merancang alat yang secara akurat dapat mengenali suara bising di perkotaan
2. perangkat portable yang dirancang berbiaya rendah
Metode : CNN
Dataset: dataset yang digunakan adalah suara teriakan (Shout Noise), suara
meminta pertolongan (Help Noise), suara aid Noise dan bakcground noise.
Menggunakan hampir 25 ribu data suara.
Hasil: database suara di latih menggunakan CNN 2D multiheaded untuk
memproses fitur temporal dan frekuensi. Lalu model yang dibuat diterapkan pada
sebuah Raspberry Pi dengan menggunakan mikrofon untuk pengenalan secara
real-time. Dengan keakuratan BN mencapai 96%, SN 79%, HN 84% dan AN
76%
1. Pengumpulan Dataset
Pada tahap ini, dataset akan dikumpulkan kemudian akan dilakukan pra-
pemrosesan. Data dikumpulkan melalui unduhan dari internet, video
youtube berhubungan dengan suara alarm. Dataset suara yang digunakan
durasinya adalah 3 detik. Suara alarm yang dikumpulkan dibagi ke dalam
tiga kelas adalah:
a) Alarm kebakaran
b) Alarm bencana alam
c) Alarm evakuasi
2. Pra-Pemrosesan
Pada tahap ini, pra-pemrosesan dilakukan untuk memastikan konsistensi di
seluruh kumpulan data. Sebelum dataset dilakukan ekstraksi fitur, data
yang telah dikumpulkan dilakukan konversi ke dalam bentuk file .wav. dari
inspeksi bentuk gelombang audio seperti pada gambar 3.2 akan sulit untuk
memvisualisasikan perbedaan di beberapa kelas, khususnya bentuk
gelombang untuk suara berulang seperti pada alarm kebakaran dan alarm
bencana karena bentuknya serupa. Dataset memiliki berbagai properti
audio yang bervariasi dan memerlukan standarisasi sebelum dapat
digunakan untuk melatih model yang dibuat. Properti audio berikut yang
digunakan dalam dalam prapemrosesan untuk memastikan konsistensi
diseluruh kumpulan data:
• Audio Channels
• Sample rate
• Bit-depth

3. Ekstraksi fitur
Langkah berikutnya adalah mengekstrak fitur yang diperlukan untuk
melatih model yang akan dibuat. Untuk melakukan ini, perlu untuk
membuat representasi visual dari setiap sampel audio yang memungkinkan
mengidentifikasi fitur untuk klasifikasi. Spektogram adalah teknik yang
berguna untuk mevisualisasikan spektrum frekuensi suara yang bervariasi
selama periode waktu yang singkat.
4. Training data
Pada tahap ini, dataset yang telah melalui fitur ekstraksi dan mendapatkan
spectogram dari masing-masing data masukan, kemudian dilakukan proses
training data menggunakan Deep Neural Network.
5. Klasifikasi
Pada tahap ini, hasil training data berupa prediksi ke akuratan klasifikasi
dan prediksi error dari sistem yang telah dibuat.
6. Deploy Model
Setelah model berhasil dibuat, maka akan di deploy pada sebuah single
board computer atau ke komputer mini. Untuk dilakukan pengetesan
terhadap suara secara real-time. Gambar 3.3 menunjukkan diagram alir
dari deploy model. Dimana saat sistem mampu mengenali suara alarm,
akan menampilkan alert berupa lampu sesuai dengan suara alarm yang
berhasil dikenali.

Anda mungkin juga menyukai