Mengi en Id

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.
com
sensor
Artikel
Klasifikasi Wheezing Monophonic dan Polyphonic Berdasarkan

Faktorisasi Matriks Non-Negatif Peringkat Rendah Terkendala
Juan De La Torre Cruz 1,* , Francisco Jesús Cañadas Quesada 1 , Nicolás Ruiz Reyes 1 ,
Sebastian García Galán 1 , Julio José Carabias Orti 1 dan Gerardo Perez Chica 2
1 Departemen Teknik Telekomunikasi, Universitas Jaen, Campus Cientifico-Tecnologico de Linares, Avda.

de la Universidad, s/n, Linares, 23700 Jaen, Spanyol; fcanadas@ujaen.es (FJCQ); nicolas@ujaen.es
(NRR); sgal an@ujaen.es (SGG); carabias@ujaen.es (JJCO)
2 Unit Manajemen Klinis Pneumologi Rumah Sakit Universitas Jaen, Av. del Ejercito Espanol, 10, 23007
Jaen, Spanyol; gerardo.perez.sspa@juntadeandalucia.es
* Korespondensi: jtorre@ujaen.es
Abstrak: Munculnya suara mengi secara luas dianggap oleh dokter sebagai indikator kunci untuk mendeteksi gangguan paru dini atau bahkan tingkat keparahan yang
terkait dengan penyakit pernapasan, seperti yang terjadi pada kasus asma dan penyakit paru obstruktif kronik. Dari sudut pandang dokter, klasifikasi mengi monofonik
dan polifonik masih merupakan topik yang menantang dalam pemrosesan sinyal biomedis karena kedua jenis mengi bersifat sinusoidal. Tidak seperti kebanyakan
algoritma klasifikasi di mana gangguan yang disebabkan oleh suara pernapasan normal tidak ditangani secara mendalam, kontribusi pertama kami mengusulkan
pendekatan Faktorisasi Matriks Non-negatif Tingkat Rendah (CL-RNMF) yang baru, tidak pernah diterapkan pada klasifikasi mengi. sepengetahuan penulis, yang
menggabungkan beberapa kendala (kekurangan dan kehalusan) dan konfigurasi tingkat rendah untuk mengekstrak konten spektral mengi, meminimalkan gangguan
----
akustik dari suara pernapasan normal. Kontribusi kedua secara otomatis menganalisis struktur harmonik dari distribusi energi yang terkait dengan perkiraan
---
spektogram mengi untuk mengklasifikasikan jenis mengi. Hasil eksperimen melaporkan bahwa: (i) metode yang diusulkan mengungguli metode klasifikasi mengi yang
Kutipan: De La Torre Cruz, J.; Kanada
paling mutakhir dan relevan dengan akurasi sekitar 8%; (ii) tidak seperti metode mutakhir berdasarkan pengklasifikasi, metode yang diusulkan menggunakan
Quesada, FJ; Ruiz Reyes, N.; Garcia
pendekatan tanpa pengawasan yang tidak memerlukan pelatihan apa pun. Kontribusi kedua secara otomatis menganalisis struktur harmonik dari distribusi energi
Galan, S.; Carabias Orti, JJ; Peréz Chica,
yang terkait dengan perkiraan spektogram mengi untuk mengklasifikasikan jenis mengi. Hasil eksperimen melaporkan bahwa: (i) metode yang diusulkan mengungguli
G. Klasifikasi Wheezing Monophonic
metode klasifikasi mengi yang paling mutakhir dan relevan dengan akurasi sekitar 8%; (ii) tidak seperti metode mutakhir berdasarkan pengklasifikasi, metode yang
dan Polyphonic Berdasarkan
Faktorisasi Matriks Non-Negatif diusulkan menggunakan pendekatan tanpa pengawasan yang tidak memerlukan pelatihan apa pun. Kontribusi kedua secara otomatis menganalisis struktur harmonik
Peringkat Rendah Terkendala.Sensor dari distribusi energi yang terkait dengan perkiraan spektogram mengi untuk mengklasifikasikan jenis mengi. Hasil eksperimen melaporkan bahwa: (i) metode yang
2021, 21, 1661. https://doi. org/ diusulkan mengungguli metode klasifikasi mengi yang paling mutakhir dan relevan dengan akurasi sekitar 8%; (ii) tidak seperti metode mutakhir berdasarkan
10.3390/s21051661 pengklasifikasi, metode yang diusulkan menggunakan pendekatan tanpa pengawasan yang tidak memerlukan pelatihan apa pun.
Editor Akademik: Carlos Gómez dan Kata kunci: monofonik; polifonik; mengi; faktorisasi matriks non-negatif; pola spektral;
Raúl Alcaraz
spektogram; paksaan; peringkat rendah; asma; penyakit paru obstruktif kronis
Diterima: 25 Januari 2021

Diterima: 22 Februari 2021
Diterbitkan: 28 Februari 2021
1. Perkenalan
Catatan Penerbit: MDPI tetap netral

Penyakit Pernafasan Kronis (PJK) semakin menjadi masalah kesehatan masyarakat yang besar
sehubungan dengan klaim yurisdiksi
dan berkembang karena prevalensinya yang tinggi, morbiditas dan mortalitas yang tinggi, dan
dalam peta yang diterbitkan dan afiliasi biaya sosial ekonomi. CRD dapat didefinisikan sebagai gangguan saluran udara dan struktur
institusional. fisiologis lain dari sistem pernapasan.1]. Beberapa CRD yang paling umum dan relevan adalah
asma dan Penyakit Paru Obstruktif Kronik (PPOK). Menurut World Health Organization (WHO),
pada tahun 2016 terdapat 417.918 kematian akibat asma di tingkat global.2] dan sekitar tiga juta
orang meninggal karena PPOK setiap tahun, yang merupakan 6% dari semua kematian di seluruh
dunia [3]. Meskipun penyakit kronis saat ini tidak memiliki obat medis, deteksi dini dapat
Hak cipta: © 2021 oleh penulis.
mengarah pada pengobatan yang tepat ketika penyakit ini dalam tahap awal, sehingga
Penerima Lisensi MDPI, Basel, Swiss.
Artikel ini adalah artikel akses terbuka
meningkatkan kualitas hidup masyarakat.
yang didistribusikan di bawah syarat Pemeriksaan auskultasi dianggap sebagai metode yang banyak digunakan untuk mendeteksi
dan ketentuan lisensi Creative CRD karena merupakan metode non-invasif, murah, mudah, nyaman, dan cepat tanpa
Commons Attribution (CC BY) (https:// memandang usia.4]. Namun, proses auskultasi memiliki beberapa keterbatasan yang mengurangi
creativecommons.org/licenses/by/ keandalan diagnosis: (i) subjektivitas tinggi yang dikondisikan oleh pelatihan dokter untuk
4.0/). mengenali dan menafsirkan suara yang ditangkap oleh stetoskop [5,6]; (ii) diskriminasi antara
Sensor 2021, 21, 1661. https://doi.org/10.3390/s21051661 https://www.mdpi.com/journal/sensors

Sensor 2021, 21, 1661 2 dari 23
suara tambahan dengan karakteristik serupa, seperti suara mengi monofonik dan polifonik, adalah
tugas yang lebih sulit untuk dilakukan melalui auskultasi [7]; dan (iii) suara pernapasan normal dan suara
tambahan (abnormal dan menunjukkan gangguan paru-paru) secara bersamaan bercampur dalam
domain waktu dan frekuensi, memperumit analisis dokter tentang informasi klinis berharga yang
terkandung dalam suara tambahan [5,8,9]. Mengingat hal di atas, kesalahan diagnosis adalah penyebab
utama pasien kembali ke Puskesmas dengan memburuknya penyakit yang tidak terdeteksi pada
pemeriksaan medis pertama yang dilakukan dengan auskultasi, sehingga dalam beberapa tahun
terakhir, menjadi penting untuk mengembangkan pendekatan baru. untuk membantu dokter
memberikan diagnosis andal yang diterapkan pada gangguan paru-paru, dengan fakta implisit
mengurangi biaya perawatan kesehatan [10,11].
Secara umum, suara yang dihasilkan selama bernafas dapat diklasifikasikan menjadi
dua kategori utama: suara pernapasan normal dan suara tambahan. Kedua suara tersebut
bercampur dalam domain waktu-frekuensi karena keduanya dihasilkan secara bersamaan
oleh aliran udara yang sama melalui cabang bronkial paru-paru dan juga berbagi bagian dari
pita spektral di mana mereka aktif [5,9]. Suara pernapasan normal diwakili oleh spektrum
pita lebar di mana sebagian besar energi terkonsentrasi pada pita frekuensi 60 Hz-1000 Hz [
12]. Suara adventif dapat diklasifikasikan menjadi dua kategori: suara terputus-putus dan
suara kontinu. Discontinuous Adventitious Sounds (DAS) dicirikan oleh durasi pendek kurang
dari 25 ms, seperti crackles kasar dan halus [13]. Continuous Adventitious Sounds (CASs)
dicirikan oleh durasi panjang lebih dari 100 ms, seperti ronki, stridor, dan mengi.14]. Dalam
beberapa tahun terakhir, beberapa karya telah diterbitkan yang melakukan tinjauan lengkap
pengukuran akustik paru-paru [15] dan metode pemrosesan sinyal [16,17] diterapkan pada
suara tambahan, sebagian besar berfokus pada deteksi [16-23] dan tugas klasifikasi [16,17,24
-29].
Berfokus pada suara mengi atau mengi, pedoman yang ditetapkan oleh Computerized
Respiratory Sound Analysis (CORSA) [5,30] mendefinisikannya sebagai nada yang terletak antara
100 Hz dan 1000 Hz yang durasinya lebih besar dari 100 ms, menampilkan lintasan puncak
spektral pita sempit dari waktu ke waktu. Munculnya mengi secara luas dianggap oleh dokter
sebagai petunjuk untuk dapat mendeteksi penyakit pernapasan atau tingkat keparahan yang
terkait dengan CRD secara dini, seperti yang terjadi pada kasus asma dan PPOK [31,32]. Untuk
alasan ini, banyak upaya penelitian telah diterapkan dalam pemrosesan sinyal biomedis untuk
mengembangkan metode yang dapat diandalkan untuk deteksi dini mengi. Dalam pengertian ini,
banyak algoritma deteksi mengi, berdasarkan pendekatan yang berbeda, dapat ditemukan dalam
literatur mutakhir: model Autoregressive (AR) [33], pemodelan pendengaran [34], entropi [35],
Jaringan Syaraf Tiruan (NN) [36,37], transformasi gelombang [38,39], indeks nada [40,41], Mel-
Frequency Cepstral Coefficients (MFCCs) [42,43], Model Campuran Gaussian (GMM) [44,45],
identifikasi puncak spektral [46-48], Model Markov Tersembunyi (HMM) [49], dan baru-baru ini,
Faktorisasi Matriks Non-negatif (NMF) [9,50,51].
Selain itu, mengi dapat diklasifikasikan menjadi dua kategori utama sesuai dengan perilaku
spektral.52]: (i) mengi yang terjadi dengan satu puncak atau dengan harmonik yang terkait
dengan puncak basal tunggal itu disebut mengi Monophonic (MP) (seperti dapat dilihat pada
Gambar). 1); dan (ii) mengi yang terjadi dengan puncak variabel yang berbeda harmoniknya
disebut mengi (PP) polifonik (seperti terlihat pada Gambar).2). Ketertarikan ilmiah di bidang
pemrosesan sinyal suara biomedis dalam melakukan klasifikasi ini secara otomatis terletak pada
kenyataan bahwa mengi PP biasanya disebabkan oleh patologi saluran udara kecil dan mengi MP
disebabkan oleh patologi saluran udara yang lebih besar.53]. Bahkan, beberapa penelitian [4,54-
56] telah menunjukkan bahwa mengi MP dan PP menunjukkan karakteristik fisiologis dan
patologis yang khas: (i) dalam analisis fisiologis, mengi MP disebabkan oleh penyempitan bronkus
tunggal, sedangkan mengi PP disebabkan oleh beberapa kompresi bronkial sentral; dan (ii) dalam
analisis patologis, mengi MP merupakan indikator adanya asma, sedangkan mengi PP dapat
dianggap sebagai penanda suara PPOK.
Sensor 2021, 21, 1661 3 dari 23
(A) (B)
1000 1000
MP mengi dengan satu puncak MP mengi dengan harmonik dari puncak basal tunggal
(komponen frekuensi tunggal) (tiga komponen frekuensi yang berhubungan secara harmonis)
800 800
Frekuensi (Hz)
Frekuensi (Hz)
600 600
400 400
200 200
0 0
0 0,05 0.1 0,15 0.2 0,25 0,3 0 0,05 0.1 0,15 0.2 0,25 0,3
Waktu) Waktu)
Gambar 1. Representasi frekuensi waktu dari dua contoh mengi Monophonic (MP): (A) dengan puncak basal
tunggal; (B) dengan harmonik puncak basal tunggal. Perhatikan bahwa komponen frekuensi berhubungan
secara harmonis dalam (B).
(A) (B)
1000 1000
Mengi PP terdiri dari lima puncak
yang tidak terkait secara harmonis.
800 Mengi PP terdiri dari dua puncak yang

800
tidak berhubungan secara harmonis.
Frekuensi (Hz)
Frekuensi (Hz)
600 600
400 400
200 200
0 0
0 0,05 0.1 0,15 0.2 0,25 0,3 0 0,05 0.1 0,15 0.2 0,25 0,3
Waktu) Waktu)
Gambar 2. Representasi waktu-frekuensi dari dua contoh mengi Polifonik (PP): (A) dengan dua puncak yang tidak
berhubungan secara harmonis; (B) dengan lima puncak yang tidak berhubungan secara harmonis. Perhatikan bahwa
komponen frekuensi tidak terkait secara harmonis dalam kasus wheezing PP.
Meskipun ada kemajuan dalam analisis suara pernapasan, klasifikasi mengi MP/PP
merupakan langkah penting dalam diagnosis asma.4,54,55] dan penyakit PPOK [54-56], begitulah
masih menjadi topik yang menantang dalam pemrosesan sinyal biomedis [7] karena kedua jenis
mengi bersifat sinusoidal. Meskipun ada relatif sedikit karya [7,18,47,57-60] di mana analisis mengi
MP/PP diperlakukan, satu-satunya pekerjaan yang difokuskan pada tugas mengklasifikasikan
mengi MP/PP secara mendalam adalah [7,57,59,60] untuk pengetahuan kita. Semua pendekatan
klasifikasi mengi MP/PP ini didasarkan pada ekstraksi fitur dan konfigurasi pengklasifikasi.
Ulukaya dkk. [7] mengusulkan untuk mengekstrak fitur tunggal, Rasio Energi Puncak (PER),
dari Transformasi Gelombang Dilasi RAsional (RADWT) untuk membedakan antara mengi MP
dan PP. Secara khusus, PER diperoleh dari puncak pertama dan kedua dengan energi
tertinggi dari semua sub-band dari koefisien wavelet (mengingat puncak kedua tidak
berurutan dengan yang pertama). Selain itu, penulis menerapkan metodologi evaluasi yang
kuat di mana sebagian besar metode ekstraksi fitur yang relevan [57,59,60] dievaluasi
menggunakan beberapa pengklasifikasi paling populer (SVM, KNN, dan ELM) dan skema
validasi silang Leave-One-Out (LOO). Hasilnya melaporkan bahwa metode yang diusulkan,
berdasarkan hanya satu fitur (PER), memperoleh kinerja klasifikasi mengi MP/PP terbaik
menunjukkan akurasi sebesar 86%.
Namun, tidak ada metode canggih yang ditipu oleh suarasisihkan interfe rence dihasilkan
pernapasan normal yang dapat memengaruhi MP/ Dalam PP mengi cl tugas asifikasi.
karya ini, proposal kami didasarkan pada Non-nega Fakta Matriks tive orisasi (NMF)
Sensor 2021, 21, 1661 4 dari 23
pendekatan untuk mengklasifikasikan suara mengi MP/PP menurut struktur harmonik yang
ditunjukkan dengan menghilangkan gangguan suara yang disebabkan oleh suara pernapasan
normal. Kontribusi pertama dari karya ini mengusulkan pendekatan baru Constrained Low-Rank
Non-negative Matrix Factorization (CL-RNMF), yang memungkinkan pola spektral yang terkait
dengan suara mengi untuk diekstraksi dengan gangguan suara seminimal mungkin dari suara
napas normal. Secara khusus, kami mengusulkan konfigurasi peringkat rendah menggunakan
pengurangan jumlah basis mengi untuk memadatkan komponen frekuensi menjadi basis sesedikit
mungkin untuk analisis lebih lanjut tanpa kehilangan konten mengi yang relevan. Selain itu,
pendekatan CL-RNMF yang diusulkan menggabungkan serangkaian batasan untuk memodelkan
perilaku spektro-temporal dari mengi dan suara pernapasan normal. Batasan ini membantu
mengisolasi pola spektral mengi dari suara pernapasan normal secara akustik. Untuk
mengklasifikasikan antara suara mengi MP atau PP, kontribusi kedua menganalisis struktur
harmonik dari pengurangan jumlah basis mengi sebelumnya berdasarkan lokasi spektral
komponen mengi, daripada energi komponennya.
Struktur makalah adalah sebagai berikut. Bagian2 mengulas secara singkat prinsip-prinsip
faktorisasi matriks non-negatif, dengan fokus pada pendekatan standar dan beberapa regularisasi
yang digunakan untuk memodelkan sifat-sifat bunyi yang diinginkan. Metode klasifikasi mengi
MP/PP yang diusulkan disajikan di Bagian3. Bagian4 rincian dan membahas evaluasi
eksperimental. Akhirnya, kami menyimpulkan di Bagian5 dan memberikan perspektif pada
penelitian lebih lanjut.
2. Latar Belakang Teoritis

2.1. Faktorisasi Matriks Non-Negatif
Faktorisasi Matriks Non-negatif (NMF) atau NMF standar [61,62] adalah teknik dekomposisi
yang telah menarik perhatian khusus di berbagai bidang pemrosesan sinyal biomedis dalam
beberapa tahun terakhir [63,64]. Karya sebelumnya menunjukkan efisiensi pendekatan NMF dalam
mendeteksi [9,50,51] dan meningkatkan kualitas audio mengi [65,66]. Secara umum, NMF dapat
didefinisikan sebagai alat pembelajaran tanpa pengawasan yang digunakan untuk representasi
linier dari data dua dimensi (2D) non-negatif di mana keuntungan utamanya adalah untuk
mengurangi dimensi sejumlah besar data untuk menemukan struktur tersembunyi dengan sarana
representasi berbasis bagian dengan pola non-negatif. Dari sinyal campuran
x(T), spektogram besarnya x ∈ RF×T + diperoleh melalui Short-Time Fourier
Transform (STFT) menerapkan fungsi jendela (misalnya, Hamming atau Hann) dan tumpang tindih
antar-jendela untuk meningkatkan resolusi temporal, F menjadi jumlah nampan frekuensi dan T
jumlah kerangka waktu. Di sini, NMF standar menguraikan spektogram besarnyax menjadi produk
dari dua matriks non-negatif: matriks basis spektral (pola) B ∈ RF×K +
dan matriks aktivasi temporal (bobot) A ∈ RK×T + , K menjadi pangkat atau jumlah
komponen (basis spektral),
x ≈ X = BA (1)
di mana X ∈ RF+×T adalah spektogram yang diperkirakan. Setiap kolom matriks basisB mendefinisikan
pola spektral yang menggambarkan perilaku spektral dari peristiwa suara aktif dalam spektogram
input x. Setiap baris matriks aktivasiA mewakili keuntungan temporal untuk pola spektral. Dengan
kata lain, matriksB menyediakan kamus yang terdiri dari K basis spektral, dan matriks A
mendefinisikan bobot yang dengannya basis spektral yang berbeda muncul di sepanjang bingkai
temporal. Karena properti non-negatif, NMF mendasari model interpolasi linier aditif yang
menghasilkan apa yang disebut representasi berbasis bagian [61].
Dekomposisi atau faktorisasi spektogram besaran input x ke dalam produk BA
biasanya dicari meminimalkan divergensi nilai skalar yang ditentukan,
arg min D(x|BA) B, A ≥ 0 (2)

B,A
Fungsi divergensi ini mengukur kesalahan yang dibuat dalam perkiraan

spektogram yang diamati x dan rekonstruksi BA. Biasanya, divergensi dihitung dari segi
entri:
Sensor 2021, 21, 1661 5 dari 23
F T
D(x|X) = D(x|BA) = Σ Σ D(x F ,T|X̂ F ,T) (3)
F =1 T=1
di mana D(Saya, J) adalah fungsi dari dua variabel skalar Saya, J. Ini sering disebut fungsi biaya dan
merupakan fungsi positif dariSaya ∈ R+ diberikan J ∈ R+ dengan minimum tunggal untuk Saya = J.
Beberapa fungsi biaya yang paling populer adalah jarak Euclidean, divergensi Kullback–Leibler yang
digeneralisasi, divergensi Itakura–Saito, dan distribusi Cauchy [67,68]. Dalam makalah ini, kami
mengusulkan untuk meminimalkan divergensi Kullback–Leibler yang digeneralisasiDKL(x|X)(lihat
Persamaan (4)) karena karya-karya sebelumnya [9,50,51,63,65,66] memperoleh hasil yang menjanjikan
dalam pemrosesan sinyal biomedis sejak DKL(x|X) menyediakan faktorisasi skala-invarian, yaitu
komponen suara energi rendah dari x menanggung kepentingan relatif yang sama dengan energi tinggi
dalam proses dekomposisi.
( ) F T
x F ,T X
DKL x|X = Σ Σ x F ,T catatan F ,T + X F ,T (4)
F =1 T=1 X F ,T
Metode minimisasi paling populer untuk menyelesaikan masalah yang ditunjukkan dalam
Persamaan (2) didasarkan pada apa yang disebut aturan pembaruan multiplikasi, awalnya
diusulkan oleh Lee dan Seung [61]. Metode ini memperoleh matriks dasar dan aktivasi,
meminimalkan fungsi divergensi Kullback–LeiblerDKL(x|X) dan memastikan non-negatif dari
matriks yang diperkirakan. Aturan-aturan ini diperoleh langsung dari suku negatif dan positif dari
turunan parsial fungsi divergensiDKL(x|X) sehubungan dengan parameter B dan A,
[ ]-
∂DKL(x|X) ( )
∂B ( ) ( )
B←B [ ] += B x BA AT [1]AT (5)
∂DKL(x|X)
∂B
[ ]-
∂DKL( x|X) ( )
∂A ( ) ( )
A←A [ ]+ = A BT x BA BT[1] (6)
∂DKL(x|x)ˆ
∂A
di mana [1] ∈ RF+×T mewakili matriks semua-satu, T adalah operator transpos, adalah
perkalian elemen-bijaksana, dan merupakan pembagian elemen-bijaksana. Prosedur ini selalu
mempertahankan non-negatif dari kedua parameter, karena istilah yang digunakan dalam pembaruan
juga non-negatif.
Seperti yang dijelaskan sebelumnya, NMF memodelkan spektogram magnitudo dari sinyal
campuran input sebagai produk dari matriks dasar dan matriks aktivasi dengan satu-satunya
batasan non-negatif elemen-bijaksana dari semua matriks. Di bawah kendala ini, tujuannya adalah
untuk meminimalkan fungsi biaya kesalahan rekonstruksi. Namun, masalah utama NMF adalah
trade-off antara rekonstruksi sinyal dan interpretasi fisik dari objek berbasis bagian yang
difaktorkan. Dengan kata lain, parameter non-negatif ini tidak menjamin representasi berbasis
bagian yang berarti ketika berhadapan dengan sinyal campuran dunia nyata [69,70]. Beberapa
properti dapat digunakan untuk meningkatkan keunikan minima lokal yang diperoleh NMF,
dengan memasukkan makna fisik ke dalam fungsi dasar dan aktivasi. Secara khusus, properti ini
dapat diimplementasikan menggunakan regularisasi, yang ditambahkan ke fungsi biaya global
dalam model faktorisasi. Kendala utama, kelangkaan dan kelancaran, yang digunakan dalam
makalah ini untuk memodelkan perilaku spektro-temporal dari mengi dan suara pernapasan
normal dijelaskan secara singkat di bawah ini.
2.2. Keterbatasan Spektral

Jarangnya spektral ψ(B) menunjukkan bahwa, untuk setiap sumber, sebagian besar frekuensinya adalah nol atau
mendekati nol [71,72]. Kendala ini memaksa bahwa hanya beberapa tempat frekuensi yang mendominasi
Sensor 2021, 21, 1661 6 dari 23
di setiap basis spektral, sementara bin lainnya dibatalkan. Ini diimplementasikan dengan
memasukkan istilah penalti ke dalam fungsi tujuan NMF. Dalam prakteknya,L1-norm sering
digunakan karena terbukti kurang sensitif terhadap perubahan parameter yang mengontrol
pentingnya kendala dalam proses faktorisasi. Kemudian, masalah optimasi dapat dinyatakan
sebagai,
arg min D(x|BA) + αkanBkan1 B, A ≥ 0 (7)

B,A
di mana α adalah parameter bobot yang menyesuaikan pengaruh kendala.
2.3. Kehalusan Temporal/Spektral

Umumnya, kelancaran φ berarti seberapa kontinu atau halus perubahan spektral atau temporal
yang terkait dengan sumber [72]. Kendala kelancaran telah ditentukan untuk kedua aktivasiA dan fungsi
dasar B dan ditambahkan ke fungsi biaya global sebagai persyaratan penalti sebagai berikut,
arg min D(x|BA) + λφ(A) + βφ(B) B, A ≥ 0 (8)

B,A
di mana φ(A) dan φ(B) adalah fungsi yang menghukum aktivasi temporal yang tidak
mulus atau pola spektral dan parameternya λ dan β mengontrol efek regularisasi dalam
prosedur dekomposisi.
Kelancaran temporal (juga dikenal sebagai aktivasi halus) φ(A), diterapkan pada matriks aktivasi
yang diperkirakan A, melaporkan seberapa lambat variasi amplitudo dari waktu ke waktu. Dengan kata
lain, kehalusan temporal menjelaskan fakta bahwa suara dunia nyata biasanya memiliki struktur
temporal, dan karakteristik akustiknya bervariasi secara perlahan sebagai fungsi waktu. Di dalam [72],
penulis mengusulkan untuk memodelkan regularisasi kehalusan temporalφ(A) dengan menerapkan
biaya tinggi untuk perubahan besar yang dihasilkan antara bingkai yang berdekatan dalam matriks
aktivasi A sebagai berikut,
K
φ(A) = Σ 1 T2 Σ (Aσkkt,T=A2k,untuk1)2k=1 (9)
√
1
di mana σk = T ΣT T=1 A2k,T menunjukkan standar deviasi yang digunakan untuk menormalkan aktivasi
fungsi. Normalisasi ini menetapkan bahwa biaya regularisasi tidak tergantung pada
skala numerik aktivasi [69,72].
Kehalusan spektral (juga dikenal sebagai dasar halus) φ(B), diterapkan pada matriks dasar yang
diestimasi B, mengukur seberapa cepat perubahan amplitudo di sepanjang sumbu frekuensi, yang
memungkinkan pemodelan perilaku suara-suara yang diwakili oleh spektrum pita lebar. Di dalam [69,73],
penulis mengusulkan untuk memodelkan regularisasi kehalusan spektralφ(B) dengan menerapkan biaya tinggi
untuk perubahan besar yang dihasilkan antara tempat sampah yang berdekatan dalam matriks dasar B
sebagai berikut,
K
φ(B) = Σ 1 F2 Σ (BkfF=,2k B f−1,k)2k=1 σ (10)
√
1
di mana σk = F ΣF F =1 B2F ,k mewakili standar deviasi yang digunakan untuk menormalkan basis
fungsi. Normalisasi ini mencapai bahwa biaya regularisasi tidak tergantung pada skala
numerik basis [69,73].
3. Metode yang Diusulkan
Masalah utama dalam mengklasifikasikan mengi dari campuran adalah bahwa suara
mengi dan suara pernapasan normal terjadi secara bersamaan dalam domain waktu dan
frekuensi. Mengingat gangguan akustik yang disebabkan oleh suara pernapasan normal,
model sinyal yang diusulkan terdiri dari dua tahap: Pemodelan dan pemisahan pola spektral
mengi dari suara pernapasan normal berdasarkan CL-RNMF (tahap I) dan Klasifikasi antara
mengi MP/PP sesuai dengan struktur harmonik (tahap II). Dengan cara ini,
Sensor 2021, 21, 1661 7 dari 23
Tujuan tahap I adalah untuk memodelkan pola spektral yang mencirikan suara mengi
dengan mengisolasinya dari gangguan pernapasan. Tujuan dari tahap II adalah untuk
menganalisis lokasi komponen frekuensi yang diekstraksi dari tahap sebelumnya untuk
menentukan jenis, monofonik atau polifonik, mengi menurut bagaimana energi mengi
terletak di domain frekuensi. Diagram alir metode yang diusulkan ditunjukkan pada Gambar
3, dan detailnya digambarkan di Bagian 3.1-3.3.
Gambar 3. Flowchart dari metode yang diusulkan.
3.1. Representasi Sinyal Waktu-Frekuensi

Representasi waktu-frekuensi melalui spektogram telah terbukti berguna untuk
memvisualisasikan karakteristik dan perilaku mengi dan suara pernapasan normal.9,50,
51,65,66]. Sinyal campuran masukanx(T) terdiri dari suara mengi xw(T) (MP atau PP
mengi) dan suara pernapasan normal xR(T) tumpang tindih dalam domain waktu dan
frekuensi. Kami berasumsi bahwa campuran suara-suara ini adalah aditif dan dapat
dinyatakan sebagai x(T) = xR(T) + xw(T). Spektogram magnitudo masukanx ∈ RF×T + dari
sinyal campuran input dapat direpresentasikan sebagai x = xR + xW, makhluk xR ∈ RF×T + besarnya
spektogram hanya suara pernapasan dan xW ∈ RF×T + spektogram magnitudo dari
hanya suara mengi. Secara khusus, setiap spektogram magnitudo terdiri dari:T bingkai, F
nampan frekuensi dan satu set unit waktu-frekuensi x F ,T, makhluk F = 1, ... , F dan T = 1, ... , T
. Setiap unitx F ,T didefinisikan oleh F tempat frekuensi ke Tframe dan dihitung dari besarnya
Short-Time Fourier Transform (STFT) menggunakan jendela Hamming sebesarn sampel
dengan tumpang tindih 10%. Dalam karya ini, proses normalisasi diterapkan untuk mencapai
kemandirian mengenai ukuran dan skala spektogram inputx. Jadi, spektogram magnitudo
ternormalisasix dihitung sebagai berikut,
x
x=( ) (11)
ΣFF =1 ΣTT=1 x F ,T
FT
Untuk menghindari nomenklatur yang rumit di seluruh makalah, variabel x selanjutnya

disebut spektogram magnitudo ternormalisasi yang sebelumnya dihitung dalam Persamaan (11).
Sensor 2021, 21, 1661 8 dari 23
3.2. Tahap I: Faktorisasi Matriks Non-Negatif Peringkat Rendah Terkendala

Seperti disebutkan di atas, adalah umum bahwa suara pernapasan normal menutupi
keberadaan suara mengi. Akibatnya, topeng suara ini membuat tugas klasifikasi mengi
menjadi sulit karena pola spektral yang terkait dengan suara pernapasan normal dapat
dikacaukan dengan konten spektral mengi. Oleh karena itu, tujuan dari tahap ini adalah
untuk memberikan pemodelan yang andal dari berbagai komponen frekuensi (pola spektral)
yang membentuk mengi, menghilangkan gangguan suara apa pun dari suara pernapasan
normal. Untuk tujuan ini, kami mengusulkan pendekatan CL-RNMF karena, sejauh
pengetahuan penulis, pendekatan faktorisasi matriks non-negatif belum pernah diterapkan
sebelumnya untuk klasifikasi mengi MP/PP. Selain itu, pendekatan kami adalah metode tanpa
pengawasan karena tidak memerlukan pelatihan suara untuk mengklasifikasikan. Karena itu,
x menjadi dua spektogram perkiraan: XR (hanya suara pernapasan normal tanpa mengi) dan
XW (hanya suara mengi tanpa suara pernapasan normal). Dengan cara ini, setiap spektogram
yang diperkirakan dapat difaktorkan menjadi:
produk dari basis estimasi dan matriks aktivasi yang sesuai: (i) BR ∈ RF×KR +
dan AR ∈ RKR+×T faktorisasi dari XR, KR menjadi jumlah komponen pernapasan;
dan (ii) BW ∈ RF×K+w dan AW ∈ RKw×T faktorisasi
+ dari XW, Kw menjadi jumlah komponen
mengi. Model pemisahan yang diusulkan dapat dirumuskan dengan fungsi tujuan
berikut,
x ≈ XR + XW = BRAR + BWAW (12)
di mana, dengan mempertimbangkan properti non-negatif yang mencirikan pendekatan NMF, semua
matriks yang menyusun model sebelumnya adalah non-negatif.
Seperti disebutkan sebelumnya, tahap ini mencoba untuk memastikan bahwa: BW berisi
pemodelan pola spektral mengi yang andal melalui puncak spektral pita sempit yang
biasanya mencirikan konten mengi. Asumsi utama di balik pendekatan CL-RNMF yang
diusulkan untuk memodelkan pola spektral mengi adalah sebagai berikut:
• peringkat rendah: Jumlah komponen mengi harus jauh lebih sedikit daripada
jumlah komponen pernapasan normal, yaitu Kw KR. Asumsi ini memungkinkan
bahwa jumlah komponen frekuensi dapat dikurangi dalam jumlah basa sesedikit mungkin
untuk analisis posteriornya, sementara suara pernapasan normal dimodelkan menggunakan
rentang komponen yang lebih tinggi. Hasil eksperimen menunjukkan bahwa kinerja
klasifikasi terbaik diperoleh ketika 2≤ Kw ≤ 6 dan KR ≥ 32. Khususnya, ketika Kw = 1,
pendekatan CL-RNMF yang diusulkan cenderung menyatu dengan sangat cepat dengan
mengorbankan kehilangan konten mengi yang relevan. Di sisi lain, ketikaKw > 6, pola mengi
spektral cenderung dipecah menjadi komponen matriks yang berbeda BW.
• Kendala: Ini mencirikan suara mengi dan suara pernapasan normal menggunakan
pembatasan yang berlawanan antara kedua suara. Penggunaan batasan
memungkinkan mengisolasi pola spektral mengi dari pola spektral suara pernapasan
normal. Oleh karena itu, untuk menemukan dekomposisi NMF yang lebih baik yang
menunjukkan fitur spektrotemporal dari mengi dan suara pernapasan normal seperti
yang dapat diamati di dunia nyata, kami mengusulkan untuk memasukkan sparseness
dan smoothness ke dalam proses dekomposisi NMF. Seperti yang ditunjukkan pada
Gambar1 dan 2, suara mengi dapat dianggap jarang dalam frekuensi karena mengi MP
atau mengi PP ditandai oleh satu atau lebih dari satu puncak spektral pita sempit. Selain
itu, suara mengi dapat dianggap sebagai peristiwa halus atau kontinu dalam waktu,
yaitu variasi lambat dari spektogram magnitudo sepanjang waktu. Di sisi lain, suara
pernapasan normal dapat dianggap frekuensinya halus, yaitu dapat dimodelkan dengan
asumsi pola spektral pita lebar. Karena itu,BW harus mengandung pola spektral mengi
yang terdiri dari satu atau lebih dari satu puncak spektral pita sempit, tergantung pada
kompleksitas spektral setiap mengi, dan BR harus terdiri dari satu set pola spektral pita
lebar yang memodelkan perilaku suara pernapasan normal.
Sensor 2021, 21, 1661 9 dari 23
( Dengan mempertimbangkan asumsi kunci yang disebutkan di atas, fungsi tujuan global
D x|X yang harus diminimalkan untuk mengestimasi basis (BR, BW) dan aktivasi
(AR,(AW)) matriks terdiri dari: (i) fungsi biaya divergensi Kullback–Leibler
DKL x|xuntuk meminimalkan kesalahan rekonstruksi antara spektogram input x dan
perkiraan spektogram X, (ii) spektral sparseness ψ(BW) dan kehalusan temporalφ(AW)
pembatasan diterapkan pada BW dan AW, masing-masing, untuk memodelkan pola spektral
mengi, dan (iii) kehalusan spektral φ(BR) pembatasan diterapkan pada BR, untuk mo (del )
pola spektral suara pernapasan normal. Fungsi tujuan globalD x|X dirinci sebagai
berikut,
( ) ( )
D x|X = DKL x|x + αψ(BW) + λφ(AW) + βφ(BR) (13)
( )
dimana persamaan suku DKL x|X , ψ(BW), φ(AW), dan φ(BR) dapat ditemukan di
Bagian 2. Parameternyaα, λ, dan β menentukan bobot untuk mengontrol efek regularisasi.
Hasil eksperimen menunjukkan bahwa kinerja klasifikasi terbaik diperoleh ketika semua
bobot samaα = λ = β, nilai optimalnya adalah α = λ = β = 0,5. Menganalisis kinerja pemisahan
suara dari dekomposisi sebelumnya, kami mengamati secara empiris bahwa gangguan
akustik yang diderita oleh suara mengi dari suara pernapasan normal adalah minimum, dan
tidak ada kehilangan konten mengi yang signifikan ketikaα = λ = β. Namun, hilangnya konten
mengi yang signifikan muncul ketikaα = >, atau gangguan suara yang signifikan oleh suara
pernapasan normal dapat diamati ketika α = <.
Dari Persamaan (13), matriks dasar yang diestimasi (BW dan BR) dan matriks aktivasi (AW dan
AR) dapat diperoleh dengan menerapkan algoritma penurunan gradien berdasarkan aturan
pembaruan perkalian. Secara khusus, aturan pembaruan perkalian untuk mempelajari matriks
tersebut dapat dihitung dengan mengambil (neg)atif dan positif dari turunan parsial dari fungsi
tujuan globalD x|X dengan hormat BW, BR, AW, dan AR, masing-masing,
[ ]- [ ]-
∂DKL(x|X)
∂BW + α ∂ψ∂(BBWW)
BW ← BW [ ]+ [ ]+ (14)
∂DKL(x|X)
∂BW + α ∂ψ∂(BBWW)
[ ]- [ ]-
∂DKL(x|X)
∂BR + β ∂φ∂(BBRR)
BR ← BR [ ]+ [ ]+ (15)
∂DKL(x|X)
∂BR + β ∂φ∂(BBRR)
[ ]- [
∂DKL(x|X) ∂φ(AW) ]-
∂AW + λ ∂AW
AW ← AW [ ]+ [ (16)
ˆ)
∂DKL ( x|x ∂φ(AW) ]+
∂AW + λ ∂AW
[ ]-
∂DKL(x|X)
∂AR
AR ← AR [ ]+ (17)
∂DKL(x|X)
∂AR
di mana, untuk setiap aturan pembaruan perkalian, pembagian antara suku negatif dan positif dari
turunan parsial adalah pembagian berdasarkan elemen. Rincian lebih lanjut terkait dengan
persamaan setiap turunan parsial dari aturan pembaruan perkalian dapat ditemukan di Lampiran
A. Akhirnya, perkiraan dasar pernapasan dan mengi (BW dan BR) dan matriks aktivasi (AW dan AR)
diperoleh memperbarui aturan sebelumnya sampai algoritma konvergen menggunakan M iterasi.
Angka4 menunjukkan matriks yang diperkirakan BW dan BR
menguraikan spektogram mengi MP yang ditunjukkan pada Gambar 1B. Seperti yang
dapat diamati, matriks BW berisi pola spektral yang mencirikan mengi khas MP, yaitu:
Sensor 2021, 21, 1661 10 dari 23
diwakili oleh seperangkat puncak spektral pita sempit (atau komponen frekuensi).
Sebaliknya, matriks yang diestimasiBR terdiri dari satu set pola spektral pita lebar yang
mencirikan suara pernapasan normal. Oleh karena itu, pendekatan CL-RNMF yang
diusulkan mencapai ekstraksi konten spektral mengi dengan menghilangkan suara
pernapasan normal.
(A) (B)
1000 1000
800 800
Frekuensi (Hz)
Frekuensi (Hz)
600 600
400 400
200 200
0 0
1 2 3 4 4 8 12 16 20 24 28 32
Dasar (Kw) Dasar (Kr)
Gambar 4. Contoh matriks taksiran BW dan BR diperoleh dari pendekatan CL-RNMF yang diusulkan, menganalisis
spektogram mengi MP yang sebelumnya ditunjukkan pada Gambar 1B. (A) Meskipun matriks BW terdiri dari empat basis
spektral, pola mengi spektral dipadatkan menjadi basis keempat BW(4). Dasar spektral iniBW(4) terdiri dari tiga puncak
spektral pita sempit. (B) Matriks BR terdiri dari tiga puluh dua basis spektral pita lebar.
Secara eksperimental, kami menemukan bahwa pendekatan CL-RNMF yang diusulkan

cenderung memadatkan semua puncak spektral pita sempit menjadi satu basis matriks BW, seperti
yang ditunjukkan pada Gambar 4A. Namun, mengingat CL-RNMF menggunakan satu set kecil
komponen mengi (Kw), dalam beberapa kasus, puncak spektral pita sempit dibagi menjadi
beberapa basis dari matriks yang sama BW. Untuk memperjelas masalah ini, Gambar5
menunjukkan matriks BW diperoleh untuk berbagai contoh mengi MP dan PP yang dijelaskan
dalam Bagian 1. Seperti yang ditunjukkan pada Gambar5D, energi pola spektral pita sempit, yang
mencirikan PP mengi, dibagi menjadi dua basis BW(1) dan BW(2) milik matriks BW. Di kedua
pangkalan,BW(1)dan BW(2), semua puncak spektral pita sempit dimodelkan dengan benar.
(A) (B)
1000 1000
800 800
Frekuensi (Hz)
Frekuensi (Hz)
600 600
400 400
200 200
0 0
1 2 3 4 1 2 3 4
Dasar (Kw) Dasar (Kw)
(C) (D)
1000 1000
800 800
Frekuensi (Hz)
Frekuensi (Hz)
600 600
400 400
200 200
0 0
1 2 3 4 1 2 3 4
Dasar (Kw) Dasar (Kw)
Gambar 5. Estimasi matriks dasar BW diperoleh dari CL-RNMF dalam contoh yang ditunjukkan di Bagian 1. (A) BW untuk mengi MP yang
ditunjukkan pada Gambar 1A. (B) BW untuk mengi MP yang ditunjukkan pada Gambar 1B. (C) BW untuk PP mengi yang ditunjukkan pada
Gambar 2A. (D) BW untuk PP mengi yang ditunjukkan pada Gambar 2B. Pola spektral mengi dipadatkan menjadi satu basis, BW(2) (dalam
hal (A)), BW(4) (dalam hal (B)), dan BW(2) (dalam hal (C)). Namun, energi puncak spektral pita sempit dibagi menjadi dua basisBW(1) dan B
W(2), seperti dapat dilihat dalam Kasus (D).
Sensor 2021, 21, 1661 11 dari 23
Akhirnya, kami mengusulkan untuk mendapatkan distribusi energi spektral ξ( F ) (lihat Persamaan (
18)) dari himpunan basa yang menyusun matriks BW. Hal ini memungkinkan untuk memadatkan
distribusi spektral dari semua puncak spektral pita sempit yang membentuk input MP atau PP mengi
untuk menganalisis struktur harmoniknya di Tahap II.
Kw
ξ( F ) = Σ BW F ,kw
, F = 1, . . . ,F (18)
kw=1
Angka 6 menunjukkan distribusi energi spektral ξ( F ) diperoleh untuk empat contoh

mengi yang ditunjukkan pada Bagian 1. Pseudocode Tahap I ini untuk pemodelan dan
pemisahan pola spektral mengi berdasarkan CL-RNMF dirinci dalam Algoritma1.
(A) (B)
1 1
tiga puncak spektral yang terkait secara harmonis
puncak spektral tunggal
0.8 0.8
0.6 0.6
(F)
(F)
0.4 0.4
0.2 0.2
0 0
0 200 400 600 800 1000 0 200 400 600 800 1000
Frekuensi (Hz) Frekuensi (Hz)
(C) (D)
1 1
dua puncak spektral yang tidak terkait secara harmonis lima puncak spektral yang tidak terkait secara harmonis
0.8 0.8
0.6 0.6
(F)
(F)
0.4 0.4
0.2 0.2
0 0
0 200 400 600 800 1000 0 200 400 600 800 1000
Frekuensi (Hz) Frekuensi (Hz)
Gambar 6. Distribusi energi spektral ξ( F ) disediakan oleh CL-RNMF dari matriks dasar yang
diperkirakan BW ditunjukkan pada Gambar 5: (A) Angka 5A. (B) Angka 5B. (C) Angka 5C. (D) Angka 5D.
Algoritma 1: CL-RNMF.
Memerlukan: x(T), KR, Kw, α, β, λ, dan M.
ss1: Hitung spektogram magnitudo yang dinormalisasi x menggunakan Persamaan (
11).ss2: Inisialisasi BW, BR, AW, dan AR dengan nilai non-negatif acak.ss3: Perbarui
perkiraan matriks dasar mengi BW menggunakan Persamaan (14).
ss4: Perbarui perkiraan matriks dasar pernapasan BR menggunakan Persamaan (15).ss5:
Perbarui perkiraan matriks aktivasi mengi AW menggunakan Persamaan (16).ss6:
Perbarui perkiraan matriks aktivasi pernapasan AR menggunakan Persamaan (17).
ss7: Ulangi Langkah 3–6 hingga algoritme konvergen (atau hingga maksimum
jumlah iterasi M tercapai).
ss8: Hitung distribusi energi spektral ξ( F ) dari BW menggunakan Persamaan (18).
sskembali ξ( F )
3.3. Panggung II: S . Harmonik Tanalisis struktur Saya

S
Tujuan dari tahap ini adalah untuk mengklasifikasikan mengi antara MP dan PP dengan menganalisis
distribusi energi spektral ξ( F ) dari puncak spektral pita sempit yang berbeda yang diperoleh dalam
tahap sebelumnya. Tergantung pada struktur harmonik, mengi dapat diklasifikasikan sebagai MP
atau PP. Secara khusus, mengi MP terdiri dari puncak spektral pita sempit tunggal atau kumpulan
puncak spektral pita sempit yang terkait secara harmonis. Sebaliknya, PP mengi adalah
Sensor 2021, 21, 1661 12 dari 23
terdiri dari beberapa puncak spektral pita sempit yang tidak terkait secara harmonis. Untuk alasan ini,
kami mengusulkan untuk mendapatkan jumlah puncak spektral pita sempitη yang dapat ditemukan dari
ξ( F ). Perhatikan bahwa prosedur untuk mendeteksi puncak spektral adalah tugas yang sederhana
karena, seperti dapat dilihat pada Gambar 6, distribusi energi spektral ξ( F ) dari CL-RNMF dengan jelas
memberikan satu set puncak spektral pita sempit yang biasanya ditemukan pada suara mengi. Setelah
parameterη diperoleh, klasifikasi awal jenis mengi dapat dilakukan sebagai berikut,
{
MP jikaη = 1
Kategori mengi = (19)
MP atau PP jika> 1
Mengi hanya dapat diklasifikasikan sebagai MP ketika η = 1 karena mengi terdiri dari puncak
spektral pita sempit tunggal, seperti yang dapat dilihat pada Gambar 6A. Namun, mengi dapat
diklasifikasikan sebagai MP atau PP ketika > 1, tergantung pada struktur harmonik yang ada di
antara puncak spektrum pita sempit yang berbeda. Secara khusus, mengi diklasifikasikan sebagai
MP jika himpunan puncak spektral terkait secara harmonis di antara mereka. Mengi
diklasifikasikan sebagai PP jika puncak spektral tidak terkait secara harmonis di antara mereka.
Untuk melakukan klasifikasi antara mengi MP dan PP dalam kasus> 1, kami mengusulkan
prosedur dua langkah, sebagai berikut:
• Tujuan dari langkah pertama adalah untuk menemukan, dalam hal frekuensi, semua puncak spektral
pita sempit yang terdeteksi pada Tahap I sebelumnya. Untuk ini, kami mengusulkan untuk
menemukan frekuensi yang paling menonjol F P(z) di setiap puncak spektral z = 1, ... , η. Setiap nilai
F P(z)dihitung menggunakan fungsi findpeaks yang disediakan oleh perangkat lunak MATLAB [74]
karena hasil yang memuaskan diperoleh dalam beberapa analisis awal yang dilakukan. Angka7
menunjukkan lokasi F P(z), dalam hal frekuensi, masing-masing puncak spektral untuk contoh MP
yang sebelumnya ditunjukkan pada Gambar 1B.
• Tujuan dari langkah kedua adalah untuk memeriksa apakah puncak spektral yang berbeda z =
1, ... , η berhubungan secara harmonis atau tidak. Kami berasumsi bahwa puncak spektral
pertama (z = 1) mewakili puncak basal. Oleh karena itu, mengi diklasifikasikan sebagai MP
jika sisa puncak spektral (z = 2, ... , η) terletak di frekuensi harmonik (kelipatan bilangan bulat)
dari puncak basal. Jika tidak, mengi diklasifikasikan sebagai PP. Dari lebarΔ dari lobus utama
puncak basal (z = 1) dan nilai frekuensi yang paling menonjol F P(1), interval spektral di mana
frekuensi harmonik yang mungkin harus ditempatkan dihitung sebagai berikut,
[ ]
Λz = zf P(1) - (/2), zf P(1) + (/2) , z = 1, . . . ,η (20)
di mana [Saya, J] menunjukkan interval spektral yang terdiri antara batas bawah Saya
dan batas atas J, dalam hal frekuensi. Secara khusus,1 mewakili interval spektral yang
terkait dengan puncak basal, danz (z = 2, . . . ,η) sesuai dengan interval spektral di mana
frekuensi harmonik harus ditempatkan. Perhatikan bahwa lebar lobus utamaΔ
diperoleh dengan memposisikan garis referensi di bawah puncak pada jarak vertikal
yang sama dengan setengah dari tonjolan puncak [74].
Sensor 2021, 21, 1661 13 dari 23
1
Λ1 Λ2 Λ3 (F)
FP(z)
0.8 menonjol
z=1
Δ
FP(1) batasz
0.6
(F)
0.4
z=2
z=3
0.2
FP(2)
FP(3)
0 100 200 300 400 500 600 700 800 900 1000
Frekuensi (Hz)
Gambar 7. Contoh prosedur dua langkah yang diusulkan untuk mengklasifikasikan antara mengi MP dan PP
ketika: > 1 dari contoh mengi MP yang ditunjukkan pada Gambar 1B. Perhatikan bahwa panah menunjukkan
puncak spektral pita sempit yang membentuk mengi. Dalam hal ini, mengi diklasifikasikan sebagai MP karena
semua puncak spektral terkait secara harmonis.
Mempertimbangkan prosedur dua langkah yang dijelaskan di atas, mengi yang terdiri dari beberapa
puncak spektral pita sempit (> 1) dapat diklasifikasikan sebagai MP atau PP sebagai berikut,
{
MP jika FP (z) ⊆ Λz, z = 2, . . . ,η
Kategori mengi = (21)
PP sebaliknya
di mana v ⊆ V menunjukkan elemen itu v terkandung dalam interval V. Oleh karena itu, ketika
frekuensiF P(z) dari semua kemungkinan puncak spektral harmonik z = 2, . . . ,η terletak di
interval spektral yang sesuaiz, mengi diklasifikasikan sebagai MP. Jika tidak, mengi
diklasifikasikan sebagai PP karena puncak spektral pita sempit yang mencirikan mengi tidak
terkait secara harmonis. Hal ini terjadi ketika untuk frekuensiF P(z), setidaknya salah satu dari
kemungkinan spesifikasi harmonikCpuncak tral tidak terletak dalam interval spektral yang sesuaiz.
Angka7 menunjukkan contoh prosedur yang dijelaskan untuk mengi MP terdiri dari a
puncak basal dan dua harmonik. Angka8 menunjukkan dua contoh prosedur yang dijelaskan
untuk dua PP mengi dengan beberapa puncak spektral yang tidak terkait secara harmonis.
Akhirnya, pseudocode tahap ini untuk klasifikasi antara mengi MP/PP menurut struktur
harmoniknya dirinci dalam Algoritma2.
(A)
1
Λ1 Λ2
z=2
0.8 FP(1) (F)
z=1 FP(z)
0.6 menonjol
Δ
(F)
0.4 FP(2) batasz
0.2
0
0 100 200 300 400 500 600 700 800 900 1000
Frekuensi (Hz)
(B)
1
Λ1 Λ2 z=3 Λ3 z=4 Λ4 Λ5
0.8
(F)
z=2
FP(z)
0.6 z=1 z=5 menonjol
(F)
FP(1) Δ
0.4 FP(3) FP(4)
batasz
FP(2)
0.2 FP(5)
0
0 100 200 300 400 500 600 700 800 900 1000
Frekuensi (Hz)
Angka 8. Contoh prosedur dua langkah yang diusulkan untuk mengklasifikasikan antara mengi MP dan PP ketika: > 1, mempertimbangkan dua
contoh mengi PP yang ditunjukkan pada Gambar 2. (A) Prosedur dua langkah yang diterapkan pada mengi PP yang ditunjukkan pada Gambar 2A.
(B) Prosedur dua langkah yang diterapkan pada mengi PP yang ditunjukkan pada Gambar 2B. Perhatikan bahwa panah menunjukkan
puncak spektral pita sempit yang membentuk mengi. Dalam hal ini, mengi keduanya diklasifikasikan sebagai PP karena tidak semua
puncak spektral terkait secara harmonis.
Sensor 2021, 21, 1661 14 dari 23
Algoritma 2: Analisis struktur harmonik.

Memerlukan: ξ( F ).
ss1: Dari ξ( F ), mendeteksi nomor η dari puncak spektral pita sempit.ssjika η =
1 kemudianssssskembali
Kategori mengi = MP
sslain
sssss2: Temukan frekuensinya F P(z) di setiap puncak spektral z = 1, . . . ,η.
sssss3: Hitung interval spektralz menggunakan Persamaan (20).sssssjika F P(
z) ⊆ Λz, z = 2, . . . ,η kemudianssssssskembali
Kategori mengi = MP
ssssslain
ssssssskembali Kategori mengi = PP
sssssberakhir jika
ssberakhir jika
4. Hasil Eksperimen dan Pembahasan

4.1. Pengumpulan data
Sejauh pengetahuan penulis, tidak ada database mengi di mana mengi telah diberi label
sebagai monophonic atau polyphonic. Untuk alasan ini, kami menerima kolaborasi ahli
pneumologi dari Rumah Sakit Universitas Jaén (Spanyol) untuk membuat dan memberi label
database sesuai dengan struktur harmonik mengi. Basis data dibuat dengan mengumpulkan
dan mengkategorikan satu set rekaman dari subjek yang berbeda dari repositori paru
Internet yang paling banyak digunakan [75-87]. Secara khusus, semua rekaman sebelumnya
dikumpulkan dari subjek dengan CRD (asma atau COPD). Perhatikan bahwa rangkaian
rekaman yang dipilih untuk penilaian ini hanya terdiri dari suara pernapasan normal dan
suara mengi.
Jenis mengi (MP atau PP) diberi label oleh ahli pneumologi melalui inspeksi akustik dan
verifikasi visual spektogram dengan mempertimbangkan struktur harmonik yang
membedakan kedua jenis mengi. Basis data terdiri dari segmen mengi 200 MP dan 200 PP,
di mana durasi setiap segmen setidaknya 100 ms, agar konsisten dengan literatur. Seperti
disebutkan di atas, mengi MP dapat menunjukkan dua struktur harmonik yang berbeda: Tipe
1, mengi dengan puncak tunggal, yaitu hanya komponen frekuensi dasar yang aktif; dan
Tipe 2, mengi dengan harmonik satu puncak basal, yang merupakan komponen frekuensi
dasar dan frekuensinya yang terkait secara harmonis aktif. Oleh karena itu, untuk menjamin
variabilitas maksimum mengi MP, segmen mengi 200 MP dibagi menjadi segmen mengi 100
MP dengan puncak tunggal dan segmen mengi 100 MP dengan harmonik puncak basal
tunggal. Perhatikan bahwa semua segmen independen satu sama lain, karena setiap
segmen berhubungan dengan mengi yang berbeda dari yang lain. Akhirnya, semua segmen
dalam database diambil sampelnya pada 4096 Hz dan memiliki panjang antara 100 dan 700
ms. Angka9 menunjukkan klasifikasi yang dilakukan pada database yang dibuat.
400 segmen mengi
200 segmen mengi PP Segmen mengi 200 MP
100 MP mengi 100 MP mengi

segmen dengan segmen dengan
puncak tunggal (tipe 1) harmonik dari
basal tunggal
puncak (tipe 2)
Gambar 9. Skema jenis mengi yang terdapat dalam database.

Sensor 2021, 21, 1661 15 dari 23
4.2. Pengaturan eksperimen
Agar konsisten dengan literatur, kami berasumsi bahwa suara mengi tidak aktif di
bawah 100 Hz dan di atas 1000 Hz. Untuk alasan ini, semua segmen yang menyusun
database dibatasi pita dari 100 Hz–1000 Hz.
Panjang bingkai sinyal diatur ke n = 256 sampel (62,5 ms). Ukuran bingkai ini dianggap cukup
besar untuk mengasumsikan representasi spektral sempurna dari semua komponen frekuensi
mengi. Tumpang tindih antar bingkai diatur ke 10% (6,25 mdtk). Untuk mendapatkan representasi
waktu-frekuensi, windowing dengan jendela Hamming diterapkan, dan urutan Discrete Fourier
Transform (DFT) diatur ke 2n nampan frekuensi, mirip dengan [9,50]. Ukuran DFT ini memberikan
resolusi yang cukup tinggi untuk memodelkan pola spektral suara mengi dan dipilih secara empiris
sebagai trade-off antara kualitas dan kompleksitas yang dicapai. Selain itu, kami secara empiris
mengamati bahwa kesalahan rekonstruksi konvergen setelah 50 iterasi, sehingga jumlah
maksimum iterasi untuk dekomposisi adalah sama denganM = 50.
Akhirnya, perhatikan bahwa kinerja metode yang diusulkan tergantung pada nilai awal yang
menjadi dasar matriks BW, BR dan matriks aktivasi AW, AR diinisialisasi. Meskipun hasil yang
diperoleh tidak tersebar dan mempertahankan perilaku yang sama, untuk mengatasi masalah ini,
kami menjalankan metode yang diusulkan lima kali untuk setiap segmen yang menyusun
database, dan hasil yang ditampilkan dalam makalah ini adalah nilai rata-rata.
4.3. Metrik Evaluasi

Tingkat Akurasi (ACC) digunakan untuk mengevaluasi kinerja metode yang
diusulkan, yang umumnya digunakan di bidang klasifikasi mengi [7]. Untuk
memberikan evaluasi yang adil atas kinerja klasifikasi yang diperoleh dengan metode
yang diusulkan dan algoritma mutakhir, tingkat akurasi berikut diusulkan: (i)ACCG
adalah kemampuan untuk mengklasifikasikan segmen mengi dengan benar sebagai MP atau PP; (ii)ACCP mewakili
kemampuan untuk mengklasifikasikan segmen mengi dengan benar sebagai PP; (aku aku aku)ACCM sesuai dengan
kemampuan untuk mengklasifikasikan segmen mengi dengan benar sebagai MP; (iv)ACCM1 menunjukkan kemampuan
untuk mengklasifikasikan segmen mengi dengan benar sebagai MP Tipe 1; dan (v)ACCM2 melaporkan kemampuan
untuk mengklasifikasikan segmen mengi dengan benar sebagai MP Tipe 2. Istilah yang digunakan dalam Persamaan (
22)–(26) dijelaskan dalam Tabel 1.
(Tp + TM)
ACCG = (22)
(Tp + TM + FP + FM))
Tp
ACCP = (23)
(Tp + FP)
TM
ACCM = (24)
(TM + FM)
TM1
ACCM1 = (25)
(TM1 + FM1)
TM2
ACCM2 = (26)
(TM2 + FM2)
Sensor 2021, 21, 1661 16 dari 23
Tabel 1. Definisi istilah yang muncul dalam metrik yang dirinci dalam Persamaan (22)–(26).
Ketentuan definisi
Tp (PP benar) Segmen mengi PP diklasifikasikan dengan benar Segmen
TM (MP sejati) mengi MP diklasifikasikan dengan benar Segmen mengi
FP (PP palsu) PP salah diklasifikasikan sebagai MP Segmen mengi MP
FM (MP palsu) salah diklasifikasikan sebagai PP MP Segmen mengi tipe 1
TM1 (MP Sejati Tipe 1) diklasifikasikan dengan benar Segmen mengi MP tipe 2
TM2 (MP Sejati Tipe 2) diklasifikasikan dengan benar Segmen mengi MP Tipe 1 salah
FM1 (MP Salah Tipe 1) diklasifikasikan sebagai PP MP Segmen mengi tipe 2 salah
FM2 (MP Salah Tipe 2) diklasifikasikan sebagai PP
4.4. Metode Perbandingan Tercanggih

Untuk mengukur kinerja klasifikasi MP/PP dari proposal, kami menggunakan algoritma
mutakhir dan relevan [7], dilambangkan sebagai UPER dalam makalah ini. Metode UPER
diimplementasikan secara ketat mengikuti instruksi yang ditentukan oleh penulis di [7]. Pertama,
nilai metrik PER diperoleh dengan menggunakan set parameter ke-19 (P = 10, Q = 11, S = 7, dan J =
45) dalam model RADWT. Kemudian, tiga pengklasifikasi, Support Vector Machine (SVM) dengan
kernel Radial Basis Function (RBF kernel), K-Nearest Neighbor (KNN), dan Extreme Learning
Machine (ELM) diterapkan pada fitur PER. Kinerja klasifikasi UPER diperoleh dalam skema validasi
silang Leave-One-Out (LOO) dengan pengklasifikasi SVM, KNN, dan ELM. Secara khusus, validasi
silang LOO adalah kasus tertentu dari validasi silang Leave-p-Out (LPO) denganP = 1. Oleh karena
itu, skema LOO melibatkan penggunaan satu observasi sebagai set validasi dan observasi lainnya
sebagai set pelatihan. Ini diulangi dengan segala cara untuk memotong database menjadi satu set
validasi dari satu pengamatan dan satu set pelatihan. Mempertimbangkan database yang
dievaluasi dalam pekerjaan ini (total 400 segmen), skema validasi silang LOO memiliki 400
kemungkinan kombinasi validasi di mana set pelatihan terdiri dari 399 segmen, dan hanya satu
segmen yang diuji, seperti yang dapat diamati pada Gambar10). Hasil yang ditunjukkan dalam
makalah ini untuk semua pengklasifikasi adalah nilai rata-rata yang diperoleh dari 400
kemungkinan kombinasi validasi.
1 2 3 4 5 6 7 8 9 10 ..... 400 1 validasi
1 2 3 4 5 6 7 8 9 10 ..... 400 2 validasi
1 2 3 4 5 6 7 8 9 10 ..... 400 3 validasi
- -
- -
- -
1 2 3 4 5 6 7 8 9 10 ..... 400 400 ℎ validasi
segmen pengujian
segmen pelatihan
Gambar 10. Skema validasi silang LOO untuk database yang dijelaskan dalam makalah ini.
4.5. Hasil Akurasi

Pada bagian ini, kami mengevaluasi kinerja klasifikasi MP/PP antara metode yang diusulkan
dan UPER [7]. Perbedaan yang luar biasa antara kedua metode adalah bahwa metode yang
diusulkan benar-benar tanpa pengawasan atau buta (tidak ada pelatihan), tetapi metode UPER
tergantung pada database pelatihan.
Sensor 2021, 21, 1661 17 dari 23
Meja 2 menunjukkan hasil klasifikasi MP/PP, dalam hal tingkat akurasi, mengevaluasi database
yang dijelaskan di Bagian 4.1. Hasil yang diberikan oleh UPER, dengan mempertimbangkan tiga versi
pengklasifikasi (SVM, KNN, dan ELM), diperoleh dengan menerapkan skema validasi silang LOO seperti
yang dijelaskan sebelumnya di Bagian4.4. Hasil melaporkan bahwa metode yang diusulkan memberikan
hasil klasifikasi MP/PP terbaik secara keseluruhan dibandingkan dengan UPER dengan
mempertimbangkan semua metrik yang dievaluasi. Berfokus pada tingkat akurasi yang berbeda, berikut
ini dapat diamati:
• peningkatan, dalam hal ACCG, dari metode yang diusulkan adalah sekitar 8,25% UPER
(SVM), 12% UPER (KNN), dan 10,5% UPER (ELM).
• peningkatan, dalam hal ACCP, dari metode yang diusulkan adalah sekitar 4% UPER
(SVM), 7,1% UPER (KNN), dan 5,5% UPER (ELM).
• peningkatan, dalam hal ACCM, dari metode yang diusulkan adalah sekitar 12,5% UPER
(SVM), 17% UPER (KNN), dan 15,5% UPER (ELM).
• peningkatan, dalam hal ACCM1, dari metode yang diusulkan adalah sekitar 5% UPER
(SVM), 10% UPER (KNN), dan 8% UPER (ELM).
• peningkatan, dalam hal ACCM2, dari metode yang diusulkan adalah sekitar 20% UPER
(SVM), 24% UPER (KNN), dan 23% UPER (ELM).
Meja 2. Perbandingan hasil ACC antara metode yang diusulkan dan UPER.
algoritma ACCG ACCP ACCM ACCM1 ACCM2

Metode yang Diusulkan 92% 91,5% 92,5% 91% 94%
UPER (SVM) [7] 83,75% 87,5% 80% 86% 74%
UPER (KNN) [7] 80% 84,4% 75,5% 81% 70%
UPER (ELM) [7] 81,5% 86% 77% 83% 71%
Keuntungan utama UPER adalah hanya menggunakan satu fitur (nilai PER) untuk
membedakan antara wheezing MP dan PP. Seperti yang ditunjukkan pada Tabel2,
pengklasifikasi SVM memperoleh kinerja klasifikasi terbaik dalam metode UPER. Secara
spesifik, SVM pengklasifikasi mencapai peningkatan sebesar 2,25% (KNN) dan 1,5% (KNN),
dalam halACCG. Hasil ini konsisten dengan yang diperoleh oleh penulis di [7],
mengkonfirmasikan bahwa pengklasifikasi SVM dengan kernel RBF memperoleh kinerja
klasifikasi terbaik ketika jumlah fitur (hanya satu nilai PER) kecil [88].
Melakukan analisis empiris dari metode yang diusulkan dan UPER, pengamatan
berikut diekstraksi:
(i) Karena masalah tumpang tindih waktu-frekuensi, suara pernapasan normal sering kali
menutupi suara mengi, menyembunyikan informasi medis yang relevan [5]. Sementara
metode yang diusulkan (berdasarkan CL-RNMF) memungkinkan menghilangkan sebanyak
mungkin gangguan akustik dari suara pernapasan normal, metode UPER didasarkan pada
fitur PER yang diperoleh dari energi sub-band dari koefisien wavelet, sehingga keberadaan
Suara pernapasan normal mengganggu pemilihan sub-pita optimal yang benar-benar
termasuk dalam komponen mengi.
(ii) Metode UPER memiliki lebih banyak kesulitan dalam membedakan antara PP dan MP mengi
yang disusun oleh puncak basal dan harmoniknya karena mencapai kinerja terburuk dalam
hal ACCM2. Alasannya adalah karena UPER didasarkan pada energi dan mengabaikan lokasi
spektral komponen yang memodelkan perilaku harmonik dari mengi MP. Hasil dalam Tabel2
menyarankan bahwa klasifikasi MP/PP berdasarkan lokasi spektral dari struktur harmonik
seperti yang terjadi pada metode yang diusulkan lebih dapat diandalkan daripada
penggunaan energi komponen spektral mengi, seperti yang terjadi pada UPER.
Skema validasi silang LOO tidak menunjukkan ketergantungan yang dimiliki pengklasifikasi
dengan ukuran set segmen pelatihan, karena skema ini selalu menggunakan satu segmen sebagai set
validasi dan segmen lainnya sebagai set pelatihan. Untuk alasan ini, kami mengusulkan untuk
menggunakan skema validasi silang PUT dengan memvariasikan ukuran set segmen pelatihan. NS
Skema PUT membutuhkan pelatihan dan validasi model Cn P kali, dimana n adalah nomornya
Sensor 2021, 21, 1661 18 dari 23
segmen yang menyusun database, P adalah jumlah segmen validasi, dan Cn P adalah
koefisien binomial. Akibatnya, biaya komputasi yang terkait bisa menjadi berlebihan. Untuk
mengatasi masalah ini, kami membatasi jumlah iterasi skema PUT menjadi 500. Selanjutnya,
jumlah wheezing MP dan PP yang sama dipilih untuk set pelatihan dan validasi di setiap iterasi.
Secara khusus, kami menggunakan empat skema PUT: (i)P = 80 menggunakan 80% dari total
segmen sebagai set pelatihan di setiap iterasi; (ii)P = 160 menggunakan 60% dari total segmen
sebagai set pelatihan di setiap iterasi; (aku aku aku)P = 240 menggunakan 40% dari total segmen
sebagai set pelatihan di setiap iterasi; dan (iv)P = 320 menggunakan 20% dari total segmen
sebagai set pelatihan di setiap iterasi. Mempertimbangkan semua instruksi yang dijelaskan di atas,
Tabel3 menunjukkan hasil klasifikasi MP/PP, dalam hal ACCG, diperoleh oleh UPER menggunakan
tiga versi pengklasifikasinya (SVM, KNN, dan ELM) untuk menilai ketergantungannya pada ukuran
set pelatihan. Membandingkan skema LOO dengan skema PUT (P = 320), ituACCG penurunan
kinerja klasifikasi sekitar 7,5% (SVM), 8,25% (KNN), dan 6,25% (ELM). Hasil melaporkan bahwa fitur
PER memungkinkan pembedaan antara wheezing MP dan PP bahkan ketika ukuran set pelatihan
dikurangi. Selain itu, pengklasifikasi ELM menunjukkan ketergantungan yang lebih kecil pada
ukuran database pelatihan dibandingkan dengan SVM dan KNN.
Tabel 3. Hasil perbandingan, dalam hal ACCG, antara tiga versi pengklasifikasi (SVM, KNN, dan
ELM) dari metode UPER menggunakan empat skema validasi silang Leave-p-Out (LPO).
Skema Perlengkapan latihan Validasi Set SVM KNN ELM

LO 399 (99,75%) 1 (0,25%) 83,75% 80% 81,5%
PUT (P = 80) 320 (80%) 80 (20%) 81,5% 79,25% 80%
PUT (P = 160) 240 (60%) 160 (40%) 80,5% 77,75% 79,5%
PUT (P = 240) 160 (40%) 240 (60%) 78,25% 74,75% 77,25%
PUT (P = 320) 80 (20%) 320 (80%) 76,25% 71,75% 75,25%
5. Kesimpulan dan Pekerjaan Masa Depan
Dalam makalah ini, kami menyajikan pendekatan baru Constrained Low-rank Non-
negative Matrix Factorization (CL-RNMF) untuk mengklasifikasikan suara mengi monofonik
dan polifonik menurut struktur harmoniknya. Kontribusi pertama dari karya ini mengusulkan
kerangka kerja CL-RNMF yang memungkinkan penggalian pola spektral yang mencirikan
suara mengi dengan gangguan seminimal mungkin dari suara pernapasan normal. Secara
khusus, konfigurasi peringkat rendah dengan jumlah basis mengi yang berkurang disajikan
untuk memadatkan komponen frekuensinya dalam jumlah basis sesedikit mungkin untuk
analisis posteriornya. Selain itu, CL-RNMF menggunakan serangkaian batasan untuk
memodelkan perilaku spektro-temporal dari mengi dan suara pernapasan normal. Sejauh
pengetahuan penulis, pendekatan faktorisasi matriks nonnegatif belum pernah diterapkan
sebelumnya pada klasifikasi mengi MP/PP. Kontribusi kedua menganalisis struktur harmonik
distribusi energi dari perkiraan spektogram mengi yang disediakan oleh CL-RNMF untuk
menentukan jenis mengi, memungkinkan klasifikasi yang lebih efisien berdasarkan lokasi
komponen frekuensi mengi, daripada energi komponennya .
Kesimpulan yang paling relevan dari hasil eksperimen menunjukkan hal berikut:
(i) metode yang diusulkan memberikan kinerja keseluruhan terbaik yang terkait dengan klasifikasi mengi
MP/PP dibandingkan dengan metode paling mutakhir yang paling relevan; (ii) tidak seperti kebanyakan
metode canggih berdasarkan pengklasifikasi, metode yang diusulkan adalah pendekatan tanpa
pengawasan (buta) yang tidak memerlukan pelatihan apa pun dari suara mengi; (iii) metode yang
diusulkan dapat menghilangkan sebagian besar gangguan dari suara pernapasan normal; (iv) tingkat
akurasi tertentu,ACCM dan ACCP, diperoleh dengan metode yang diusulkan tampaknya menunjukkan
kemampuan proposal untuk mengklasifikasikan suara mengi monofonik dan polifonik dengan benar.
Pekerjaan di masa depan akan difokuskan pada desain batasan baru, untuk diterapkan
dalam pendekatan NMF, yang meningkatkan pemodelan kejadian suara pernapasan frekuensi
waktu, menganalisis berbagai jenis suara tambahan, seperti mengi dan kresek. Objektif
Sensor 2021, 21, 1661 19 dari 23
Garis penelitian masa depan ini adalah untuk melakukan deteksi dini dan klasifikasi di antara
berbagai jenis suara adventif yang aktif dalam proses auskultasi untuk memaksimalkan
keandalan diagnosis yang dikeluarkan oleh dokter dalam kasus patologi penyakit paru-paru
yang disebabkan oleh penampilan. suara adventif seperti itu.
Kontribusi Penulis: Konseptualisasi, JDLTC, FJCQ, NRR, dan GPC; kurasi data, JDLTC dan FJCQ;
analisis formal, JDLTC, FJCQ, NRR, SGG, dan JJCO; penyelidikan,
JDLTC dan FJCQ; metodologi, JDLTC, FJCQ, dan NRR; perangkat lunak, JDLTC, FJCQ,
SGG, dan JJCO; supervisi, FJCQ, NRR, SGG, dan JJCO; validasi, JDLTC, FJCQ, dan GPC; visualisasi,
JDLTC; tulisan, draf asli, JDLTC, FJCQ, NRR, SGG, JJCO, dan GPC; penulisan, tinjauan dan
penyuntingan, JDLTC, FJCQ, NRR, SGG, dan JJCO Semua penulis telah membaca dan menyetujui
versi naskah yang diterbitkan.
Pendanaan: Pekerjaan ini didukung oleh Programa Operativo FEDER Andalucia 2014–2020 di bawah
proyek dengan Referensi 1257914 dan Kementerian Ekonomi, Pengetahuan dan Universitas, Junta de
Andalucia di bawah Proyek P18-RT-1994.
Pernyataan Dewan Peninjau Kelembagaan: Tak dapat diterapkan.
Pernyataan Persetujuan yang Diinformasikan: Tak dapat diterapkan.
Pernyataan Ketersediaan Data: Tak dapat diterapkan.
Konflik kepentingan: Para penulis menyatakan tidak ada konflik kepentingan.
Lampiran A. Ketentuan Aturan Update Multiplicative

Berikut adalah masing-masing istilah yang termasuk dalam aturan pembaruan perkalian untuk mendapatkan
matriks dasar BW:
[ ( ) ]-
∂DK L x|X ( )
= x X̂ AT W (A1)
∂BW
[ ( ) ]+
∂DKL x|X ( )
= [1]ATW (A2)
∂BW
[ ] ( )
∂ψ(BW) - √ BWF ,kw ΣFJ=1 BWJ,kw
= F (A3)
∂ BW (∑F )2
3
F ,k w J=1 B2WJ,kw
[
∂ψ(BW) ]+ 1
=√ (A4)
∂BW F ,kw 1 F 2
F ΣJ=1 BWJ,kw
matriks basis: BR:
[ ( ) ]-
∂DK xL|X ( )
= x X ATR (A5)
∂BR
[ ( ) ]+
∂DKL x|X ( )
= [1]ATR (A6)
∂BR
[ ] ( )
∂φ(BR) - (BR f−1,kr + BR F +1,kr )
= 2F +
∂BR F ,kR ΣFJ=1 BR2J,kr
(A7)
2FBR F ,k ΣFJ= 2(BR
R J,kr
- BRj−1,kr ) 2
+
(∑FJ=1 BR2 )2
J,kr
Sensor 2021, 21, 1661 20 dari 23
[ ]+ 4FBR F ,kr
∂φ(BR)
= (A8)
∂BR F ,kR ΣFJ=1 B2RJ,kr
Berikut adalah masing-masing istilah yang termasuk dalam aturan pembaruan perkalian untuk
mendapatkan matriks aktivasi AW:
[ ( ) ]-
∂DKL x|X ( )
= BTW x xˆ (A9)
∂A W
[ ( ) ]+
∂DKL x|xˆ ( )
= BW T [1] (A10)
∂AW
[( ) ]- ( )
∂φ AW (AWkw,untuk1 + AWkw,T+1 )
= 2T +
∂AW ΣTSaya=1 A2W
kw,T kw,Saya
(A11)
2TAWkw,T ΣT Saya= 2(AW - A Wkw,saya1 ) 2
+ kw,Saya
(∑TSaya=1 A 2 )2
Wkw,Saya
[
∂φ(AW) ]+ 4TA Wkw,T
= (A12)
∂AW kw,T ΣT 1 A2 Saya=
Wkw,Saya
matriks aktivasi AR:
[ ( ) ]-
∂DKL x|X ( )
= BTR x xˆ (A13)
∂AR
[ ( ) ]+
∂DKL x|xˆ ( )
= BT R[1] (A14)
∂A R
Referensi
1. Organisasi Kesehatan Dunia. Penyakit Pernafasan Kronis. Tersedia secara online:https://www.who.int/health-topics/chronicrespiratory-
diseases#tab=tab_1 (diakses pada 30 Desember 2020).
2. Organisasi Kesehatan Dunia, Asma. Tersedia secara online:https://www.who.int/news-room/fact-sheets/detail/asthma (diakses pada 30
Desember 2020).
3. Organisasi Kesehatan Dunia. Penyakit paru obstruktif kronis. Tersedia secara online:http://www.emro.who.int/healthtopics/
chronic-obstructive-pulmonary-disease-copd/index.html (diakses pada 30 Desember 2020).
4. Sarkar, M.; Madabhavi, saya.; Niranjan, N.; Dogra, M. Auskultasi sistem pernapasan.Ann. dada. Med.2015, 10, 158. [CrossRef] [
PubMed]
5. Pasterkamp, H.; Kraman, SS; Wodicka, GR Suara pernapasan: Maju melampaui stetoskop.NS. J. Pernafasan. Kritis. Perawatan Med.1997,
156, 974–987. [CrossRef]
6. Lozano-Garcia, M.; Fiz, JA; Martinez-Rivera, C.; Torrent, A.; Ruiz-Manzano, J.; Jane, R. Novel pendekatan analisis suara pernapasan
adventif terus menerus untuk penilaian respon bronkodilator.PLoS SATU 2017, 12, e0171455. [CrossRef]
7. Ulukaya, S.; Serbia, G.; Kahya, YP Klasifikasi tipe Wheeze menggunakan teknik rasio energi optimal berbasis transformasi wavelet non-
diadik.Hitung. Biol. Med.2019, 104, 175-182. [CrossRef] [PubMed]
8. Andrs, E.; Gas, R.; Charloux, A.; Brandt, C.; Hentzler, A. Analisis suara pernapasan di era kedokteran berbasis bukti dan dunia
kedokteran 2.0.J. Med. Kehidupan2018, 11, 89. [PubMed]
9. Torre-Cruz, J.; Canadas-Quesada, F.; Carabias-Orti, J.; Vera-Candeas, P.; Ruiz-Reyes, N. Pendekatan deteksi mengi baru
berdasarkan faktorisasi matriks non-negatif dibatasi.aplikasi akustik.2019, 148, 276–288. [CrossRef]
10. Leng, S.; San Tan, R.; Chai, KTC; Wang, C.; Ghista, D.; Zhong, L. Stetoskop elektronik.Bioma. Ind. On line2015, 14, 1-37. [CrossRef]
11. Sen, saya.; Saraclar, M.; Kahya, YP Perbandingan konfigurasi pengklasifikasi berbasis SVM dan GMM untuk klasifikasi diagnostik
suara paru.IEEE Trans. Bioma. Ind.2015, 62, 1768–1776. [CrossRef]
Sensor 2021, 21, 1661 21 dari 23
12. Salazar, AJ; Alvarado, C.; Lozano, FE Sistem pemisahan suara jantung dan paru-paru untuk aplikasi telemedicine store-and-
forward.Pdt. Ingenieria Univ. Antiok.2012, 64, 175-181.
13. Douros, K.; Grammeniatis, V.; Loukou, I. Crackles dan Suara Paru-Paru Lainnya. Di dalamSuara nafas; Penerbitan Internasional Springer:
Cham, Swiss, 2018; Bab 12; hal.225–236.
14. Lozano, M.; Fiz, JA; Jané, R. Diferensiasi otomatis dari suara pernapasan adventif normal dan berkelanjutan menggunakan dekomposisi
mode empiris ansambel dan frekuensi sesaat.IEEE J. Biomed. Informasi Kesehatan.2015, 20, 486–497. [CrossRef]
15. Rao, A.; Huynh, E.; Royston, TJ; Kornblith, A.; Roy, S. Metode akustik untuk diagnosis paru.IEEE Rev. Biomed. Ind.2018,12, 221–
239. [CrossRef]
16. Pramono, RXA; Bower, S.; Rodriguez-Villegas, E. Analisis suara pernapasan adventif otomatis: Tinjauan sistematis.PLoS SATU
2017, 12, e0177926. [CrossRef]
17. Rocha, BM; Pessoa, D.; Marques, A.; Carvalho, P.; Paiva, RP Klasifikasi Otomatis Suara Pernafasan Advent: Masalah (Tidak)
Terpecahkan?Sensor 2021, 21, 57. [CrossRef] [PubMed]
18. Jin, F.; Krishnan, S.; Sattar, F. Identifikasi dan ekstraksi suara adventif menggunakan fitur berbasis dominasi spektral temporal.
IEEE Trans. Bioma. Ind.2011, 58, 3078–3087 . [PubMed]
19. Gurung, A.; Scrafford, CG; Tielsch, JM; Levine, OS; Checkley, W. Analisis suara paru terkomputerisasi sebagai bantuan diagnostik untuk
mendeteksi suara paru abnormal: Tinjauan sistematis dan meta-analisis.bernafas. Med.2011, 105, 1396-1403. [CrossRef] [PubMed]
20. Sakai, T.; Kato, M.; Miyahara, S.; Kiyasu, S. Deteksi yang kuat dari suara paru tambahan dalam sinyal auskultasi elektronik. Dalam
Proceedings of the 21st IEEE International Conference on Pattern Recognition (ICPR2012), Tsukuba, Jepang, 11–15 November 2012;
hal. 1993–1996.
21. Liu, X.; Ser, W.; Zhang, J.; Astaga, DYT Deteksi suara paru tambahan menggunakan fitur entropi dan pengaturan ambang 2-D.
Dalam Prosiding Konferensi Internasional IEEE ke-10 2015 tentang Informasi, Komunikasi dan Pemrosesan Sinyal (ICICS),
Singapura, 2–4 Desember 2015; hal 1-5.
22. Matsutake, S.; Yamashita, M.; Matsunaga, S. Deteksi abnormal-respirasi dengan mempertimbangkan korelasi pengamatan
suara adventif. Dalam Prosiding Konferensi Pemrosesan Sinyal Eropa IEEE ke-23 2015 (EUSIPCO), Nice, Prancis, 31 Agustus–4
September 2015; hlm. 634–638.
23. Nakamura, N.; Yamashita, M.; Matsunaga, S. Deteksi pasien mempertimbangkan frekuensi pengamatan suara adventif terus menerus
dan terputus-putus dalam suara paru-paru. Dalam Proceedings of the 2016th Annual International Conference of the IEEE
Engineering in Medicine and Biology Society (EMBC), Orlando, FL, USA, 16–20 Agustus 2016; pp. 3457-3460 .
24. er, S.; Gengeç, . Klasifikasi dan analisis karakteristik non-stasioner dari suara tambahan paru-paru kresek dan ronchus.Angka.
Proses Sinyal.2014, 28, 18–27. [CrossRef]
25. Yamashita, M.; Himeshima, M.; Matsunaga, S. Klasifikasi kuat antara suara paru normal dan abnormal menggunakan model
suara tambahan dan suara jantung. Dalam Prosiding Konferensi Internasional IEEE 2014 tentang Akustik, Ucapan, dan
Pemrosesan Sinyal (ICASSP), Florence, Italia, 4–9 Mei 2014; pp. 4418-4422 .
26. Aykanat, M.; Klıç, .; Kurt, B.; Saryal, S. Klasifikasi suara paru-paru menggunakan jaringan saraf convolutional.EURASIP J. Proses Video
Gambar. 2017, 65, 1–9. [CrossRef]
27. Bardou, D.; Zhang, K.; Ahmad, SM Klasifikasi suara paru menggunakan jaringan saraf convolutional.Arti. Intel. Med.2018,88, 58–
69. [CrossRef]
28. Bu, Y.; Xu, X.; Li, Y. LungRN+NL: Peningkatan klasifikasi suara paru adventif menggunakan jaringan saraf resnet blok non-lokal
dengan augmentasi data campuran. Dalam Prosiding Interspeech 2020, Konferensi Tahunan ke-21 Asosiasi Komunikasi
Pidato Internasional, Acara Virtual, Shanghai, Tiongkok, 25–29 Oktober 2020; pp. 2902-2906 .
29. Demir, F.; Ismail, AM; Sengur, A. Klasifikasi Bunyi Paru-Paru Dengan Model CNN Menggunakan Parallel Pooling Structure.Akses IEEE
2020, 8, 105376–105383 . [CrossRef]
30. Sovijarvi, A.; Dalmasso, F.; Vanderschoot, J.; Malmberg, L.; Righini, G.; Stoneman, S. Definisi istilah untuk aplikasi suara
pernapasan.Eur. bernafas. Putaran.2000, 10, 597–610.
31. Meslier, N.; Charbonneau, G.; Racineux, J. Mengi.Eur. bernafas. J.1995, 8, 1942–1948. [CrossRef] [PubMed]
32. Baughman, RP; Loudon, RG Analisis suara paru-paru untuk evaluasi berkelanjutan dari obstruksi aliran udara pada asma.Dada 1985,88,
364–368. [CrossRef]
33. Cortes, S.; Jane, R.; Fiz, J.; Morera, J. Pemantauan durasi mengi selama respirasi spontan pada pasien asma. Dalam Proceedings
of the 27th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), Shanghai, China,
17–18 Januari 2006; hlm. 6141–6144 .
34. Qiu, Y.; Whittaker, A.; Lukas, M.; Anderson, K. Deteksi mengi otomatis berdasarkan pemodelan pendengaran.Prok. Inst. mekanisme Ind. Bagian H
J. Eng. Med.2005, 219, 219–227. [CrossRef]
35. Zhang, J.; Ser, W.; Yu, J.; Zhang, T. Metode deteksi mengi baru untuk sistem pemantauan yang dapat dikenakan. Dalam Proceedings of
the IEEE International Symposium on Intelligent Ubiquitous Computing and Education, Chengdu, China, 15–16 Mei 2009; hal. 331–334.
36. Lin, BS; Wu, HD; Chen, SJ Deteksi mengi otomatis berdasarkan pemrosesan sinyal spektogram dan jaringan saraf propagasi
balik.J. Kesehatanc. Ind.2015, 6, 649–672. [CrossRef]
Sensor 2021, 21, 1661 22 dari 23
37. Kochetov, K.; Putin, E.; Azizov, S.; Skorobogatov, I.; Filchenkov, A. Deteksi mengi menggunakan jaringan saraf convolutional. Di dalam
Konferensi EPIA tentang Kecerdasan Buatan; Pegas: Cham, Swiss, 2017; hal.162-173.
38. Kandaswamy, A.; Kumar, CS; Ramanathan, RP; Jayaraman, S.; Malmurugan, N. Klasifikasi saraf suara paru-paru menggunakan
koefisien wavelet.Hitung. Biol. Med.2004, 34, 523–537. [CrossRef]
39. Le Cam, S.; Belgia, A.; Collet, C.; Salzenstein, F. Deteksi suara mengi menggunakan distribusi Gaussian umum multivariat. Dalam
Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, Taipei, Taiwan, 19-24 April 2009;
hal.541–544.
40. Wisniewski, M.; Zielinski, TP Metode deteksi nada suara untuk sistem pengenalan mengi. Dalam Proceedings of the IEEE 19th
International Conference on Systems, Signals and Image Processing (IWSSIP), Wina, Austria, 11–13 April 2012; hlm. 472–475.
41. Wisniewski, M.; Zielinski, TP Aplikasi gabungan amplop spektral audio dan indeks nada suara dalam sistem pemantauan e-asma.IEEE J. Biomed.
Informasi Kesehatan.2015, 19, 1009–1018. [CrossRef]
42. Chien, JC; Wu, HD; Chong, FC; Li, CI Deteksi mengi menggunakan analisis cepstral dalam model campuran gaussian. Dalam Prosiding
Konferensi Internasional Tahunan IEEE ke-29 dari IEEE Engineering in Medicine and Biology Society (EMBC), Lyon, Prancis, 22–26
Agustus 2007; hal. 3168–3171 .
43. Bahoura, M. Metode pengenalan pola yang diterapkan pada klasifikasi suara pernapasan menjadi kelas normal dan mengi. Hitung. Biol.
Med.2009, 39, 824–843. [CrossRef]
44. Bahoura, M.; Pelletier, C. Klasifikasi suara pernapasan menggunakan model campuran Gaussian. Dalam Prosiding Konferensi Kanada
IEEE tentang Teknik Elektro dan Komputer, Air Terjun Niagara, ON, Kanada, 2–5 Mei 2004; Jilid 3, hlm. 1309–1312.
45. Mayorga, P.; Druzgalski, C.; Morelos, R.; Gonzales, O.; Vidales, J. Acoustics berdasarkan penilaian penyakit pernapasan menggunakan
klasifikasi GMM. Dalam Prosiding Konferensi Internasional Tahunan IEEE Teknik IEEE dalam Kedokteran dan Biologi, Buenos Aires,
Argentina, 31 Agustus–4 September 2010; hlm. 6312–6316 .
46. Taplidou, SA; Hadjileontiadis, LJ Deteksi mengi berdasarkan analisis waktu-frekuensi suara nafas.Hitung. Biol. Med.2007, 37,
1073–1083. [CrossRef] [PubMed]
47. Jain, A.; Vepa, J. Analisis suara paru-paru untuk deteksi episode mengi. Dalam Prosiding Konferensi Internasional Tahunan IEEE
ke-30 dari IEEE Engineering in Medicine and Biology Society (EMBC), Vancouver, BC, Kanada, 20–25 Agustus 2008; hal. 2582–
2585 .
48. Mendes, L.; Vogiatzis, saya.; Perantoni, E.; Kaimakamis, E.; Chouvarda, saya.; Maglaveras, N.; Tsara, V.; Teixeira, C.; Carvalho, P.;
Henriques, J.; dkk. Deteksi mengi menggunakan tanda tangan mereka di ruang spektogram dan fitur musik. Dalam Prosiding
Konferensi Internasional Tahunan IEEE ke-37 dari IEEE Engineering in Medicine and Biology Society (EMBC), Milan, Italia, 25–29
Agustus 2015; pp. 5581-5584 .
49. Oletik, D.; Bilas, V. Deteksi mengi asma dari spektrum suara pernapasan yang dirasakan secara kompresif.IEEE J. Biomed. Informasi Kesehatan.
2018, 22, 1406–1414. [CrossRef]
50. Torre-Cruz, J.; Canadas-Quesada, F.; Garcia-Galán, S.; Ruiz-Reyes, N.; Vera-Candeas, P.; Carabias-Orti, J. Sebuah faktorisasi matriks non-
negatif semi-diawasi tonal terbatas untuk mengklasifikasikan ada / tidak adanya mengi pada suara pernapasan.aplikasi akustik.2020,
161, 107188. [CrossRef]
51. De La Torre Cruz, J.; Kanada Quesada, FJ; Carabias Orti, JJ; Vera Candeas, P.; Ruiz Reyes, N. Menggabungkan pendekatan rekursif melalui
faktorisasi matriks non-negatif dan sparitas indeks Gini untuk meningkatkan deteksi suara mengi yang andal.Sistem Pakar. aplikasi
2020, 147, 113212. [CrossRef]
52. Nagasaka, Y. Suara Paru-Paru pada Asma Bronkial. alergi. Int.2012, 61, 353–363. [CrossRef]
53. Mason, RC; Murray, JF; Nadel, JA; Gotway, MBBuku E-Book Kedokteran Pernapasan Murray & Nadel; Ilmu Kesehatan Elsevier:
Amsterdam, Belanda, 2015.
54. Taplidou, SA; Hadjileontiadis, LJ Analisis mengi menggunakan fitur spektral orde tinggi wavelet.IEEE Trans. Bioma. Ind.2010, 57,
1596–1610. [CrossRef]
55. Forgacs, P. Dasar fungsional suara paru. Dada 1978, 73, 399–405. [CrossRef]
56. Jacome, C.; Oliveira, A.; Marques, A. Suara pernapasan terkomputerisasi: Perbandingan antara pasien dengan PPOK stabil dan
eksaserbasi.klinik bernafas. J.2017, 11, 612–620. [CrossRef]
57. Hashemi, A.; Arabalibiek, H.; Agin, K. Klasifikasi suara mengi menggunakan wavelet dan jaringan saraf. Di dalamKonferensi
Internasional tentang Teknik dan Teknologi Biomedis; IACSIT Pers: Singapura, 2011; Jilid 11, hlm. 127-131.
58. Naves, R.; Barbosa, BH; Ferreira, DD Klasifikasi suara paru-paru menggunakan statistik tingkat tinggi: Pendekatan membagi-dan-
menaklukkan.Hitung. Metode Program Biomed.2016, 129, 12–20. [CrossRef]
59. Ulukaya, S.; Sen, aku.; Kahya, YP Sebuah metode baru untuk penentuan jenis mengi. Dalam Proceedings of the 23nd Signal Processing
and Communications Applications Conference (SIU), Malatya, Turki, 16–19 Mei 2015; hal. 2001–2004. [CrossRef]
60. Ulukaya, S.; Sen, aku.; Kahya, YP Ekstraksi fitur menggunakan analisis frekuensi waktu untuk diskriminasi mengi monofonik-polifonik.
Dalam Prosiding Konferensi Internasional Tahunan ke-37 2015 dari IEEE Engineering in Medicine and Biology Society (EMBC), Milan,
Italia, 25–29 Agustus 2015; hlm. 5412–5415 .
61. Lee, DD; Seung, HS Mempelajari bagian-bagian objek dengan faktorisasi matriks non-negatif.Alam 1999, 401, 788–791. [CrossRef] [
PubMed]
62. Lee, DD; Seung, HS Algoritma untuk faktorisasi matriks non-negatif.Adv. Inf. saraf Proses. Sistem2001, 23, 556–562.
Sensor 2021, 21, 1661 23 dari 23
63. Canadas-Quesada, F.; Ruiz-Reyes, N.; Carabias-Orti, J.; Vera-Candeas, P.; Fuertes-Garcia, J. Pendekatan faktorisasi matriks non-negatif berdasarkan
pengelompokan spektro-temporal untuk mengekstraksi suara jantung.aplikasi akustik.2017, 125, 7–19. [CrossRef]
64. Dia, N.; Fontecave-Jallon, J.; Gumery, PY; Rivet, B. Denoising sinyal Phonocardiogram dengan Faktorisasi Matriks Non-negatif yang
diinformasikan oleh Elektrokardiogram sinkron. Dalam Prosiding Konferensi Pemrosesan Sinyal Eropa IEEE ke-26 2018 (EUSIPCO),
Roma, Italia, 3–7 September 2018; hal 51–55.
65. Torre-Cruz, J.; Canadas-Quesada, F.; Vera-Candeas, P.; Montiel-Zafra, V.; Ruiz-Reyes, N. Pemisahan suara mengi berdasarkan
faktorisasi matriks non-negatif dibatasi. Dalam Proceedings of the 2018 10th International Conference on Bioinformatics and
Biomedical Technology, Amsterdam, Belanda, 18–24 Mei 2018; hal.18–24.
66. De La Torre Cruz, J.; Kanada Quesada, FJ; Ruiz Reyes, N.; Vera Candeas, P.; Carabias Orti, JJ Pemisahan Suara Wheezing
Berdasarkan Informed Inter-Segment Non-Negative Matrix Partial Co-Factorization.Sensor 2020, 20, 2679. [CrossRef]
67. Févotte, C.; Bertin, N.; Durrieu, JL Faktorisasi matriks nonnegatif dengan divergensi Itakura-Saito: Dengan aplikasi pada analisis
musik.Komputer Saraf. 2009, 21, 793–830. [CrossRef]
68. Liutkus, A.; Fitzgerald, D.; Badeau, faktorisasi matriks nonnegatif R. Cauchy. Dalam Prosiding IEEE Workshop on Applications of
Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, 18–21 Oktober 2015; hal 1-5.
69. Canadas-Quesada, FJ; Vera-Candeas, P.; Ruiz-Reyes, N.; Carabias-Orti, J.; Cabanas-Molero, P. Pemisahan suara perkusi/harmonik dengan
faktorisasi matriks non-negatif dengan batasan kehalusan/kerenggangan.EURASIP J. Audio Pidato Proses Musik.2014, 2014, 26. [
CrossRef]
70. Laroche, C.; Kowalski, M.; Papadopoulos, H.; Richard, G. Faktorisasi matriks non-negatif terstruktur untuk pemisahan sumber. Dalam
Prosiding Konferensi Pemrosesan Sinyal Eropa IEEE ke-23 2015 (EUSIPCO), Nice, Prancis, 31 Agustus–4 September 2015; hal. 2033–
2037.
71. Eggert, J.; Korner, E. Pengkodean jarang dan NMF. Dalam Proceedings of the 2004 IEEE International Joint Conference on Neural
Networks (IEEE Cat. No. 04CH37541), Budapest, Hongaria, 25–29 Juli 2004; Jilid 4, hlm. 2529–2533 .
72. Virtanen, T. Pemisahan sumber suara monaural dengan faktorisasi matriks nonnegatif dengan kriteria kontinuitas temporal dan
sparseness. IEEE Trans. Audio Pidato Lang. Proses.2007, 15, 1066–1074. [CrossRef]
73. Marxer, R.; Janer, J. Studi regularisasi dan kendala dalam pemisahan monaural drum berbasis NMF. Dalam Prosiding Konferensi
Internasional tentang Konferensi Efek Audio Digital (DAFx-13), Maynooth, Irlandia, 2–6 September 2013.
74. Kriteria Penonjolan Puncak Menurut Perangkat Lunak MATLAB. Tersedia secara online:https://es.mathworks.com/help/signal/ ref/
findpeaks.html?searchHighlight=findpeak&s_tid=doc_srchtitle#buff2uu (diakses pada 30 Desember 2020).
75. Rale Repositori. Tersedia secara online:http://www.rale.ca (diakses pada 30 Desember 2020).
76. Stetografi Sampel Suara Paru-Paru. Tersedia secara online:http://www.stetografi.com (diakses pada 30 Desember 2020).
77. Stetoskop Littmann 3m. Tersedia secara online:https://www.3m.com (diakses pada 30 Desember 2020).
78. Suara Napas Paru Universitas Negeri Tennessee Timur. Tersedia secara online:http://faculty.etsu.edu (diakses pada 30 Desember 2020).
79. Tantangan ICBHI 2017. Tersedia secara online:https://bhchallenge.med.auth.gr (diakses pada 30 Desember 2020).
80. Pusat Perawatan Lippincott. Tersedia secara online:https://www.nursingcenter.com (diakses pada 30 Desember 2020).
81. Stetoskop Digital Thinklabs. Tersedia secara online:https://www.thinklabs.com (diakses pada 30 Desember 2020).
82. Thinklabs Youtube. Tersedia secara online:https://www.youtube.com/channel/UCzEbKuIze4AI1523_AWiK4w (diakses pada 30 Desember
2020).
83. Emedicine/Medscape. Tersedia secara online:https://emedicine.medscape.com/article/1894146-overview#a3 (diakses pada 30
Desember 2020).
84. Sumber Daya E-Learning. Tersedia secara online:https://www.ers-education.org/e-learning/reference-database-of-respiratory-sounds. aspx
(diakses pada 30 Desember 2020).
85. Wiki Pernafasan. Tersedia secara online:http://respwiki.com/Breath_sounds (diakses pada 30 Desember 2020).
86. Auskultasi Mudah. Tersedia secara online:https://www.easyauscultation.com/lung-sounds-reference-guide (diakses pada 30 Desember
2020).
87. Universitas Negeri Colorado. Tersedia secara online:http://www.cvmbs.colostate.edu/clinsci/callan/breath_sounds.htm (diakses pada 30
Desember 2020).
88. Chang, CC; Lin, CJ LIBSVM: Pustaka untuk mendukung mesin vektor.ACM Trans. Intel. Sistem teknologi. (TIST)2011, 2, 1-27. [
CrossRef]

Mengi en Id

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Mengi en Id

Diunggah oleh

Hak Cipta:

Format Tersedia

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

Klasifikasi Wheezing Monophonic dan Polyphonic Berdasarkan

1 Departemen Teknik Telekomunikasi, Universitas Jaen, Campus Cientifico-Tecnologico de Linares, Avda.

Diterima: 25 Januari 2021

Catatan Penerbit: MDPI tetap netral

Sensor 2021, 21, 1661. https://doi.org/10.3390/s21051661 https://www.mdpi.com/journal/sensors

800 Mengi PP terdiri dari dua puncak yang

2. Latar Belakang Teoritis

arg min D(x|BA) B, A ≥ 0 (2)

Fungsi divergensi ini mengukur kesalahan yang dibuat dalam perkiraan

2.2. Keterbatasan Spektral

arg min D(x|BA) + αkanBkan1 B, A ≥ 0 (7)

di mana α adalah parameter bobot yang menyesuaikan pengaruh kendala.

2.3. Kehalusan Temporal/Spektral

arg min D(x|BA) + λφ(A) + βφ(B) B, A ≥ 0 (8)

3. Metode yang Diusulkan

Gambar 3. Flowchart dari metode yang diusulkan.

3.1. Representasi Sinyal Waktu-Frekuensi

Untuk menghindari nomenklatur yang rumit di seluruh makalah, variabel x selanjutnya

3.2. Tahap I: Faktorisasi Matriks Non-Negatif Peringkat Rendah Terkendala

x ≈ XR + XW = BRAR + BWAW (12)

Secara eksperimental, kami menemukan bahwa pendekatan CL-RNMF yang diusulkan

Angka 6 menunjukkan distribusi energi spektral ξ( F ) diperoleh untuk empat contoh

3.3. Panggung II: S . Harmonik Tanalisis struktur Saya

0.4 FP(2) batasz

Algoritma 2: Analisis struktur harmonik.

4. Hasil Eksperimen dan Pembahasan

400 segmen mengi

200 segmen mengi PP Segmen mengi 200 MP

100 MP mengi 100 MP mengi

Gambar 9. Skema jenis mengi yang terdapat dalam database.

4.2. Pengaturan eksperimen

4.3. Metrik Evaluasi

4.4. Metode Perbandingan Tercanggih

1 2 3 4 5 6 7 8 9 10 ..... 400 1 validasi

1 2 3 4 5 6 7 8 9 10 ..... 400 2 validasi

1 2 3 4 5 6 7 8 9 10 ..... 400 3 validasi

1 2 3 4 5 6 7 8 9 10 ..... 400 400 ℎ validasi

4.5. Hasil Akurasi

algoritma ACCG ACCP ACCM ACCM1 ACCM2

Skema Perlengkapan latihan Validasi Set SVM KNN ELM

5. Kesimpulan dan Pekerjaan Masa Depan

Pernyataan Dewan Peninjau Kelembagaan: Tak dapat diterapkan.

Pernyataan Persetujuan yang Diinformasikan: Tak dapat diterapkan.

Pernyataan Ketersediaan Data: Tak dapat diterapkan.

Konflik kepentingan: Para penulis menyatakan tidak ada konflik kepentingan.

Lampiran A. Ketentuan Aturan Update Multiplicative

Anda mungkin juga menyukai