Anda di halaman 1dari 7

Analisis tangisan bayi patologis menggunakan transformasi packet wavelet dan jaringan

syaraf probabilistik

info artikel

Kata kunci: Analisis akustik Bayi menangis


Wavelet packet transform Jaringan syaraf probabilistik

abstrak

Pendekatan baru telah disajikan berdasarkan transformasi paket wavelet dan jaringan saraf
probabilistik (PNN) untuk analisis sinyal tangisan bayi. Ekstraksi fitur dan pengembangan
algoritma klasifikasi memainkan peran penting di bidang analisis otomatis sinyal tangisan
bayi. Sinyal menangis bayi didekomposisi menjadi lima tingkat dengan menggunakan
transformasi wavelet packet. Langkah-langkah energi dan entropi diekstrak pada setiap
tingkat dekomposisi dan digunakan sebagai fitur untuk mengukur sinyal tangisan bayi. PNN
dikembangkan untuk mengklasifikasikan sinyal tangisan bayi ke normal dan patologis dan
dilatih dengan parameter penyebaran atau parameter pemulusan yang berbeda untuk
mendapatkan akurasi klasifikasi yang lebih baik. Hasil percobaan menunjukkan bahwa fitur
yang diusulkan dan algoritma klasifikasi memberikan akurasi klasifikasi yang sangat
menjanjikan sebesar 99% dan ini membuktikan bahwa metode yang diusulkan dapat
digunakan untuk membantu profesi medis untuk mendiagnosis status patologis bayi dari
sinyal menangis.

1. Perkenalan

Menangis adalah satu-satunya cara berkomunikasi untuk bayi. Dari tangisan tersebut, seorang
profesional terlatih dapat memahami status fisik atau psikis bayi tersebut. Bayi menangis
karena beberapa kemungkinan alasan seperti, kelaparan, nyeri, kantuk, ketidaknyamanan,
merasa terlalu panas atau terlalu dingin, dan terlalu banyak suara atau cahaya. Analisis
akustik sinyal tangisan bayi adalah alat yang tidak invasif dan telah terbukti untuk
mendeteksi kondisi patologis tertentu (García & García, 2003; Orozco & García, 2003;
Reyes-Galaviz & Reyes-Garcia, 2004; Reyes-Galaviz, Verduzco, Arch-Tirado, & Reyes-
García, 2005). Dalam beberapa tahun terakhir, teknik sederhana telah diajukan untuk
menganalisis tangisan bayi melalui pengkodean prediksi linier, koefisien kisi melintang
frekuensi dan informasi lapangan (García & García, 2003; Orozco & García, 2003; Reyes-
Galaviz & Reyes-Garcia, 2004; Reyes-Galaviz et al., 2005). Sedikit perhatian telah diberikan
oleh para peneliti berdasarkan wavelet dan wavelet packet transform. Makalah ini
menyajikan pengembangan sistem klasifikasi cerdas untuk mengklasifikasikan ratapan
normal dan patologis menggunakan wavelet packet transform (WPT) dan jaringan syaraf
probabilistik (PNN). Penerapan analisis transformasi wavelet dan wavelet diversifikasi dan
telah banyak digunakan dalam aplikasi pemrosesan sinyal dan gambar. Avci dan Avci telah
mengusulkan sebuah pendekatan baru untuk klasifikasi sinyal radio berdasarkan energi paket
wavelet dan mesin vektor pendukung multi kelas (Avci & Avci, 2008). Xian dan Zeng punya

mengusulkan metode diagnosa kesalahan yang cerdas pada mesin rotasi berdasarkan analisis
paket wavelet dan mesin vektor pendukung hibrida (Xian & Zeng, 2009). Wu dan Liu telah
mengusulkan sistem diagnosis kesalahan untuk mesin pembakaran dalam menggunakan
teknik wavelet packet transform (WPT) dan teknik jaringan syaraf tiruan (JST) (Wu & Liu,
2009). Wu dan Lin telah melakukan penyelidikan terhadap identifikasi pembicara
berdasarkan transformasi packet wavelet diskrit dengan dekomposisi tidak beraturan (Wu &
Lin, 2009). Hanbay dkk. telah mengusulkan sebuah metode untuk memprediksi kinerja
instalasi pengolahan air limbah berdasarkan dekomposisi paket wavelet dan jaringan syaraf
tiruan (Hanbay, Turkoglu, & Demir, 2008).

Pekerjaan sebelumnya

Bagian ini membahas beberapa karya penting mengenai analisis sinyal tangisan bayi. Reyes-
Galaviz dkk. telah mempresentasikan pengembangan pengenalan tangisan bayi otomatis
untuk identifikasi awal patologi dengan tujuan mengklasifikasikan tiga kelas, normal, akustik
hypo dan asfiksia (Reyes-Galaviz et al., 2005). Mereka menggunakan koefisien frekuensi
Mel cepstral (MFCCs) untuk ekstraksi fitur dan jaringan saraf tiruan Feed Forward Input
Delay dengan pelatihan berdasarkan Descent Gradient dengan adaptive back-propagation
untuk klasifikasi. Keakuratan sistem yang diusulkan bervariasi dari 96,08% menjadi 97,39%.
Orozco dan García telah mengembangkan sebuah metode yang didasarkan pada teknik
prediksi linier dan jaringan saraf gradien konjugasi berskala untuk mendeteksi patologi dari
tangisan bayi. Keakuratan klasifikasi metode yang diusulkan adalah 91,08% untuk 314
sampel dan 86,20% untuk

1036 sampel (Orozco & García, 2003). Dalam studi lain, penulis yang sama menggunakan
teknik pengkodean prediksi MFCC dan linier untuk menandai sinyal tangisan bayi dan
menggunakan jaringan syaraf umpan balik untuk klasifikasi dengan beberapa metode
pembelajaran (García & García, 2003). Keakuratan sistem yang diusulkan sampai dengan
97,43%. Várallyay dkk. telah mengusulkan pendeteksian frekuensi dasar dengan metode
spektrum smoothed (SSM) untuk analisis sinyal tangisan bayi (Várallyay, Benyó, Illényi,
Farkas, & Kovács, 2004). Dari karya sebelumnya, telah diamati bahwa ekstraksi fitur
memainkan peran penting dalam area deteksi otomatis teriakan patologis. Dalam makalah ini,
metode yang didasarkan pada transformasi paket wavelet diusulkan untuk menganalisis
sinyal tangisan bayi. Tangisan bayi adalah sinyal yang terdekomposisi menjadi lima tingkat.
Fitur energi dan entropi dihitung dari koefisien paket wavelet dan digunakan untuk
mengkarakterisasi sinyal tangisan bayi. Untuk menguji keefektifan energi paket wavelet dan
fitur enkapsulasi, jaringan saraf probabilistik digunakan. Hasil percobaan menjelaskan bahwa
fitur paket wavelet dan penyusun PNN dapat digunakan untuk mendeteksi kondisi patologis
tertentu dari tangisan bayi secara medis.
Sinopsis dari makalah ini adalah sebagai berikut: Bagian 2 membahas penjelasan singkat
tentang database cryo bayi yang digunakan dalam karya ini. Bagian 3 membahas pengenalan
desain paket subband paket wavelet dan ekstraksi fitur energi dan entropi Shannon.
Pengenalan singkat klasifikasi PNN dijelaskan pada Bagian 4. Pada Bagian 5, kesimpulan
dari hasil pengklasifikasian PNN dipresentasikan dan ini menunjukkan kegunaan fitur paket
wavelet. Akhirnya, Bagian 6 membahas kesimpulan dan saran untuk pekerjaan masa depan.

2. Pemilihan data

Database tangisan bayi diunduh dari situs web http://ingenieria.uatx.mx/orionfrg/cry/ yang


disebut basis data Baby Chillanto dan merupakan milik Instituto Nacional de Astrofisica
Opti- ca y Electronica (INAOE) - CONACYT , Meksiko. Database ini dijelaskan di Reyes-
Galaviz, Cano-Ortiz, Reyes-García, Electrónica, dan Puebla (2009). Dari situlah, 340
tangisan normal dan 340 tangisan sistematis dengan asfiksia digunakan untuk analisis kami.
Panjang sinyal isyarat adalah 1 detik. Asfiksia didefinisikan sebagai kegagalan bernafas
dengan baik dalam 1 menit setelah melahirkan bayi. Penyakit ini dapat menyebabkan
kerusakan pada otak, organ dan jaringan atau bahkan kematian jika mengalami perawatan
yang tertunda atau tidak tepat. Frekuensi pengambilan sampel sinyal menangis adalah 16.000
Hz untuk analisis kami.

3. Desain filter paket wavelet

pita frekuensi (koefisien aproksimasi) dan pita frekuensi lebih tinggi (koefisien detil). Band
frekuensi rendah digunakan untuk dekomposisi lebih lanjut. Oleh karena itu, DWT memberi
struktur pohon biner rekursif kiri. Dalam prosedur dekomposisi wavelet packet (WP), band
frekuensi rendah dan lebih tinggi didekomposisi menjadi dua sub-band. Dengan demikian
paket wavelet memberikan struktur pohon biner yang seimbang. Di pohon, masing-masing
subruang diindeks oleh kedalamannya i dan jumlah subruang hal. Dua basa wavelet ortogonal
pada nodus paragraf (i, p) diberikan oleh bentuk berikut (Burrus & Haitao Guo, 1998;
Raghuveer & Rao, 1998)

dimana h [n] adalah filter high pass (wavelet). Paket wavelet decom-
Posisi membantu partisi sisi frekuensi tinggi menjadi pita yang lebih kecil yang tidak dapat
dicapai dengan menggunakan transformasi wavelet diskrit umum. Koefisien dekomposisi
kedalamannya dapat dicapai pada tingkat (i 1), akhirnya kita bisa mendapatkan koefisien dari
semua tingkatan melalui analogi sekuensial. Setelah didekomposisi oleh kedalamannya,
rentang frekuensi semua subruang pada kedalamannya diberikan sebagai [0, fs / 2i + 1], [fs /
2i + 1, 2fs / 2i + 1], .., [ (2i - 1) fs / 2i + 1, fs / 2], dimana fs adalah frekuensi sampling.
Dalam makalah ini, sinyal tangisan bayi didekomposisi sampai lima tingkat. Tabel 1
merangkum pita frekuensi dari setiap tingkat yang telah didekomposisi. Dalam analisis kami,
frekuensi sampling fs adalah 16.000 Hz.
Sinyal tangisan diambil sampelnya pada 16 kHz yang memberi sinyal pita lebar 8 kHz.
Sinyal menangis disaring dengan filter paket wavelet dan empat perintah wavelet Daubechies
yang berbeda db1, db4, db10 dan db20 digunakan. Dalam karya ini, wavelet Daubechies
telah dipilih karena sifat berikut (Cohen, Daubechies, & Feauveau, 2006): invarian waktu -
jika deret waktunya bergeser maka koefisien paket wavelet hanya waktu bergeser. Komposisi
cepat - Daubechies wavelet memiliki sifat kemiripan mirip fraktal yang menghasilkan teknik
transformasi wavelet cepat. Band transisi filet Sharp - Wavelet Daubechies memiliki pita
transisi yang sangat tajam yang meminimalkan efek tepi di antara pita frekuensi. Energi dan
entropi Shannon dihitung dengan menggunakan koefisien paket wavelet bekas dalam
penelitian ini. Enzim subband dapat dihitung dengan menggunakan koefisien paket wavelet
yang diekstraksi dengan Persamaan berikut. (3)

Bagian ini menjelaskan secara singkat perancangan filter paket wavelet dan ekstraksi fitur
yang menggunakannya.
Paket wavelet

Dalam prosedur dekomposisi wavelet transformer diskrit, sinyal didekomposisi menjadi dua
pita frekuensi seperti di bawah
Tabel 1
Band frekuensi tiap level.

Dimana P adalah indeks skala, n mewakili jumlah tingkat dekomposisi.


Entropi dapat digunakan sebagai ukuran umum untuk mengukur pola irregular dari sinyal
infantri patologis. Ukuran dari
Entropi Shannon dapat dihitung dengan menggunakan koefisien wavelet-packet yang
diekstraksi, melalui Persamaan berikut. (4)

Dimana P adalah indeks skala, n mewakili jumlah tingkat dekomposisi.


Gambar. 1a dan 1b menunjukkan dua tingkat paket wavelet dekompo-
Sisi isyarat tangisan yang berhubungan dengan normal dan bayi

dengan asfiksia. Dari angka-angka itu, tidak mudah bagi kita untuk membedakan antara dua
isyarat tangis. Oleh karena itu, dua parameter digunakan probabilitas, unit output
menghasilkan 1 untuk kelas itu dan kelas 0 untuk kelas lainnya dengan menggunakan fungsi
transfer yang bersaing.
Jaring dapat digunakan untuk klasifikasi segera setelah contoh pola dari masing-masing dua
kelas telah dipresentasikan kepadanya. Bagaimana untuk mengukur koefisien paket wavelet
seperti energi dan entropi.
Database fitur dibuat, setelah perhitungan ukuran entropi dari masing-masing koefisien paket
wavelet subband dan digunakan sebagai fitur masukan untuk pengklasifikasi untuk
membedakan sinyal menangis seperti normal atau patologis. Diagram blok ekstraksi fitur dan
tahap klasifikasi ditunjukkan pada Gambar 2.

4. Jaringan syaraf probabilistik

Jaringan syaraf tiruan banyak digunakan dalam identifikasi pola dan masalah klasifikasi
dengan belajar dari contoh. Paradigma jaringan syaraf yang berbeda tersedia untuk
mengklasifikasikan pola. Dalam karya ini, struktur PNN digunakan untuk mengklasifikasikan
tangisan normal dan patologis. Specht telah mengusulkan jaring bersih probabilistik
berdasarkan klasifikasi Bayesian dan estimator klasik untuk fungsi kepadatan probabilitas
(Specht, 1990). PNN terdiri dari empat unit, seperti unit input, unit pola, unit penjumlahan
dan unit output. Semua unit saling terkait dan unit patron diaktifkan oleh fungsi eksponensial,
bukan fungsi aktivasi sigmif. Unit pola menghitung jarak dari vektor input ke vektor masukan
pelatihan, ketika sebuah input diberikan, dan menghasilkan sebuah vektor yang elemen-
elemennya menunjukkan seberapa dekat input ke input pelatihan. Unit penjumlahan
merangkum kontribusi ini untuk setiap kelas input dan menghasilkan output bersih yang
merupakan vektor probabilitas. Dari jumlah maksimal ini
PNN menggeneralisasi dengan baik karena dilatih dengan lebih banyak contoh. Variasi
parameter pemulusan (r) memberikan kontrol atas tingkat nonlinier dari batas keputusan
untuk jaring. Sebuah batas keputusan mendekati sebuah hyperplane untuk nilai r yang besar
dan mendekati permukaan keputusan yang sangat nonlinear dari classifier tetangga terdekat
untuk nilai r kecil yang mendekati nol. Dalam tulisan ini, arsitektur PNN dibangun dengan
menggunakan newpnn () pada fungsi MATLAB. Informasi rinci tentang arsitektur PNN dan
persamaan matematis dapat ditemukan di kertas Specht (Specht, 1990).

5. Kesimpulan

Dalam penelitian ini, validasi konvensional dilakukan untuk mengevaluasi keefektifan fitur
yang diajukan. 680 segmen (340 norem + 340 patologis) dari sinyal menangis digunakan. Di
antara mereka, 60% data (408 sampel) digunakan untuk pelatihan dan 40% data tersisa (272
sampel) digunakan untuk pengujian. PNN dilatih dengan parameter spread factor atau
smoothing yang berbeda seperti dari 0,001 sampai 0,009 dan 0,01 sampai 0,09. Padahal,
jaringan dilatih dengan faktor penyebaran yang berbeda, hanya hasil akurasi terbaik yang
dipresentasikan. Untuk menguji kinerja pengklasifikasi, beberapa langkah seperti sensitivitas,
spesifisitas, dan akurasi keseluruhan dipertimbangkan. Sensitivitas, spesifisitas dan ketepatan
keseluruhan dihitung dari ukuran true positive (TP), true negative (TN), false positive (FP),
dan false negative (FN) seperti yang disajikan pada Tabel 2.

TP = benar positif, pengklasifikasi diklasifikasikan sebagai patologi (Asphyia) bila ada


sampel patologis.
TN = benar negatif, pengklasifikasi diklasifikasikan sebagai normal ketika sampel normal
hadir.
FN = negatif palsu, pengklasifikasi diklasifikasikan sebagai normal bila sampel patologis ada.
FP = false positive, pengklasifikasi diklasifikasikan sebagai patologis bila sampel normal ada.
Sensitivitas = TP / (TP + FN).

Spesifisitas = TN / (TN + FP).


Akurasi keseluruhan = (TP + TN) / (TP + TN + FP + FN).

Tabel 3-6 menunjukkan hasil PNN untuk 'db1', 'db4', 'db10', dan 'db20' dengan fitur energi
dan entropi. Dari tabel, ditemukan bahwa meningkatkan tingkat dekomposisi paket wavelet
menyebabkan ekstraksi kelompok vektor fitur yang lebih dominan, sehingga meningkatkan
akurasi klasifikasi. Akurasi klasifikasi tertinggi dicapai pada tingkat kelima dekokulasi paket
wavelet. Dari Tabel 3, persentase peningkatan akurasi klasifikasi adalah 12% untuk fitur
energi dan 17% untuk fitur entropi pada tingkat kelima dekomposisi. Keakuratan keseluruhan
terbaik adalah 95,07% untuk fitur energi dan 96,36% untuk fitur entropi. Dari Tabel 4,
persentase peningkatan akurasi klasifikasi 15% untuk fitur energi dan 23% untuk fitur
entropi. Untuk Daubechies wavelet 'db4', fitur entropi tampil lebih baik daripada energi
fitur. Dari Tabel 5, persentase peningkatan akurasi klasifikasi adalah 17% untuk fitur energi
dan 23% untuk fitur entropi. Untuk 'db10, kedua fitur tersebut sama-sama berkinerja baik
pada tahap kelima dekomposisi. Dari Tabel 6, persentase peningkatan akurasi klasifikasi
adalah 12% untuk fitur energi dan 15% untuk fitur enkapsulasi. Jumlah fitur pada tingkat
kelima dekomposisi adalah 32. Semua 32 fitur digunakan untuk memberikan representasi
sinyal menangis yang lebih baik. Dari pembahasan di atas, dapat diamati bahwa akurasi
klasifikasi maksimum dapat diamati terlepas dari urutan wavelet Daubechies yang berbeda.
Dalam tulisan ini, pengenalan pola dua kelas dilakukan seperti sinyal tangisan normal atau
patologis. Pada Bagian 2, beberapa karya penting dilaporkan dan akurasi klasifikasi
maksimum 97,43% diperoleh. Pada tingkat kelima dekomposisi wavelet, akurasi klasifikasi
maksimum 99,49% untuk 'db20' diperoleh dan ini menunjukkan bahwa fitur yang diusulkan

dan algoritma klasifikasi memberikan klasifikasi yang lebih baik dibandingkan dengan karya
sebelumnya. Akhirnya, hasil eksperimen menunjukkan bahwa fitur yang diusulkan memiliki
potensi dalam mendeteksi masalah patologi pada bayi dari sinyal menangis.

6. Kesimpulan

Makalah ini menyajikan analisis sinyal tangisan bayi berdasarkan transformasi paket wavelet
dan PNN. Sinyal tangisan bayi didekomposisi menjadi lima tingkat. Pada setiap tingkat, fitur
energi dan entropi diekstraksi menggunakan koefisien paket wavelet. Efek dari fitur yang
diusulkan diuji pada setiap tingkat dekomposisi sinyal menangis. Sensitivitas, spesifisitas,
dan akurasi keseluruhan digunakan sebagai ukuran kinerja, untuk menguji reliabilitas
pengklasifikasi PNN. Keakuratan klasifikasi maksimum 99% diperoleh pada tingkat kelima
dekomposisi. Hasil klasifikasi menunjukkan bahwa metode yang diusulkan dapat digunakan
sebagai alat yang berharga untuk diagnosis klinis sinyal tangisan bayi.

Ucapan Terima Kasih

Baby Chillanto Data Base adalah milik Instituto Nac- deional Astrofisika Optica y
Electronica - CONACYT, Mexico. Kami mengucapkan terima kasih kepada Dr. Carlos A.
Reyes-Garcia, Dr. Emilio Arch-Tirado dan kelompok INR-Mexico-nya, dan Dr. Edgar M.
Garcia-Tamayo atas dedikasinya atas pengumpulan basis data Bayi Cry. Penulis ingin
mengucapkan terima kasih kepada Dr. Carlos Alberto Reyes-Garcia, Peneliti, CCC-Inaoep,
Meksiko karena telah menyediakan database bayi menangis.

Anda mungkin juga menyukai