МЕТОД ОПТИМІЗАЦІЇ БАЗОВОЇ ВЕЙВЛЕТ-ФУНКЦІЇ ЗА КРИТЕРІЄМ МІНІМІЗАЦІЇ ПОМИЛКИ АПРОКСИМАЦІЇ МОВНИХ СИГНАЛІВ
DOI:
https://doi.org/10.18372/2310-5461.67.20244Ключові слова:
мовні сигнали, адаптивні вейвлет-ознаки розпізнавання мови, мінімізація помилки апроксимації, метод опорних векторів, генетичний алгоритм, вейвлет-перетворення, оптимізація вейвлет-функціїАнотація
В роботі представлено розроблений метод виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів на основі оптимізації базової вейвлет-функції за критерієм мінімізації помилки апроксимації. Для побудови базової вейвлет-функції було запропоновано використовувати генетичний алгоритм, у якому в якості цільової функції виступає точність класифікації мовних сигналів методом опорних векторів. Головною перевагою побудованої адаптивної вейвлет-функції за допомогою запропонованого методу є той факт, що вона враховує динаміку мовного сигналу впродовж всього часу, оскільки на кожному масштабі будується вейвлет-функція, яка залежить від усього сигналу та містить у собі інформацію про всі його зміни, що безпосередньо впливає на покращення роздільної здатності вейвлет-ознак розпізнавання мови. Аналіз мовних сигналів запропонованим методом буде складатися із наступних кроків: 1) визначення метакласу мовного сигналу; 2) вибір оптимальної пари «адаптивна вейвлет-функція - класифікатор»; 3) вейвлет-аналіз мовного сигналу з використанням побудованої адаптивної вейвлет-функції; 4) підсумкова класифікація адаптивних вейвлет-ознак розпізнавання мовних сигналів. Показано, що використання базових вейвлет-функцій, згенерованих на основі представленого методу для виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів дає змогу отримати стійке підвищення точності класифікації. Зокрема, в порівнянні з мел-частотними кепстральними коефіцієнтами покращення точності становить від 4.1 до 8.3 % для різних фонем української мови. Показано, що згенерована адаптивна вейвлет-функція має властивість збереження інформації про динамічні процеси в мовному сигналі, і, як наслідок, у 1.5 рази скорочується розмірність адаптивних вейвлет-ознак розпізнавання без втрати точності класифікації. Показано, що використання запропонованого методу дає змогу досягти кращих характеристик класифікації фонем мови, ніж з використанням класичного аналізу на основі мел-частотних кепстральних коефіцієнтів у 1.4 рази.
Посилання
K. T. Shivaram, N. Mahesh Kumar, M. Anusha and B. S. Manohar, “The optimal numerical wavelet based integration of probability density function by chebyshev wavelet method,” 2019 International Conference on Intelligent Computing and Control Systems (ICCS), Madurai, India, 2019, pp. 175-177, doi: 10.1109/ICCS45141.2019.9065515.
K. Geetha and M. K. Hota, “Seismic Random Noise Attenuation Using Optimal Empirical Wavelet Transform With a New Wavelet Thresholding Technique,” in IEEE Sensors Journal, vol. 24, no. 1, pp. 596-606, 1 Jan.1, 2024, doi: 10.1109/JSEN.2023.3334819.
C. Candemir, “Selection of Wavelet Based Optimal Denoising Method in fMRI Signals,” 2020 Innovations in Intelligent Systems and Applications Conference (ASYU), Istanbul, Turkey, 2020, pp. 1-5, doi: 10.1109/ASYU50717.2020.9259816.
O. Lavrynenko, B. Chumachenko, M. Zaliskyi, S. Chumachenko and D. Bakhtiiarov, “Method of Remote Biometric Identification of a Person by Voice based on Wavelet Packet Transform,” CEUR Workshop Proceedings, 2024, vol. 3654, pp. 150-162.
G. Yang, Y. Song and J. Du, “Speech Signal Denoising Algorithm and Simulation Based on Wavelet Threshold,” 2022 4th International Conference on Natural Language Processing (ICNLP), Xi'an, China, 2022, pp. 304-309, doi: 10.1109/ICNLP55136.2022.00055.
O. Lavrynenko, D. Bakhtiiarov, V. Kurushkin, S. Zavhorodnii, V. Antonov and P. Stanko, “A method for extracting the semantic features of speech signal recognition based on empirical wavelet transform,” Radioelectronic and Computer Systems, 2023, vol. 107, no. 3, pp. 101-124. doi: 10.32620/reks.2023.3.09.
Y. Tverdokhlib and V. Dubrovin, “Research on Wavelet Filter Features for Nonstationary Signals,” 2019 IEEE International Scientific-Practical Conference Problems of Infocommunications, Science and Technology (PIC S&T), Kyiv, Ukraine, 2019, pp. 785-788, doi: 10.1109/PICST47496.2019.9061501.
O. Veselska, O. Lavrynenko, R. Odarchenko, M. Zaliskyi, D. Bakhtiiarov, M. Karpinski and S. Rajba, “A Wavelet-Based Steganographic Method for Text Hiding in an Audio Signal,” Sensors, 2022, vol. 22, no. 15, pp. 1-25. doi: 10.3390/s22155832.
H. Xiao, D. Hu and J. Wang, “Threshold selection of wavelet denoising based on optimization algorithms,” 2022 International Conference on Innovations and Development of Information Technologies and Robotics (IDITR), Chengdu, China, 2022, pp. 88-92, doi: 10.1109/IDITR54676.2022.9796485.
S. Sun, Y. Sun, Y. Li, S. Ma, L. Zhang and Y. Hu, “An Adaptive Wavelet Multilevel Soft Threshold Algorithm for Denoising Partial Discharge Signals,” 2019 IEEE Sustainable Power and Energy Conference (iSPEC), Beijing, China, 2019, pp. 1874-1878, doi: 10.1109/iSPEC48194.2019.8975273.
O. Lavrynenko, R. Odarchenko, G. Konakhovych, A. Taranenko, D. Bakhtiiarov and T. Dyka, “Method of Semantic Coding of Speech Signals based on Empirical Wavelet Transform,” 2021 IEEE 4th International Conference on Advanced Information and Communication Technologies (AICT), Lviv, Ukraine, 2021, pp. 18-22, doi: 10.1109/AICT52120.2021.9628985.
O.Yu. Lavrynenko, D.I. Bakhtiiarov, B.S. Chumachenko, O.G. Holubnychyi, G.F. Konakhovych and V.V. Antonov, “Application of Daubechies wavelet analysis in problems of acoustic detection of UAVs,” CEUR Workshop Proceedings, 2024, vol. 3662, pp. 125-143.
J. Jiang, Z. Sun, R. Lu, L. Pan and Z. Peng, “Real Relative Encoding Genetic Algorithm for Workflow Scheduling in Heterogeneous Distributed Computing Systems,” in IEEE Transactions on Parallel and Distributed Systems, vol. 36, no. 1, pp. 1-14, Jan. 2025, doi: 10.1109/TPDS.2024.3492210.
Y. Yu et al., “Memristor Parallel Computing for a Matrix-Friendly Genetic Algorithm,” in IEEE Transactions on Evolutionary Computation, vol. 26, no. 5, pp. 901-910, Oct. 2022, doi: 10.1109/TEVC.2022.3144419.
M. Askari, S. Soleimani, M. H. Shakoor and M. Momeni, “Eliminating Network Depth: Genetic Algorithm for Parameter Optimization in CNNs,” in IEEE Access, vol. 13, pp. 22473-22488, 2025, doi: 10.1109/ACCESS.2025.3533976.