Метод біометричного кодування мовних сигналів на основі адаптивного емпіричного вейвлет-перетворення

Автор(и)

  • Олександр Юрійович Лавриненко Державний університет «Київський авіаційний інститут» https://orcid.org/0000-0002-7738-161X

DOI:

https://doi.org/10.18372/1990-5548.84.20198

Ключові слова:

мовний сигнал, біометричне кодування, ідентифікація диктора, захист інформації, автентифікація голосу, вейвлет-перетворення, смугові вейвлет-фільтри, мел-частотні кепстральні коефіцієнти

Анотація

Розроблено метод біометричного кодування мови, в якому емпіричне вейвлет-перетворення використовується для вилучення біометричних ознак мовних сигналів для голосової ідентифікації мовця. Цей метод відрізняється від існуючих тим, що використовує набір адаптивних смугових вейвлет-фільтрів Мейєра та спектральний аналіз Гільберта для визначення миттєвих амплітуд і частот внутрішніх емпіричних мод. Це дає можливість використовувати багатомасштабний вейвлет-аналіз для біометричного кодування мовних сигналів на основі адаптивного емпіричного вейвлет-перетворення, що підвищує ефективність спектрального аналізу в 1.2 рази або на 14% за рахунок розділення високочастотних мовних коливань на їх низькочастотні складові, а саме внутрішні емпіричні моди. Також удосконалено біометричний метод кодування мовних сигналів на основі мел-частотних кепстральних коефіцієнтів, який використовує основні принципи адаптивного спектрального аналізу з використанням емпіричного вейвлет-перетворення, що також суттєво покращує розділення Фур’є-спектру на адаптивні смуги відповідних формантних частот мовного сигналу.

Біографія автора

Олександр Юрійович Лавриненко , Державний університет «Київський авіаційний інститут»

Кандидат технічних наук

Доцент

Кафедра телекомунікаційних та радіоелектронних систем

Факультет аеронавігації, електроніки та телекомунікацій

Посилання

Y. Zhang, C. Chen and C. Yang, “Task Extension of Robot with Voice Control Based on Dynamical Movement Primitives,” 2020 International Symposium on Autonomous Systems (ISAS), Guangzhou, China, 2020, pp. 82–87, https://doi.org/10.1109/ISAS49493.2020.9378861.

A. V. Elasarapu, P. Bevara, K. Buramsetty, H. A. Mirza, V. N. Marriwada and N. S. Murthy, “Smart BOT for Face Recognition and Voice Controls,” 2024 International Conference on Computing and Data Science (ICCDS), Chennai, India, 2024, pp. 1–6, https://doi.org/10.1109/ICCDS60734.2024.10560389

O. Lavrynenko, A. Taranenko, I. Machalin, Y. Gabrousenko, I. Terentyeva and D. Bakhtiiarov, “Protected Voice Control System of UAV,” 2019 IEEE 5th International Conference Actual Problems of Unmanned Aerial Vehicles Developments (APUAVD), Kiev, Ukraine, 2019, pp. 295–298, https://doi.org/10.1109/APUAVD47061.2019.8943926

Y. Ü. Sönmez and A. Varol, “The Necessity of Emotion Recognition from Speech Signals for Natural and Effective Human-Robot Interaction in Society 5.0,” 2022 10th International Symposium on Digital Forensics and Security (ISDFS), Istanbul, Turkey, 2022, pp. 1–8, https://doi.org/10.1109/ISDFS55398.2022.9800837.

C. -Y. Li and N. T. Vu, “Improving Speech Recognition on Noisy Speech via Speech Enhancement with Multi-Discriminators CycleGAN,” 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), Cartagena, Colombia, 2021, pp. 830–836, https://doi.org/10.1109/ASRU51503.2021.9688310.

A. Bhattacharjee et al., “Bangla voice controlled robot for rescue operation in noisy environment,” 2016 IEEE Region 10 Conference (TENCON), Singapore, 2016, pp. 3284–3288, https://doi.org/10.1109/TENCON.2016.7848659.

O. Lavrynenko, B. Chumachenko, M. Zaliskyi, S. Chumachenko and D. Bakhtiiarov, “Method of Remote Biometric Identification of a Person by Voice based on Wavelet Packet Transform,” CEUR Workshop Proceedings, 2024, vol. 3654, pp. 150–162.

S. Wen, W. -S. Gan and D. Shi, “An Improved Selective Active Noise Control Algorithm Based on Empirical Wavelet Transform,” ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Barcelona, Spain, 2020, pp. 1633–1637, https://doi.org/10.1109/ICASSP40776.2020.9054452.

O. Lavrynenko, D. Bakhtiiarov, V. Kurushkin, S. Zavhorodnii, V. Antonov and P. Stanko, “A method for extracting the semantic features of speech signal recognition based on empirical wavelet transform,” Radioelectronic and Computer Systems, 2023, vol. 107, no. 3, pp. 101–124. https://doi.org/10.32620/reks.2023.3.09.

M. Joorabchi, S. Ghorshi and Y. Naderahmadian, “Speech Denoising Based on Wavelet Transform and Wiener Filtering,” 2023 8th International Conference on Frontiers of Signal Processing (ICFSP), Corfu, Greece, 2023, pp. 43–46, https://doi.org/10.1109/ICFSP59764.2023.10372899.

M. M. Azmy, “Gender of Fetus Identification Using Modified Mel-Frequency Cepstral Coefficients Based on Fractional Discrete Cosine Transform,” in IEEE Access, vol. 12, pp. 48158–48164, 2024, https://doi.org/10.1109/ACCESS.2024.3373430.

K. V. Veena and D. Mathew, “Speaker identification and verification of noisy speech using multitaper MFCC and Gaussian Mixture models,” 2015 International Conference on Power, Instrumentation, Control and Computing (PICC), Thrissur, India, 2015, pp. 1–4, https://doi.org/10.1109/PICC.2015.7455806.

O. Veselska, O. Lavrynenko, R. Odarchenko, M. Zaliskyi, D. Bakhtiiarov, M. Karpinski and S. Rajba, “A Wavelet-Based Steganographic Method for Text Hiding in an Audio Signal,” Sensors, 2022, vol. 22, no. 15, pp. 1–25. https://doi.org/10.3390/s22155832.

A. Jovanović, Z. Perić, J. Nikolić and D. Aleksić, “The Effect of Uniform Data Quantization on GMM-based Clustering by Means of EM Algorithm,” 2021 20th International Symposium INFOTEH-JAHORINA (INFOTEH), East Sarajevo, Bosnia and Herzegovina, 2021, pp. 1–5, https://doi.org/10.1109/INFOTEH51037.2021.9400662

O. Lavrynenko, R. Odarchenko, G. Konakhovych, A. Taranenko, D. Bakhtiiarov and T. Dyka, “Method of Semantic Coding of Speech Signals based on Empirical Wavelet Transform,” 2021 IEEE 4th International Conference on Advanced Information and Communication Technologies (AICT), Lviv, Ukraine, 2021, pp. 18–22, https://doi.org/10.1109/AICT52120.2021.9628985.

##submission.downloads##

Опубліковано

2025-06-30

Номер

Розділ

ТЕЛЕКОМУНІКАЦІЇ ТА РАДІОТЕХНІКА