Метод класифікації зображень оптичної когерентної томографії на основі структурно-орієнтованої адаптивної нейронної мережі

Автор(и)

  • Дмитро Володимирович Прочухан Харківський національний університет радіоелектроніки https://orcid.org/0000-0002-4622-1015

DOI:

https://doi.org/10.18372/1990-5548.85.20429

Ключові слова:

штучний інтелект, класифікація зображень, глибоке навчання, томографія, алгоритм

Анотація

В статті запропоновано метод класифікації зображень оптичної когерентної томографії для автоматизованої діагностики діабетичної ретинопатії та діабетичного макулярного набряку Створено інноваційну адаптивну багатозадачну глибоку нейронну мережу. Вона одночасно вирішує задачі класифікації  патологій та реконструкцію структурних ознак. Нейронна мережа використовує попередньо навчену модель EfficientNetB7 як енкодер для ефективного екстракції високорівневих ознак. Гілка вивчення структурних ознак (декодер) відповідає за відновлення просторової інформації. Вона збільшує роздільну здатність карт ознак до вихідного розміру 224x224 пікселів з поступовим зменшенням кількості фільтрів та використанням Batch Normalization для стабілізації навчання. Гілка класифікації об’єднує семантичні та структурні ознаки. Вона застосовує механізм канальної уваги для динамічного зважування інформативних каналів. Шари Dropout та Batch Normalization  використані  для запобігання перенавчанню використані в класифікаційній гілці. Модель оптимізується за допомогою багатозадачної функції втрат. Вона складається з модифікованої функції втрат для класифікації (з ваговими коефіцієнтами класів для балансування дисбалансу даних) та середньоквадратичної помилки для структурної втрати. Навчання відбувається з використанням оптимізатора Adam та функцій зворотного  EarlyStopping, ModelCheckpoint і ReduceLROnPlateau. Експеримент проведено на наборі даних OCT Image Classification. Аугментація даних (горизонтальні віддзеркалення) проведена для збільшення кількості зображень. Високі показники точності та функції витрат отримано в результаті навчання. Багатозадачний метод надає можливості енкодеру вивчати деталі та границі сітківки через реконструкцію Canny-країв. Він сприяє покращенню класифікації та забезпечує потужний механізм внутрішньої регуляризації, підвищуючи узагальнюючу здатність моделі.

Біографія автора

Дмитро Володимирович Прочухан , Харківський національний університет радіоелектроніки

Аспірант

Посилання

H. Y. Li, D .X. Wang, L. Dong, and W.B. Wei, “Deep learning algorithms for detection of diabetic macular edema in OCT images. A systematic review and meta-analysis,” Eur J Ophthalmol, 2023, no. 33(1), pp. 278–290. https://doi.org/10.1177/11206721221094786

S. Manikandan, R. Raman, R. Rajalakshmi, S. Tamilselvi, and R. J. Surya, “Deep learning-based detection of diabetic macular edema using optical coherence tomography and fundus images: A meta-analysis,” Indian J Ophthalmol, no. 71(5), pp. 1783–1796, 2023. https://doi.org/10.4103/IJO.IJO_2614_22

М. Tan and Q. V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” In International Conference on Machine Learning, 2019, pp. 6105–6114.

R. Caruana, “Multitask Learning // Machine Learning,” vol. 28, no. 1, pp. 41–75, 1997. https://doi.org/10.1023/A:1007379606734

S. Li, “Thoracic Disease Classification and Localization Using a Multi-task Deep Learning Framework,” IEEE Journal of Biomedical and Health Informatics, vol. 23, no. 4, pp. 1657–1666. 2019.

C. Chen, “Deep Learning for Lung Nodule Classification and Segmentation: A Survey,”, Journal of Medical Systems, vol. 43, no. 1, p. 25, 2019.

J. Canny, “A Computational Approach to Edge Detection,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, 1996, pp. 679–698. https://doi.org/10.1109/TPAMI.1986.4767851

S. Xie and Z. Tu, “Holistically-Nested Edge Detection,” Іn Proceedings of the IEEE International Conference on Computer Vision, 2015, pp. 1391–1399. https://doi.org/10.1109/ICCV.2015.164

X. Xavier. “DexiNed: Dense Extreme Inception Network for Edge Detection,” IEEE Access, 2019, vol. 7.

J. Hu, L. Shen, and G. Sun, “Squeeze-and-Excitation Networks,” In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 7132–7141. https://doi.org/10.1109/CVPR.2018.00745

S. Woo, J. Park, J. Lee, and I. S Kweon, “CBAM: Convolutional Block Attention Module,” in Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 3–19. https://doi.org/10.1007/978-3-030-01234-2_1

D. V. Prochukhan, “Osoblyvosti konkatenatsii zghortkovykh neironnykh merezh dlia skryninhu diabetychnoi retynopatii,” Systemy obrobky informatsii, no. 1(176), pp. 89–94. 2024. [in Ukrainian] https://doi.org/10.30748/soi.2024.176.11

D. V. Prochukhan, “Syntez zghortkovykh neironnykh merezh ta dovhoi korotkochasnoi pamiati dlia detektuvannia proliferatyvnoi retynopatii,” Visnyk Natsionalnoho tekhnichnoho universytetu “KhPI”. Seriia: Informatyka ta modeliuvannia, vol. 1, no. 1–2 (11–12), pp. 76–86, 2024. [in Ukrainian]. https://doi.org/10.20998/2411-0558.2024.01.06

V. Sheketa, V. Pikh, M. Slabinoha, and Y. Striletskyi, “Metodolohiia optymizatsii neironnoi merezhi z intehratsiieiu pertseptronnykh komponentiv realizovanykh na plis,” Herald of Khmelnytskyi National University. Technical Sciences, no. 351, pp. 415–427, 2025. [in Ukrainian].

##submission.downloads##

Опубліковано

2025-09-29

Номер

Розділ

КОМП’ЮТЕРНА ІНЖЕНЕРІЯ