Метод класифікації зображень оптичної когерентної томографії на основі структурно-орієнтованої адаптивної нейронної мережі
DOI:
https://doi.org/10.18372/1990-5548.85.20429Ключові слова:
штучний інтелект, класифікація зображень, глибоке навчання, томографія, алгоритмАнотація
В статті запропоновано метод класифікації зображень оптичної когерентної томографії для автоматизованої діагностики діабетичної ретинопатії та діабетичного макулярного набряку Створено інноваційну адаптивну багатозадачну глибоку нейронну мережу. Вона одночасно вирішує задачі класифікації патологій та реконструкцію структурних ознак. Нейронна мережа використовує попередньо навчену модель EfficientNetB7 як енкодер для ефективного екстракції високорівневих ознак. Гілка вивчення структурних ознак (декодер) відповідає за відновлення просторової інформації. Вона збільшує роздільну здатність карт ознак до вихідного розміру 224x224 пікселів з поступовим зменшенням кількості фільтрів та використанням Batch Normalization для стабілізації навчання. Гілка класифікації об’єднує семантичні та структурні ознаки. Вона застосовує механізм канальної уваги для динамічного зважування інформативних каналів. Шари Dropout та Batch Normalization використані для запобігання перенавчанню використані в класифікаційній гілці. Модель оптимізується за допомогою багатозадачної функції втрат. Вона складається з модифікованої функції втрат для класифікації (з ваговими коефіцієнтами класів для балансування дисбалансу даних) та середньоквадратичної помилки для структурної втрати. Навчання відбувається з використанням оптимізатора Adam та функцій зворотного EarlyStopping, ModelCheckpoint і ReduceLROnPlateau. Експеримент проведено на наборі даних OCT Image Classification. Аугментація даних (горизонтальні віддзеркалення) проведена для збільшення кількості зображень. Високі показники точності та функції витрат отримано в результаті навчання. Багатозадачний метод надає можливості енкодеру вивчати деталі та границі сітківки через реконструкцію Canny-країв. Він сприяє покращенню класифікації та забезпечує потужний механізм внутрішньої регуляризації, підвищуючи узагальнюючу здатність моделі.
Посилання
H. Y. Li, D .X. Wang, L. Dong, and W.B. Wei, “Deep learning algorithms for detection of diabetic macular edema in OCT images. A systematic review and meta-analysis,” Eur J Ophthalmol, 2023, no. 33(1), pp. 278–290. https://doi.org/10.1177/11206721221094786
S. Manikandan, R. Raman, R. Rajalakshmi, S. Tamilselvi, and R. J. Surya, “Deep learning-based detection of diabetic macular edema using optical coherence tomography and fundus images: A meta-analysis,” Indian J Ophthalmol, no. 71(5), pp. 1783–1796, 2023. https://doi.org/10.4103/IJO.IJO_2614_22
М. Tan and Q. V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” In International Conference on Machine Learning, 2019, pp. 6105–6114.
R. Caruana, “Multitask Learning // Machine Learning,” vol. 28, no. 1, pp. 41–75, 1997. https://doi.org/10.1023/A:1007379606734
S. Li, “Thoracic Disease Classification and Localization Using a Multi-task Deep Learning Framework,” IEEE Journal of Biomedical and Health Informatics, vol. 23, no. 4, pp. 1657–1666. 2019.
C. Chen, “Deep Learning for Lung Nodule Classification and Segmentation: A Survey,”, Journal of Medical Systems, vol. 43, no. 1, p. 25, 2019.
J. Canny, “A Computational Approach to Edge Detection,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, 1996, pp. 679–698. https://doi.org/10.1109/TPAMI.1986.4767851
S. Xie and Z. Tu, “Holistically-Nested Edge Detection,” Іn Proceedings of the IEEE International Conference on Computer Vision, 2015, pp. 1391–1399. https://doi.org/10.1109/ICCV.2015.164
X. Xavier. “DexiNed: Dense Extreme Inception Network for Edge Detection,” IEEE Access, 2019, vol. 7.
J. Hu, L. Shen, and G. Sun, “Squeeze-and-Excitation Networks,” In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 7132–7141. https://doi.org/10.1109/CVPR.2018.00745
S. Woo, J. Park, J. Lee, and I. S Kweon, “CBAM: Convolutional Block Attention Module,” in Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 3–19. https://doi.org/10.1007/978-3-030-01234-2_1
D. V. Prochukhan, “Osoblyvosti konkatenatsii zghortkovykh neironnykh merezh dlia skryninhu diabetychnoi retynopatii,” Systemy obrobky informatsii, no. 1(176), pp. 89–94. 2024. [in Ukrainian] https://doi.org/10.30748/soi.2024.176.11
D. V. Prochukhan, “Syntez zghortkovykh neironnykh merezh ta dovhoi korotkochasnoi pamiati dlia detektuvannia proliferatyvnoi retynopatii,” Visnyk Natsionalnoho tekhnichnoho universytetu “KhPI”. Seriia: Informatyka ta modeliuvannia, vol. 1, no. 1–2 (11–12), pp. 76–86, 2024. [in Ukrainian]. https://doi.org/10.20998/2411-0558.2024.01.06
V. Sheketa, V. Pikh, M. Slabinoha, and Y. Striletskyi, “Metodolohiia optymizatsii neironnoi merezhi z intehratsiieiu pertseptronnykh komponentiv realizovanykh na plis,” Herald of Khmelnytskyi National University. Technical Sciences, no. 351, pp. 415–427, 2025. [in Ukrainian].
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:
Автори зберігають авторські права та надають журналу право першої публікації роботи, одночасно ліцензованої за ліцензією Creative Commons Attribution License, яка дозволяє іншим поширювати роботу з посиланням на авторство роботи та її першу публікацію в цьому журналі.
Автори можуть укладати окремі додаткові договірні угоди щодо неексклюзивного розповсюдження опублікованої в журналі версії роботи (наприклад, розміщувати її в інституційному репозиторії або публікувати в книзі) з посиланням на її першу публікацію в цьому журналі.
Авторам дозволяється та заохочується розміщувати свої роботи онлайн (наприклад, в інституційних репозиторіях або на своєму вебсайті) до та під час процесу подання, оскільки це може призвести до продуктивного обміну, а також до більш раннього та більшого цитування опублікованих робіт (див. Вплив відкритого доступу).