Інтеграція фрактальної розмірності у візуальний трансформер для класифікації раку шкіри

Автор(и)

  • Владислав Олегович Нікітін Національний технічний університет Україні «Київський Політехнічний Інститут імені Ігоря Сікорського» https://orcid.org/0009-0001-9921-0213
  • Валерій Якович Данилов Національний технічний університет Україні «Київський Політехнічний Інститут імені Ігоря Сікорського» https://orcid.org/0000-0003-3389-3661

DOI:

https://doi.org/10.18372/1990-5548.76.17662

Ключові слова:

машинне навчання, рак шкіри, класифікація пухлин шкіри, візуальний трансформер, фрактальна розмірність, задачі класифікації

Анотація

З метою класифікації уражень шкіри було зроблено багато зусиль для створення різноманітних автоматизованих систем діагностики. На сьогоднішній день, зі стрімкими досягненнями у глибокому навчанні, візуальні трансформери виходять на передній план як потужні моделі для обробки та аналізу зображень. Цей тип моделей вже довів свою корисність для виявлення та класифікації ракових захворювань зокрема. Однак, складність і змінність уражень шкіри створюють значні виклики при точній класифікації. Інтеграція концепції фрактальної розмірності у візуальні трансформери може покращити їхню продуктивність, захоплюючи складні структурні зразки уражень шкіри. Метою цієї роботи є дослідження інтеграції метрик фрактальної розмірності у візуальний трансформер для класифікації раку шкіри. Проблема, яку необхідно дослідити, полягає у вивченні можливості і способів інтеграції метрик фрактальної розмірності у існуючу архітектуру візуального трансформера для точної класифікації уражень шкіри як ракових або неракових. Фрактальні розмірності надають міру складності та неправильності об’єкта, що може бути інформативним при характеризації уражень шкіри, пов’язаних з раком. Планується дослідити можливості та шлях.

Біографії авторів

Владислав Олегович Нікітін , Національний технічний університет Україні «Київський Політехнічний Інститут імені Ігоря Сікорського»

Магістр компʼютерних наук

Навчально-науковий комплекс «Інститут прикладного системного аналізу»

Валерій Якович Данилов , Національний технічний університет Україні «Київський Політехнічний Інститут імені Ігоря Сікорського»

Доктор технічних наук

Професор  

Навчально-науковий комплекс «Інститут прикладного системного аналізу»

Посилання

Cancer facts & figures 2023 (no date) American Cancer Society. Available at: https://www.cancer.org/research/cancer-facts-statistics/all-cancer-facts-figures/2023-cancer-facts-figures.html (Accessed: 10 June 2023).

(No date) Adjusted rates 2018 melanoma of skin С43 table 1 – general rates, 2018. Available at: http://www.ncru.inf.ua/publications/BULL_21/PDF_E/38-39-mel.pdf (Accessed: 10 June 2023).

A. Dosovitskiy, et al. An image is worth 16x16 words: Transformers for image recognition at scale, (2021), arXiv.org. Available at: https://doi.org/10.48550/arXiv.2010.11929 (Accessed: 10 June 2023).

A. Vaswani, et al. Attention is all you need, (2017), arXiv.org. Available at: https://doi.org/10.48550/arXiv.1706.03762 (Accessed: 10 June 2023).

K. J. Falconer, (2003). Fractal geometry : Mathematical foundations and applications : K. J. Falconer, onlinelibrary.wiley.com. Available at: https://doi.org/10.1002/0470013850 (Accessed: 10 June 2023).

M. Kirkby, (1983). The fractal geometry of nature. Benoit B. Mandelbrot. W. H. Freeman and co., San Francisco, 1982. No. of pages: 460. Price: £22.75 (hardback). Earth Surface Processes and Landforms, 8(4), 406. https://doi.org/10.1002/esp.329008041 Accessed: 10 June 2023).

P. Tschandl, (2023). The HAM10000 dataset, a large collection of multi-source dermatoscopic images of common pigmented skin lesions, Harvard Dataverse. Available at: https://doi.org/10.7910/DVN/DBW86T (Accessed: 10 June 2023).

J. F. Canny, (1986). A computational approach to edge detection – researchgate. Available at: http://dx.doi.org/10.1109/TPAMI.1986.4767851 (Accessed: 10 June 2023).

V. Nikitin, and N. Shapoval, (2023). Vision Transformer for skin cancer classification, Scientific Collection ‘InterConf+’. Available at: https://doi.org/10.51582/interconf.19-20.05.2023.039 (Accessed: 10 June 2023).

C.-F. Chen, Q. Fan, and R. Panda, (2021). Crossvit: Cross-attention multi-scale vision transformer for Image Classification, arXiv.org. Available at: https://arxiv.org/abs/2103.14899 (Accessed: 10 June 2023)

##submission.downloads##

Опубліковано

2023-06-23

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ