Експеріментальні дослідження ефективності масштабованих архітектур YOLOv8(N-X) у задачах мультиоб'єктного супроводу на базі алгоритму ByteTrack
DOI:
https://doi.org/10.18372/2073-4751.84.20894Ключові слова:
YOLOv8, ByteTrack, комп’ютерний зір, мультиоб'єктний трекінг (MOT), CUDA, відеоаналітика, асоціація данихАнотація
У статті розглядаються результати досліджень продуктивності системи комп'ютерного зору для задач інтелектуального моніторингу дорожнього трафіку. Досліджено проблему пошуку балансу між швидкістю інференсу (Inference Speed) та стійкістю супроводу об'єктів (Tracking Stability) в умовах щільного міського потоку.
Класичні підходи до мультиоб'єктного трекінгу (MOT) часто стикаються з проблемою втрати об'єктів під час часткового перекриття (оклюзії). Сучасний алгоритм ByteTrack пропонує вирішення цієї проблеми шляхом використання дворівневої асоціації детекцій з існуючими треками, що робить його особливо стійким до перекриттів. Цей алгоритм є оптимальним рішенням для систем реального часу, оскільки він мінімізує обчислювальні витрати, зберігаючи при цьому найвищу якість утримання траєкторій серед розглянутих аналогів . Було розглянуто базовий принцип роботи IoU-трекера, який лежить в основі геометричної складової ByteTrack.
В роботі експериментально доведено, що для задач міського моніторингу в реальному часі на обладнанні середнього класу (рівня NVIDIA RTX 2060) найкращим вибором є модель YOLOv8m. В роботі наведено детальний аналіз п'яти протестованих архітектур YOLOv8m: Nano, Small, Medium, Large та X-Large. Шляхом емпіричного порівняння швидкодії та якості роботи моделей різного масштабу на базі реальних відеоданих системи моніторингу інтенсивності трафіку визначена оптимальна архітектури нейромережі сімейства YOLOv8 для інтеграції з ByteTrack.
В результаті аналізу модифікацій нейромережі YOLOv8 у поєднанні з трекером ByteTrack зроблено висновок про значущу нелінійну залежність між обчислювальною складністю нейромережевого детектора та підсумковою якістю мультиоб'єктного трекінгу.
Посилання
Bernardin K. Evaluating multiple object tracking performance: the CLEAR MOT metrics [Electronic resource] / K. Bernardin, R. Stiefelhagen // EURASIP Journal on Image and Video Processing. – 2008. – Article ID 246309. – URL: https://jivp-eurasipjournals.springeropen.com/articles/10.1155/2008/246309 (дата звернення: 30.11.2025).
Vehicle Flow Detection and Tracking Based on an Improved YOLOv8n and ByteTrack Framework [Electronic resource] // MDPI Drones. – 2025. – URL: https://www.mdpi.com/2032-6653/16/1/13 (дата звернення: 30.11.2025).
Introduction to ByteTrack: Multi-Object Tracking by Associating Every Detection Box [Electronic resource] / Datature. – Electronic data. – URL: https://www.datature.io/blog/introduction-to-bytetrack-multi-object-tracking-by-associating-every-detection-box (дата звернення: 30.11.2025).
Tracking with Ultralytics YOLO [Electronic resource] / Ultralytics Official Documentation. – Electronic data. – URL: https://docs.ultralytics.com/modes/track/ (дата звернення: 30.11.2025).
CUDA Toolkit 12.0 Released for General Availability [Electronic resource] / NVIDIA Developer Blog. – Electronic data. – URL: https://developer.nvidia.com/blog/cuda-toolkit-12-0-released-for-general-availability/ (дата звернення: 30.11.2025).
A brief note on ByteTrack [Electronic resource] / Qure.ai Technical Blog. – Electronic data. – URL: https://blog.qure.ai/notes/byte-track-multi-object-tracking (дата звернення: 30.11.2025).
Simple and Fast Multi-Object Tracking on Video: SmileTrack [Electronic resource] / AI-SCHOLAR. – Electronic data. – URL: https://ai-scholar.tech/en/articles/object-tracking/smiletrack (дата звернення: 30.11.2025).
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Науковий журнал дотримується принципів відкритого доступу (Open Access) та забезпечує вільний, негайний і постійний доступ до всіх опублікованих матеріалів без фінансових, технічних або юридичних обмежень для читачів.
Усі статті публікуються у відкритому доступі відповідно до ліцензії Creative Commons Attribution 4.0 International (CC BY 4.0).
Авторські права
Автори, які публікують свої роботи в журналі:
-
зберігають за собою авторські права на свої публікації;
-
надають журналу право на перше опублікування статті;
-
погоджуються на поширення матеріалів за ліцензією CC BY 4.0;
-
мають право повторно використовувати, архівувати та поширювати свої роботи (у тому числі в інституційних та тематичних репозитаріях) за умови посилання на первинну публікацію в журналі.