Виявлення літаків на зображеннях з повітря з використанням нейронної мережі YOLO
DOI:
https://doi.org/10.18372/2306-1472.76.13149Ключові слова:
безпілотний літальний апарат, виявлення об’єктів, згорткова нейронна мережа, обробка в реальному часіАнотація
Мета: Представлені результати дослідження спрямовані на тестування ефективності найсучасніших методів виявлення об'єктів. Було перевірено дві популярні одноступеневі нейронні мережі, що базуються на підході "ви дивитеся лише один раз". Методи дослідження: згорткова нейронна мережа, логістична регресія, імовірнісна теорія, стохастичний градієнтний спуск. Результати: Розглянуті архітектури штучних нейронних мереж для виявлення об'єктів були навчені та застосовані для конкретного завдання виявлення літальних апаратів на зображеннях з повітря, знятих з безпілотних літальних апаратів та супутників. Обговорення: Представлені результати експериментальної перевірки підтверджують високу здатність цих методів до виявлення, їх високу точність визначення місцезнаходження та швидкість обробки в реальному часі за допомогою сучасного графічного процесора. Розглянуті нейронні мережі можуть бути легко перенавчені для виявлення різних класів наземних об'єктів.
Посилання
Ammour N., Alhichri H., Bazi Y., Benjdira B., Alajlan N. and Zuair M. (2017) Deep Learning Approach for Car Detection in UAV Imagery. Remote Sensing, No. 9(312), pp. 1–15. doi: 10.3390/rs9040312
Maria G., Baccaglini E., Brevi D., Gavelli M., Scopigno R. (2016) A drone-based image processing system for car detection in a smart transport infrastructure. Proc. 18th Mediterranean Electrotechnical Conf. (MELECON). Limassol, Cyprus. doi: 10.1109/MELCON.2016.7495454
C. Castiblanco, J. Rodriguez, I. Mondragon, C. Parra, and J. Colorado Air Drones for Explosive Landmines Detection. in ROBOT2013: First Iberian Robotics Conference (M. A. Armada, A. Sanfeliu, M. Ferre Eds.) Springer International Publishing, pp. 107–114. doi: 10.1007/978-3-319-03653-3_9
Kharchenko V., Shmelova T., Sikirda, Y. (2012) Pryynyattya rishen' operatorom aeronavihatsiynoyi systemy. Monohrafiya [DecisionMaking of Operator in Air Navigation System.Monograph]. Kirovograd, KFA of NAU Publ., 292 p. (In Ukrainian)
Xu Y., Yu G., Wang Y., Wu X., and Ma Y. (2017) Car Detection from Low-Altitude UAV Imagery with the Faster R-CNN. Journal of Advanced Transportation, Vol. 2017. doi: 10.1155/2017/2823617
Lee J., Wang J., Crandall D., Sabanovic S. and Fox G. (2017) Real-Time Object Detection for Unmanned Aerial Vehicles based on Cloud-based Convolutional Neural Networks. Proc. IEEE International Conference on Robotic Computing (IRC). Taichung, Taiwan. doi: 10.1109/IRC.2017.77
Leira F. S., Johansen T. A., Fossen T. I. (2015) Automatic Detection, Classification and Tracking of Objects in the Ocean Surface from UAVs Using a Thermal Camera. Proc. IEEE Aerospace Conference. Big Sky, MT, USA. doi: 10.1109/AERO.2015.7119238
Lee J.-N., Kwak K.-C. (2014) A Trends Analysis of Image Processing in Unmanned Aerial Vehicle. International Journal of Computer and Information Engineering, No. 2(8), pp. 271–274. doi: 10.1999/1307-6892/9997348
Dhawad S. R., Itkarkar R. R. (2016) Car Detecting Method using high Resolution images. International Journal on Recent and Innovation Trends in Computing and Communication, No. 2(4), pp. 197–203.
LeCun Y., Jackel L., Bottou L., Brunot A., Cortes C., Denker J., Drucker H., Guyon I., Müller U., Säckinger E., Simard P., Vapnik V. (1995) Comparison of learning algorithms for handwritten digits recognition. Proc. 1995 Int. Conf. on Artificial Neural Networks. Paris, France, pp. 53-60.
Viola P. and Jones M. (2001) Rapid object detection using a boosted cascade of simple features. Proc. Computer Vision and Pattern Recognition (CVPR-2001). Kauai, HI, USA, pp. I-511 – I-518. doi: 10.1109/CVPR.2001.990517
Dalal N. and Triggs B. (2005) Histograms of oriented gradients for human detection. Proc. Computer Vision and Pattern Recognition (CVPR-2005). San Diego, CA, USA, Vol. 1, pp. 886–891. doi: 10.1109/CVPR.2005.177
Girshick R., Donahue J., Darrell T., and Malik J. (2014) Rich feature hierarchies for accurate object detection and semantic segmentation. Proc. Computer Vision and Pattern Recognition (CVPR-2014). Columbus, OH, USA, pp. 580–587. doi: 10.1109/CVPR.2014.81
Girshick R. (2015). Fast R-CNN. Proc. Computer Vision (ICCV-2015). Santiago, Chile, pp. 1440–1448. doi: 10.1109/ICCV.2015.169.
Ren S., He K., Girshick R., Sun J. (2015) Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, No. 6(39), pp. 1137–1149. doi: 10.1109/TPAMI.2016.2577031
Lin T.-Y., Doll´ar P., Girshick R., He K., Hariharan B., and Belongie S. (2017) Feature pyramid networks for object detection. Proc. Computer Vision and Pattern Recognition (CVPR-2017). Honolulu, HI, USA, pp. 936–944. doi: 10.1109/CVPR.2017.106
He K., Gkioxari G., Doll´ar P., and Girshick R. (2017) Mask R-CNN. Proc. Computer Vision (ICCV-2017). Venice, Italy, pp. 2980–2988. doi: 10.1109/ICCV.2017.322
He K., Zhang X., Ren S., and Sun J. (2016) Deep residual learning for image recognition. Proc. Computer Vision and Pattern Recognition (CVPR-2016). Las Vegas, NV, USA, pp. 770–778. doi: 10.1109/CVPR.2016.90.
Liu W., Anguelov D., Erhan D., Szegedy C., and Reed S. (2016) SSD: Single shot multibox detector. Proc. European Conference on Computer vision Computer Vision and Pattern Recognition (ECCV-2016). Amsterdam, The Netherlands. doi: 10.1007/978-3-319-46448-0_2
Redmon J., Divvala S., Girshick R., and Farhadi A. (2016) You only look once: Unified, real-time object detection. Proc. Computer Vision and Pattern Recognition (CVPR-2016). Las Vegas, NV, USA, pp. 779–788. doi: 10.1109/CVPR.2016.91
Redmon J. and Farhadi A. YOLOv3: An Incremental Improvement. Available at: https://pjreddie.com/media/files/papers/YOLOv3.pdf (Accessed 06.04.18)
Lin T.-Y., Goyal P., Girshick R., He K., Doll´ar P. (2017) Focal Loss for Dense Object Detection. Proc. Computer Vision (ICCV-2017). Venice, Italy, pp. 2999–3007. doi: 10.1109/ICCV.2017.324
Darknet: Open source neural networks in c. Available at: https://github.com/AlexeyAB/darknet (Accessed 05.04.18)
YoloMark. Available at: https://github.com/AlexeyAB/Yolo_mark (Accessed 05.04.18)
Downloads
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з такими умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).