Розпізнавання та відстеження жестів рук у віртуальній реальності за допомогою гібридних згорткових нейронних мереж
DOI:
https://doi.org/10.18372/1990-5548.72.16940Ключові слова:
згорткова нейронна мережа, віртуальна реальність, машинне навчання, класифікація зображень, удосконалена RISC-машинаАнотація
У даній роботі проведено аналіз сучасних алгоритмів віртуальної реальності на основі мобільних пристроїв. У результаті було виявлено недоліки розглянутих алгоритмів та запропоновано використання згорткових нейронних мереж для їх уникнення. У рамках дослідження проведено якісний аналіз сучасних архітектур згорткових нейронних мереж та показано їх окремі недоліки при використанні в системах на базі процесорної архітектури удосконаленої RISC-машини. У результаті цього дослідження встановлено, що для досягнення цільової точності та швидкодії систем, важливим є використання гібридних згорткових нейронних мереж, які значно покращують критерії якості системи. Отримано оптимальну структуру та параметри для ініціалізації та навчання гібридної згорткової нейронної мережі, яка оптимальна для використання в системах віртуальної реальності. Сформовано оптимальну навчальну вибірку та описано використання попередньо навченої гібридних згорткових нейронних мереж на іншому пристрої архітектури удосконаленої RISC-машини.
Посилання
Iveta Mrazova and Marek Kukacka, "Hybrid convolutional neural networks," IEEE International Conference on Industrial Informatics. https://doi.org/10.1109/INDIN.2008.4618146.
Chaitanya Nagpal and Shiv Ram Dubey. “A Performance Evaluation of Convolutional Neural Networks for Face Anti Spoofing,” https://doi.org/10.48550/arXiv.1805.04176
Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S. Guadarrama, and T. Darrell, “Caffe: Convolutional architecture for fast feature embedding,” in Proceedings of the 22nd ACM international conference on Multimedia. ACM, 2014, pp. 675–678. https://doi.org/10.1145/2647868.2654889
K. Simonyan and A. Zisserman, “Very deep convolutional networks for large-scale image recognition,” 2014.
J. Long, E. Shelhamer, and T. Darrell, “Fully convolutional networks for semantic segmentation,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2015, pp. 3431–3440. https://doi.org/10.1109/CVPR.2015.7298965
Jie Hu, Li Shen, Samuel Albanie, Gang Sun, Enhua Wu. “Squeeze-and-Excitation Networks”.
C. Cao, X. Liu, Y. Yang, Y. Yu, J. Wang, Z. Wang, Y. Huang, L. Wang, C. Huang, W. Xu, D. Ramanan, and T. S. Huang, “Look and think twice: Capturing top-down visual attention with feedback convolutional neural networks,” in ICCV, 2015. https://doi.org/10.1109/ICCV.2015.338
K. He, X. Zhang, S. Ren, and J. Sun, “Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification,” in ICCV, 2015. https://doi.org/10.1109/ICCV.2015.123
A. Krizhevsky and G. Hinton, “Learning multiple layers of features from tiny images,” Citeseer, Tech. Rep., 2009.
B. Zhou, A. Lapedriza, A. Khosla, A. Oliva, and A. Torralba, “Places: A 10 million image database for scene recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017. https://doi.org/10.1167/17.10.296
L. Shen, Z. Lin, and Q. Huang, “Relay backpropagation for effective learning of deep convolutional neural networks,” in ECCV, 2016. https://doi.org/10.1007/978-3-319-46478-7_29
D. Mahajan, R. Girshick, V. Ramanathan, K. He, M. Paluri, Y. Li, A. Bharambe, and L. van der Maaten, “Exploring the limits of weakly supervised pretraining,” in ECCV, 2018. https://doi.org/10.1007/978-3-030-01216-8_12
G. Mittal and S. Sasi, “Robust Preprocessing Algorithm for Face Recognition”, Proceedings of the 3rd Canadian conference on Computer and Robot vision, United States of America , 2006.
A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep convolutional neural networks,” In Advances in neural information processing systems, 25(2), pp. 1097–1105, 2012, https://doi.org/10.1145/3065386
V. V. Kochergin, Servo Systems with motors of Direct Current, Leningrad: Energoatomidat, 1988, 68 p.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:
Автори зберігають авторські права та надають журналу право першої публікації роботи, одночасно ліцензованої за ліцензією Creative Commons Attribution License, яка дозволяє іншим поширювати роботу з посиланням на авторство роботи та її першу публікацію в цьому журналі.
Автори можуть укладати окремі додаткові договірні угоди щодо неексклюзивного розповсюдження опублікованої в журналі версії роботи (наприклад, розміщувати її в інституційному репозиторії або публікувати в книзі) з посиланням на її першу публікацію в цьому журналі.
Авторам дозволяється та заохочується розміщувати свої роботи онлайн (наприклад, в інституційних репозиторіях або на своєму вебсайті) до та під час процесу подання, оскільки це може призвести до продуктивного обміну, а також до більш раннього та більшого цитування опублікованих робіт (див. Вплив відкритого доступу).