Система розпізнавання зображень з нейромережевою архітектурою на основі технології глибинного навчання
DOI:
https://doi.org/10.18372/2310-5461.45.14572Ключові слова:
машинне навчання, глибинне навчання, дані, розпізнавання зображеньАнотація
Машинне навчання дозволяє отримувати корисну інформацію з необроблених даних, щоб швидко та ефективно вирішувати складні, насичені даними задачі. Як підгалузь штучного інтелекту машинне навчання досліджує вивчення та побудову алгоритмів, які можуть формувати процес навчання та здійснювати прогнозування на основі даних, — такі алгоритми є значно ефективнішими методики використання строго статичних програмних інструкцій. Машинне навчання застосовують в ряді обчислювальних задач, в яких проектування та реалізація явних алгоритмів з належним рівнем продуктивності є складним або взагалі нездійсненним процесом.
Глибинне навчання є галуззю машинного навчання, що ґрунтується на наборі алгоритмів, які моделюють високорівневі абстракції в даних, застосовуючи глибинний граф із декількома обробними шарами, що побудовано з кількох лінійних або нелінійних перетворень. Дослідження в цій області намагаються зробити кращі представлення та створити моделі для навчання цих представлень з великомасштабних немічених даних. Різні архітектури глибинного навчання, такі як глибинні нейронні мережі, конволюційні глибинні нейронні мережі, глибинні мережі переконань та рекурентні нейронні мережі застосовуються в таких областях, як комп'ютерне бачення, автоматичне розпізнавання мовлення, обробка природної мови, розпізнавання звуків та біоінформатика, де вони представляють передові результати в різноманітних задачах.
Ця стаття охоплює поняття машинного навчання, глибинного навчання та розпізнавання зображень. Розглядається конкретний приклад (з поясненням кроків) використання глибинного навчання для побудови системи розпізнавання зображень з нейромережевою архітектурою. Отримана система надає широкі можливості для автоматизації технологічних процесів та підвищення їх ефективності. При цьому концепція системи може бути адаптована відповідно до типу нових задачПосилання
Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006. ISBN 978-0-387-31073-2.
Wikipedia. Machine Learning. URL: https://en.wikipedia.org/wiki/Machine_learning (дата звернення: 24.01.2020)
Schmidhuber J. Deep Learning in Neural Networks: An Overview. Neural Networks. 2015. Vol. 61 pp. 85–117.
Bengio Yoshua, LeCun Yann, Hinton Geoffrey Deep Learning. Nature. 2015. Vol. 521 (7553). Pp. 436–444.
Image Recognition. URL: https://sightcorp.com/knowledge-base/image-recognition/ (дата звернення 24.01.2020)
Emerging Tech Research: Artificial Intelligence & Machine Learning. URL: https://pitchbook.com/news/reports/3q-2019-emerging-tech-research-artificial-intelligence-machine-learning (дата звернення 24.01.2020)
How computer vision can improve buyer conversion and retention for E-commerce sites. URL: https://www.clarifai.com/blog/how-computer-vision-can-improve-buyer-conversion-and-retention (дата звернення 24.01.2020)
Celebrating one year of Pinterest Lens. URL: https://newsroom.pinterest.com/en/post/celebrating-one-year-of-pinterest-lens (дата звернення 27.01.2020)
Artificial intelligence in E-commerce: benefits, statistics, facts, use cases & case studies. URL: https://apiumhub.com/tech-blog-barcelona/artificial-intelligence-ecommerce/ (дата звернення 17.02.2020)
Simple Digit Recognition OCR in OpenCV-Python. URL: https://stackoverflow.com/a/9620295 (дата звернення 01.02.2020)
A gentle introduction to OCR. URL: https://towardsdatascience.com/a-gentle-introduction-to-ocr-ee1469a201aa (дата звернен-ня 01.02.2020)
scikit-image. Image processing in Python. Label image regions. URL: https://scikit-im-age.org/docs/dev/auto_examples/segmentation/plot_label.html#sphx-glr-download-auto-examples-segmentation-plot-label-py (дата звернення 01.02.2020)
EAST: An Efficient and Accurate Scene Text Detector. URL: https://arxiv.org/pdf/1704.03155.pdf (дата звернення 01.02.2020)
SEE: Towards Semi-Supervised End-to-End Scene Text Recognition. URL: https://arxiv.org/pdf/1712.05404.pdf (дата звер-нення 01.02.2020)
STN-OCR: A single Neural Network for Text Detection and Text Recognition. URL: https://arxiv.org/abs/1707.08831 (дата звернення 01.02.2020)
Review: SSD — Single Shot Detector (Ob-ject Detection). URL: https://towardsdatascience.com/review-ssd-single-shot-detector-object-detection-851a94607d11 (дата звернення 01.02.2020)
Handwritten Digit Recognition using Ma-chine Learning. URL: https://medium.com/@himanshubeniwal/handwritten-digit-recognition-using-machine-learning-ad30562a9b64 (дата звернення 01.02.2020)
Fast, Simple and Accurate Handwritten Dig-it Classification by Training Shallow Neural Net-work Classifiers with the 'Extreme Learning Ma-chine' Algorithm. URL: https://www.researchgate.net/figure/Comparison-of-our-results-on-the-MNIST-data-set-with-published-results-using-other_fig5_281815053 (дата звернення 01.02.2020)
You Only Look Once: Unified, Real-Time Object Detection. URL: https://arxiv.org/abs/1506.02640 (дата звернення 30.01.2020)
YOLO: Real Time Object Detection. URL: https://github.com/pjreddie/darknet/wiki/YOLO:-Real-Time-Object-Detection (дата звернення 30.01.2020)
The PASCAL Visual Object Classes Homepage. URL: http://host.robots.ox.ac.uk:8080/pascal/VOC/ (дата звернення 30.01.2020)
YOLO9000: Better, Faster, Stronger. URL: https://arxiv.org/abs/1612.08242 (дата звернення 30.01.2020)
YOLOv3: An Incremental Improvement. URL: https://arxiv.org/abs/1804.02767 (дата зве-рнення 30.01.2020)
Rubix ML. A high-level machine learning and deep learning library for the PHP language. URL: https://rubixml.com/ (дата звернення 17.02.2020)
MNIST database. URL: https://en.wikipedia.org/wiki/MNIST_database (дата звернення 03.02.2020)
CIFAR-10. URL: https://en.wikipedia.org/wiki/CIFAR-10 (дата зве-рнення 03.02.2020)
Iris flower dataset. URL: https://en.wikipedia.org/wiki/Iris_flower_data_set (дата звернення 03.02.2020)
Cyrillic-oriented MNIST. A dataset of Latin and Cyrillic letter images for text recognition. URL: https://github.com/GregVial/CoMNIST (дата звернення 03.02.2020)
PHP. Image Processing and GD. URL: https://www.php.net/manual/en/book.image.php (дата звернення 03.02.2020)
RubixML/MNIST. URL: https://github.com/RubixML/MNIST (дата звер-нення 03.02.2020)