Напівкероване навчання в задачах обробки інформації

Автор(и)

  • Віктор Михайлович Синєглазов Національний авіаційний університет, Київ https://orcid.org/0000-0002-3297-9060
  • Олена Іллівна Чумаченко Національний технічний університет України «Київський політехнічний інститут ім. Ігоря Сікорського» https://orcid.org/0000-0003-3006-7460
  • Едуард Володимирович Хейлик Національний авіаційний університет, Київ

DOI:

https://doi.org/10.18372/1990-5548.70.16754

Ключові слова:

розповсюдження міток, напівкероване навчання, обробка даних, штучний інтелект, припущення гладкості, різноманіття, кластеризації

Анотація

У статті обґрунтовано необхідність подальшого дослідження відомих методів та розробки нових методів машинного навчання – напівкерованого навчання. Показано, що знання щільності розподілу ймовірностей вихідних даних, отриманих з використанням немаркованих даних, повинно нести інформацію, корисну для отримання умовної щільності розподілу ймовірностей міток і вхідних даних. Якщо це не так, напівкероване навчання не забезпечить жодних покращень у порівнянні з контрольованим навчанням. Може навіть статися так, що використання немаркованих даних зменшить точність передбачення. Щоб напівкероване навчання працювало, мають виконуватися певні припущення, а саме: напівкероване припущення гладкості, припущення кластеризації (поділ із низькою щільністю) і припущення різноманіття. Розроблено новий гібридний алгоритм напівкерованого навчання з використанням методу поширення мітки. Наведено приклад використання запропонованого алгоритму.

Біографії авторів

Віктор Михайлович Синєглазов , Національний авіаційний університет, Київ

Кафедра авіаційних комп’ютерно-інтегрованих комплексів

Факультет аеронавігації електроніки і телекомунікацій

Доктор технічних наук. Професор. Завідувач кафедрою

Олена Іллівна Чумаченко, Національний технічний університет України «Київський політехнічний інститут ім. Ігоря Сікорського»

Кафедра технічної кібернетики

Доктор технічних наук. Професор

Едуард Володимирович Хейлик , Національний авіаційний університет, Київ

Кафедра авіаційних комп’ютерно-інтегрованих комплексів

Факультет аеронавігації електроніки і телекомунікацій

Бакалавр

Посилання

O. Chapelle, M. Chi, & A. Zien, (). “A continuation method for semi-supervised SVMs,” in Proceedings of the 23rd international conference on machine learning, 2006a, pp. 185–192. https://doi.org/10.1145/1143844.1143868

X. Zhu, Semi-supervised learning literature survey. Technical Report. 1530, University of Wisconsin-Madison, 2008.

X. Zhu, Semi-supervised learning with graphs. Ph.D. thesis, Carnegie Mellon University, 2005.

A. Subramanya, & P. P. Talukdar, “Graph-based semi-supervised learning,” Synthesis Lectures on Artificial Intelligence and Machine Learning, 8(4), 1–125, 2014. https://doi.org/10.2200/S00590ED1V01Y201408AIM029

I. Triguero, S. García, & F. Herrera, “Self-labeled techniques for semi-supervised learning: Taxonomy, software and empirical study,” Knowledge and Information Systems, 42(2), 245–284, 2015. https://doi.org/10.1007/s10115-013-0706-y

I. Goodfellow, NIPS 2016 tutorial: Generative adversarial networks. arXiv:1701.00160, 2017.

X. Zhu,, & J. Lafferty, “Harmonic mixtures: Combining mixture models and graph-based methods for inductive and scalable semi-supervised learning,” in Proceedings of the 22nd international conference on machine learning. 2005, pp. 1052–1059. ACM. https://doi.org/10.1145/1102351.1102484

Ulrike von Luxburg. "A Tutorial on Spectral Clustering. Statistics and Computing," Data Structures and Algorithms (cs.DS); Machine Learning (cs.LG), 17(4):395–416, 2007. https://doi.org/10.48550/arXiv.0711.0189

Christopher M. Bishop, Pattern Recognition and Machine Learning. Springer, 2007. ISBN-13: 978-0387310732, ISBN-10: 0387310738

Chen, Jie, ren Fang, Haw, and Saad, Yousef, "Fast Approximate kNN Graph Construction for High Dimensional Data via Recursive Lanczos Bisection," Journal of Machine Learning Research, vol.10, pp. 1989–2012, 2009.

Connor, Michael and Kumar, Piyush, "Fast Construction of k-Nearest Neighbor Graphs for Point Clouds," IEEE Trans. Vis. Comput. Graph., 16(4):599–608, 2010. https://doi.org/10.1109/TVCG.2010.9

Dong, Wei, Charikar, Moses, and Li, Kai, "Efficient k-Nearest Neighbor Graph Construction for Generic Similarity Measures," In WWW, pp. 577–586, 2011. https://doi.org/10.1145/1963405.1963487

Dengyong Zhou, Olivier Bousquet, Thomas Navin Lal, Jason Weston, and Bernhard Schölkopf, "Learning with Local and Global Consistency," In NIPS, p. 8, 2003.

Michael Z. Zgurovsky, Viktor M. Sineglazov, Olena I. Chumachenko, Artificial Intelligence Systems Based on Hybrid Neural Networks. Springer https://link.springer.com/book/10.1007/978-3-030-48453-8. Customer can order it via https://www.springer.com/gp/book/9783030484521

##submission.downloads##

Опубліковано

2022-01-04

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ