Напівкероване навчання в задачах обробки інформації
DOI:
https://doi.org/10.18372/1990-5548.70.16754Ключові слова:
розповсюдження міток, напівкероване навчання, обробка даних, штучний інтелект, припущення гладкості, різноманіття, кластеризаціїАнотація
У статті обґрунтовано необхідність подальшого дослідження відомих методів та розробки нових методів машинного навчання – напівкерованого навчання. Показано, що знання щільності розподілу ймовірностей вихідних даних, отриманих з використанням немаркованих даних, повинно нести інформацію, корисну для отримання умовної щільності розподілу ймовірностей міток і вхідних даних. Якщо це не так, напівкероване навчання не забезпечить жодних покращень у порівнянні з контрольованим навчанням. Може навіть статися так, що використання немаркованих даних зменшить точність передбачення. Щоб напівкероване навчання працювало, мають виконуватися певні припущення, а саме: напівкероване припущення гладкості, припущення кластеризації (поділ із низькою щільністю) і припущення різноманіття. Розроблено новий гібридний алгоритм напівкерованого навчання з використанням методу поширення мітки. Наведено приклад використання запропонованого алгоритму.
Посилання
O. Chapelle, M. Chi, & A. Zien, (). “A continuation method for semi-supervised SVMs,” in Proceedings of the 23rd international conference on machine learning, 2006a, pp. 185–192. https://doi.org/10.1145/1143844.1143868
X. Zhu, Semi-supervised learning literature survey. Technical Report. 1530, University of Wisconsin-Madison, 2008.
X. Zhu, Semi-supervised learning with graphs. Ph.D. thesis, Carnegie Mellon University, 2005.
A. Subramanya, & P. P. Talukdar, “Graph-based semi-supervised learning,” Synthesis Lectures on Artificial Intelligence and Machine Learning, 8(4), 1–125, 2014. https://doi.org/10.2200/S00590ED1V01Y201408AIM029
I. Triguero, S. García, & F. Herrera, “Self-labeled techniques for semi-supervised learning: Taxonomy, software and empirical study,” Knowledge and Information Systems, 42(2), 245–284, 2015. https://doi.org/10.1007/s10115-013-0706-y
I. Goodfellow, NIPS 2016 tutorial: Generative adversarial networks. arXiv:1701.00160, 2017.
X. Zhu,, & J. Lafferty, “Harmonic mixtures: Combining mixture models and graph-based methods for inductive and scalable semi-supervised learning,” in Proceedings of the 22nd international conference on machine learning. 2005, pp. 1052–1059. ACM. https://doi.org/10.1145/1102351.1102484
Ulrike von Luxburg. "A Tutorial on Spectral Clustering. Statistics and Computing," Data Structures and Algorithms (cs.DS); Machine Learning (cs.LG), 17(4):395–416, 2007. https://doi.org/10.48550/arXiv.0711.0189
Christopher M. Bishop, Pattern Recognition and Machine Learning. Springer, 2007. ISBN-13: 978-0387310732, ISBN-10: 0387310738
Chen, Jie, ren Fang, Haw, and Saad, Yousef, "Fast Approximate kNN Graph Construction for High Dimensional Data via Recursive Lanczos Bisection," Journal of Machine Learning Research, vol.10, pp. 1989–2012, 2009.
Connor, Michael and Kumar, Piyush, "Fast Construction of k-Nearest Neighbor Graphs for Point Clouds," IEEE Trans. Vis. Comput. Graph., 16(4):599–608, 2010. https://doi.org/10.1109/TVCG.2010.9
Dong, Wei, Charikar, Moses, and Li, Kai, "Efficient k-Nearest Neighbor Graph Construction for Generic Similarity Measures," In WWW, pp. 577–586, 2011. https://doi.org/10.1145/1963405.1963487
Dengyong Zhou, Olivier Bousquet, Thomas Navin Lal, Jason Weston, and Bernhard Schölkopf, "Learning with Local and Global Consistency," In NIPS, p. 8, 2003.
Michael Z. Zgurovsky, Viktor M. Sineglazov, Olena I. Chumachenko, Artificial Intelligence Systems Based on Hybrid Neural Networks. Springer https://link.springer.com/book/10.1007/978-3-030-48453-8. Customer can order it via https://www.springer.com/gp/book/9783030484521
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Authors who publish with this journal agree to the following terms:
Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).