ANALYSIS OF REQUIREMENTS FOR AUTOMATED METHODS OF DATA EXTRACTION SAME OBJECTS FROM WEB-SPACE
Keywords:
Extract data, method wrappers, automated retrieval, syntactic extraction methods.Abstract
The5 following listed Web-data mining methods are analyzed for the correspondence to the set requirements: method Sunny, wrappers method, automatic extraction method, syntaxic method, text mining method. Sunny and text mining methods are proved to be the most corresponding to the set requirements.References
Бурматова М.С., Оленін М.В. Аналіз сучасних пошукових систем на предмет їх придатності для пошуку і вилучення інформації про однотипні об’єкти з Web-простору: матеріали міжнародної науково-технічної конференції УкрПрог 2010, Київ, Україна – К., 2010.
Moore JH. Computational analysis of gene-gene interactions using multifactor dimensionality reduction. Expert Rev Mol Diagn. 2004 Nov;4(6): 795 – 803. [Electronic resource] : рroceedings. – Mode of access: WWW.URL: http://www.multifactordimensionalityreduction.org/– Last
access: 2010.
Liu, B., Grossman, R., Zhai, Y. Mining Data Records in Web Pages. KDD-03, 2003.
Zhao, H., Meng, W., Wu, Z., Raghavan, V.,Yu, C. Fully automatic wrapper generation for search engines. WWW-05, 2005