ANALYSIS OF REQUIREMENTS FOR AUTOMATED METHODS OF DATA EXTRACTION SAME OBJECTS FROM WEB-SPACE

Authors

  • Марія Сергіївна Бурматова Infopulse LLC
  • Михайло Вікторович Оленін National Aviation University

Keywords:

Extract data, method wrappers, automated retrieval, syntactic extraction methods.

Abstract

The5 following listed Web-data mining methods are analyzed for the correspondence to the set requirements: method Sunny, wrappers method, automatic extraction method, syntaxic method, text mining method. Sunny and text mining methods are proved to be the most corresponding to the set requirements.

Author Biographies

Марія Сергіївна Бурматова, Infopulse LLC

Project Manager, Infopulse LLC. Scientific interests: data mining, data storage solutions.

Михайло Вікторович Оленін, National Aviation University

PhD., Associate Professor of Software Engineering Department of the National Aviation University. Scientific interests: intelligent systems.

References

Бурматова М.С., Оленін М.В. Аналіз сучасних пошукових систем на предмет їх придатності для пошуку і вилучення інформації про однотипні об’єкти з Web-простору: матеріали міжнародної науково-технічної конференції УкрПрог 2010, Київ, Україна – К., 2010.

Moore JH. Computational analysis of gene-gene interactions using multifactor dimensionality reduction. Expert Rev Mol Diagn. 2004 Nov;4(6): 795 – 803. [Electronic resource] : рroceedings. – Mode of access: WWW.URL: http://www.multifactordimensionalityreduction.org/– Last

access: 2010.

Liu, B., Grossman, R., Zhai, Y. Mining Data Records in Web Pages. KDD-03, 2003.

Zhao, H., Meng, W., Wu, Z., Raghavan, V.,Yu, C. Fully automatic wrapper generation for search engines. WWW-05, 2005

Issue

Section

IMPROVEMENT OF SOFTWARE LIFECYCLE PROCESS