Методологія класифікації листів електронної пошти з використанням нейронних мереж

Автор(и)

  • Ігор Анатолійович Терейковський Національний технічний університет України «Київський політехниічний інститут»

DOI:

https://doi.org/10.18372/2410-7840.15.4775

Ключові слова:

електронна пошта, спам, витік, нейронна мережа, карта Кохонена

Анотація

Ефективність захисту електронної пошти багато в чому залежить від достовірності розпізнавання в листах спаму та витоків. Існуючі засоби розпізнавання базуються на статистичних методах аналізу текстової інформації, що значно обмежує їх можливості щодо виявлення нових видів спаму та витоків. З метою подолання цього недоліку запропоновано методологію класифікації листів на основі змістовного аналізу електронного за допомогою нейронних мереж. Запропоновано використовувати в якості вхідних параметрів нейронної мережі частоту зустрічі в тексті листа інформативних слів в канонічні формі. Доведено, що оптимальним типом нейромережевої моделі є карта Кохонена, основною перевагою якої є висока швидкість навчання та можливість зручної візуалізації результатів класифікації. Це дозволяє швидко реагувати на нові вити спаму та витоків та проводити остаточну класифікацію листів самим користувачем. Проведені експерименти підтвердили ефективність запропонованої методології.

Біографія автора

Ігор Анатолійович Терейковський, Національний технічний університет України «Київський політехниічний інститут»

кандидат технічних наук, доцент, доцент кафедри системного програмування та спеціалізованих комп’ютерних систем Національного технічного університету України «Київський політехниічний інститут»

Посилання

Заболеева-Зотова А.В. Естественный язык в автоматизированных системах. Семантический анализ текстов / А.В. Заболеева-Зотова. – Волгоград : ВолгГТУ, 2002. – 228 с.

Зиновьев А.Ю. Визуализация многомерных даннях / А. Ю. Зиновьев. - М. : СК Пресс, 2005. - 180 с.

Ежов А. А. Нейрокомпьютинг и его применения в экономике и бизнесе / А. А. Ежов, С. А. Шумский. - М. : МИФИ, 1998. - 224 с.

Терейковський И. А. Применение семантического анализа содержимого электронных писем в системах распознавания спама / И. А. Терейковский // Захист інформації. – 2006. - № 4. – С. 49-60.

Терейковський І.А. Оптимізація архітектури нейронної мережі призначеної для діагностики стану комп’ютерної мереж / І. А. Терейковський // Наук.-техн. зб. Управління розвитком складних систем Київського національного університету будівництва і архітектури. – 2011. – Випуск 6. – С. 155-158.

Zaboleeva-A.V. Zotova Natural language in automated systems. Semantic text analysis / A. Zaboleeva-Zotov., Volgograd Volgograd State Technical University, 2002, 228 p.

Zinoviev A. Visualization of multidimensional dannyah, M. SK Press, 2005, 180 р.

Yezhov A. A. Neurocomputing and its applications in economics and business / A.A. Ezhov, SA Shumsky.,Moscow Engineering Physics Institute, 1998, 224 р.

Tereykovskiy I. A. application of semantic analysis of the content of emails in spam detection systems Zahist іnformatsії, 2006, № 4, Р. 49-60.

Tereykovskiy I. A. Optimization of neural network architecture designed to diagnose the state of the computer networking, Scientific and Technical. Collected. Management of complex systems Kyiv National University of Construction and Architecture, 2011, Release 6, Р. 155-158.

##submission.downloads##

Опубліковано

2013-06-13

Номер

Розділ

Статті