دانلود مقاله ISI انگلیسی شماره 137829
ترجمه فارسی عنوان مقاله

استفاده از محاسبات تکاملی برای کشف الگوهای اسپم از نمونه های ایمیل

عنوان انگلیسی
Using evolutionary computation for discovering spam patterns from e-mail samples
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
137829 2018 15 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Information Processing & Management, Volume 54, Issue 2, March 2018, Pages 303-317

ترجمه کلمات کلیدی
برنامه ریزی ژنتیکی، عبارات منظم، نسل خودکار، پست الکترونیک، فیلتر کردن هرزنامه،
کلمات کلیدی انگلیسی
Genetic programing; Regular expressions; Automatic generation; E-mail; Spam filtering;
پیش نمایش مقاله
پیش نمایش مقاله  استفاده از محاسبات تکاملی برای کشف الگوهای اسپم از نمونه های ایمیل

چکیده انگلیسی

One of the most relevant problems affecting the efficient use of e-mail to communicate worldwide is the spam phenomenon. Spamming involves flooding Internet with undesired messages aimed to promote illegal or low value products and services. Beyond the existence of different well-known machine learning techniques, collaborative schemes and other complementary approaches, some popular anti-spam frameworks such as SpamAssassin or Wirebrush4SPAM enabled the possibility of using regular expressions to effectively improve filter performance. In this work, we provide a review of existing proposals to automatically generate fully functional regular expressions from any input dataset combining spam and ham messages. Due to configuration difficulties and the low performance achieved by analysed schemes, in this work we introduce DiscoverRegex, a novel automatic spam pattern-finding tool. Patterns generated DiscoverRegex outperform those created by existing approaches (able to avoid FP errors) whilst minimising the computational resources required for its proper operation. DiscoverRegex source code is publicly available at https://github.com/sing-group/DiscoverRegex.