ترجمه فارسی عنوان مقاله
مدل رگرسیون لجستیک تأثیرات تصادفی برای کشف ناهنجاری
عنوان انگلیسی
Random effects logistic regression model for anomaly detection
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
24847 | 2014 | 5 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Expert Systems with Applications, Volume 37, Issue 10, October 2010, Pages 7162–7166
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1.مقدمه
1. کشف ناهنجاری:
2. مدل رگرسیون لجستیک مربوط به تأثیرات اتفاقی
3. تحلیل تجربی:
جدول یک: تشریح متغیر های انتخابی.
جدول دو: تخمین احتمال حد اکثر از مدل رگرسیون لجستیک تأثیر ثابت برای تشخیص نابهنجاری:
جدول سه: نتایج دقت طبقهبندی برای مدل رگرسیون تأثیر ثابت.
4. نتیجهگیری:
ترجمه کلمات کلیدی
99 - تشخیص ناهنجاری -
نفوذ -
اثرات تصادفی -
کلمات کلیدی انگلیسی
Anomaly detection,
Intrusion,
Random effects,
KDD-99,
ترجمه چکیده
درحالیکه تأثیرات اینترنت بهعنوان وسیلهای برای ارتباطات و تجارت گسترش مییابد؛ تهدید از جانب ارسالکنندگان هرزنامهها، کسانی که سامانهها را مورد هجوم قرار میدهند و سازمانهای خلافکار به همان نسبت توسعهیافته است. این مقاله یک مدل رگرسیون لجستیک تأثیرات تصادفی را بهمنظور پیشبینی و کشف ناهنجاری، پیشنهاد میکند. برخلاف مطالعات قبلی بر روی تشخیص ناهنجاری، یک مدل تأثیرات تصادفی به کار گرفته شد که نهتنها دارای عوامل احتمال خطر افشای اطلاعات است، بلکه عدم اطمینانی را که توسط عوامل احتمال خطر توضیح داده نشده را نیز در نظر میگیرد. عوامل خاص در ردهبندی احتمالات خطر همانند اطلاعات مربوط به نوع پروتکل و اطلاعات ورود به سیستمی که ذخیرهشدهاند، در مدل پیشنهادی این مقاله منظور شده است. این تحقیق بر پایه نمونهای از 49427 مشاهده تصادفی در مورد 42 متغیر در مجموعه اطلاعات KDD-Cup1999 (مسابقه کشف دانش و ابزار دادهکاوی) است، که شامل اتصالات عادی و ناهنجار است. مدل پیشنهادی ضریب درستی 98.94 درصد برای مجموعه اطلاعات آموزشی و 98.68 درصد برای مجموعه اطلاعات راستی آزمایی را نشان میدهد.
ترجمه مقدمه
درحالیکه پیشرفتهای فنّاوری استفاده از اینترنت به ارتباط مردم در سراسر جهان کمک میکند، تأثیراتش را نیز بهعنوان وسیلهای جهت ارتباطات و تجارت گسترش میدهد؛ به همان سرعت تهدید از جانب ارسالکنندگان هرزنامهها و حملهکنندگان به سیستم و سازمانهای خلافکار بهطور مداوم افزایشیافته است. سیستمهای کشف نفوذ (IDS)، بررسی سوابق را بهمنظور کشف هرگونه رفتار غیرمعمول کاربر تجزیهوتحلیل مینماید. بهعلاوه IDS فعالیتهای خصمانه و یا سوءاستفاده از یک شبکه را کشف میکند (دپن، توپالار، اناریم و سیلیز، 2005). اگرچه ایدهی پشت تشخیص نفوذ این است که میتوان الگوهای سادهی رفتار کاربر مجاز را میتوان اخذ نمود و رفتار کاربر ناهنجار از کاربر عادی را تشخیص داد (اندرسون، 1980)بااینوجود شناسایی رفتار غیرعادی، هنوز هم به دلیل حملات غیرمنتظره وظیفهای دشوار است (وانگ، 2005).
تجزیهوتحلیل آماری رایجترین روش برای تعریف رفتار عادی با جمعآوری دادههای مربوط به رفتار کاربر مجاز طی یک دوره زمانی است (اندرسون، لانت، جاویتس، تامارو و والدز، 1995). روشهای آماری که جهت کشف ناهنجاری به کار گرفتهشدهاند شامل تجزیهوتحلیل اجزای تشکیلدهنده اصلی (شایول، چن، سارینا پاکرون 1 و چانگ، 2003)، تجزیهوتحلیل مجموعهای و متغیرهای چندتایی (تیلور و آلوس فوس، 2002)، تجزیهوتحلیل بایسیان (Bayesian) (باربارد و جاجودیا، 2001)، آزمونهای ساده و دورهای معنیدار (ماسوم، یه، چن و نووح، 2000؛ کین و هوآنگ، 2004؛ ژو و لانگ، 2003) و رگرسیون محاسبهای چندجملهای (وانگ، 2005). گوادیا، فارکاس و والتورتا (2005)، با استفاده از سیستم کشف ناهنجاری مبتنی بر شبکه بایسیان (Bayesian) موجود، احتمال وقوع حملات خاص را ، در نظر گرفتند. ایشان قادر به پیشبینی احتمال وقوع حملات خاص با مشاهده ترتیب پارامترهای ورودی همخوان بودند. لی، کیم و کوان (2008) روشی را بهمنظور کشف پیش فعال حملهی عدم پذیرش سرویس (DDOS) بهوسیلهی دستکاری در ساختار این حملات پیشنهاد کردند؛ که شامل منتخبی از کنترل ورودی و خروجی (Handler) ها، عوامل، ارتباطات، تهدید و حمله بهوسیله تجزیهوتحلیل مجموعه است. وو و ژانگ (2006) برای کشف ناهنجاری در شبکه اینترنت، سیستم کشف موارد ناهنجاری و الگوریتم مجموعهای نوینی را بر پایه تجزیهوتحلیل عوامل و فاصله ماهالانوبیس ارائه کردند. دپرن و همکاران (2007)، ساختار IDS جدیدی را پیشنهاد کردند که هر دو روش کشف استفاده نادرست و یا ناهنجار را به کار میبرد. این برنامه کشف ناهنجاری پیشنهادی برای الگوسازی رفتار عادی از یک ساختار نقشهی خود نظمدهنده (SOM) استفاده میکند. SOM یک مدل شبکه عصبی برای تجزیهوتحلیل و در نظر آوردن اطلاعات در ابعاد بزرگ است. آرانز، کروز، سانز بوبی، روییز و کوتینو (2008) برای کشف ناهنجاری از شبکه عصبی (SOM) استفاده میکردند.
روش بررسی آماری کشف ناهنجاری، مزایا و معایب گوناگونی دارد. اولا نقطهضعف آن این است که مهاجمان ماهر میتوانند به تشخیص ناهنجاری آماری عادت کنند. همچنین این روش به عدم توانایی رمزگشایی تفاوت بین رفتار عادی و ناهنجار شناختهشده است. همچنین تشخیص آستانههای تعادل بین امکان مثبت کاذب با منفی کاذب برایش دشوار است. بهعلاوه روشهای آماری نیاز به توزیع آماری دقیق دارند؛ اما همه رفتارها را نمیتوان با استفاده از روشهای صرفاً آماری مدلسازی کرد (پاچا و پارک،2007). با این حال مزیت آن نهتنها توانایی تشخیص حملات جدید یا ناشناخته است؛ بلکه سیستم ها نیز نیازی به دانش قبلی از نقایص امنیتی یا حملهها ندارند. رویکردهای آماری میتوانند اطلاعرسانی دقیقی از فعالیتهای مضر که معمولاً در طول زمان به وجود میآیند فراهم آورند و نشانههای خوبی از حملات غریب الوقوع هستند.
یکی از روشهای آماری رایج مدل رگرسیون تأثیرات لجستیک ثابت است؛ که پیشبینی کنندههای رفتار ناهنجار را دارا است. بااینوجود، این مدل شامل متغیرهای غیر قابل توضیح توسط پیشبینی کنندگان رفتار ناهنجار نیست.
بر این اساس، در این مقاله یک مدل رگرسیون لجستیک مربوط به تأثیرات تصادفی پیشنهادشده است. مزیت استفاده از چنین مدل اثرات تصادفی برای تشخیص موارد ناهنجاری این است که نهتنها خصوصیات محیطی شبکهای بلکه همچنین عدم قطعیتی را که نمیتواند توسط چنین خصوصیات محیط شبکهای توضیح داده شود را نیز ، دارا است.
مدل اثرات تصادفی قالبا در فراهم آوردن تغییرات بین مجموعهای و تغییرات داخل مجموعهای مورداستفاده قرار میگیرد (سون،1996، 1997،1999،2002) و (سون و چوی، 2006) و (سون و پارک، 2007).
رووس مطالب این بررسی به شرح زیر است:
بخش دوم تشخیص موارد غیرعادی را معرفی میکند و بخش سوم به بررسی مدل رگرسیون لجستیک مربوط به تأثیرات تصادفی برای کشف ناهنجاری میپردازد. بخش چهارم شامل بررسی موردی تجربی و نتایج آن بوده و سرانجام در بخش پنجم نتایج بررسی خلاصه میشود.