دانلود مقاله ISI انگلیسی شماره 76890
ترجمه فارسی عنوان مقاله

پایش شبکه چندمتغیره آماری مبتنی بر تحلیل مؤلفههای اصلی برای تشخیص ناهنجاری

عنوان انگلیسی
PCA-based multivariate statistical network monitoring for anomaly detection
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
76890 2016 20 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Computers & Security, Volume 59, June 2016, Pages 118–137

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1.مقدمه

2. کار مرتبط

3. کنترل فرآیند آماری

3.1 تحلیل مولفه‌های اصلی

3.2 کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی

۳.۳ تشخیص

3.4 کالیبراسیون مدل: تعداد مؤلفه های اصلی و نرمال سازی

4. پیش پردازش داده ها

5. کنترل دینامیک 

۶. بخش آزمایشی

6.1 مطالعه موردی 1: دومین چالش کوچک VAST 2012

6.2 مطالعه موردی 2: سناریو کنترل شده

۷. نتیجه گیری
ترجمه کلمات کلیدی
کنترل فرایند آماری چند متغیره؛ نظارت بر شبکه - امنیت شبکه؛ تجزیه و تحلیل مولفه های اصلی؛ تشخیص ناهنجاری
کلمات کلیدی انگلیسی
Multivariate statistical process control; Network monitoring; Network security; Principal component analysis; Anomaly detection
ترجمه چکیده
یک دهه قبل رویکرد چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی (PCA) برای تشخیص ناهنجاری شدیداً توجه جامعه شبکه ای را عمدتاً به خاطر مقاله لاکهینا و همکاران جلب کرد. با این حال، چندین نویسنده که خواستار تعدادی از محدودیتهای رویکرد بودند از این مقاله انتقاد کردند. هیچکدام از مقالات اصلی و انتقادی که تا آن زمان برای بیش از سه دهه در حوزه پایش صنعتی و شیمی سنجی به عنوان بخشی از تئوری کنترل فرآیند آماری چندمتغیره (MSPC) توسعه یافته بودند به طور کامل از روش تثبیت شده برای تشخیص ناهنجاری تحلیل مؤلفه های اصلی مطلع نبودند. در این مقاله، گام های اصلی رویکرد کنترل فرآیند آماری چندمتغیره بر مبنای تحلیل مؤلفه های اصلی معرفی شده اند؛ نوشتجات مربوط به شبکه بندی بررسی شده است، روی برخی تفاوتها با کنترل فرآیند آماری چندمتغیره و اشکالات در رویکردهای آنها تأکید میشود؛ و ویژگیها و چالشهای موجود در کاربرد کنترل فرآیند آماری چندمتغیره در شبکه بندی تحلیل میشوند. تمام این موارد از طریق آزمایش گویا نشان داده شده است که بحث و استدلال ما را پشتیبانی میکند.
ترجمه مقدمه
قابلیت برجسته تحلیل چند متغیره برای تشخیص ناهنجاریها در چندین حوزه از جمله پایش صنعتی (کاماچو و همکاران، 2009؛ چن و همکاران، 2002؛ هو و همکاران، 2008؛ نومیکاس و مک گریگور، 1994) و شبکه سازی (بروکوف همکاران، 2009؛ کاتزیگیاناکیس و اندرولیداکیس، 2009؛ لاکهینا و همکاران، 2004؛ مونز، 2010؛ رینگبرگ و همکاران، 2007) . استفاده از تحلیل چندمتغیره برای تشخیص ناهنجاری به طور معمول به کنترل فرآیند آماری چندمتغیره اشاره دارد (فریر، 2014). ابزار اصلی در رل فرآیند آماری چندمتغیره تحلیل مؤلفه های اصلی است. کار پیشرو توسط لاکهینا و همکاران (2004) استفاده از تحلیل مؤلفه های اصلی برای تشخیص ناهنجاری شبکه را معرفی کرد. یک دهه پیش رویکرد آنها شدیداً توجه جامعه شبکه ای را جلب کرد و در نتیجه انواع پیشنهادهای دیگر براساس آن ایجاد شد. با این حال، این رویکرد نیز توسط تعدادی از مقالات مورد انتقاد قرار گرفت. رینگبرگ و همکاران (2007) ادعا کردند که این رویکرد نسبت به تنظیمات درجه بندی حساس است. به خصوص این که: 1. نرخ مثبت کاذب نسبت به تفاوتهای کوچک در تعداد مؤلفه های اصلی در زیرفضای نرمال بسیار حساس است. 2. کارایی تحلیل مؤلفه های اصلی نسبت به میزان تراکم اندازه گیریهای ترافیک حساس است. 3. یک ناهنجاری بزرگ ممکن است ناخواسته زیرفضای نرمال را آلوده کرده و ناشناخته بماند. 4. تشخیص صحیح یک مشکل ذاتاً چالش برانگیز است. در اینجا ما استدلال میکنیم که این مشکلات فرضی نتیجه نقص در پذیرش تحلیل مؤلفه های اصلی برای حوزه تشخیص ناهنجاری است. لازم به ذکر است که چنین نقایصی نه تنها در رویکرد اصلی بلکه در منتقدان -------------------------- نویسنده مربوطه نیز یافت میشوند. اگرچه لاکهینا و همکارانش متوجه شدند که رویکردهای مشابهی قبلاً در حوزه مهندسی شیمی به کار گرفته میشدند، اما بخش عمدهای (تا آن زمان) از فرضیه مسلم کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی در مقالات آنها نادیده گرفته شده است. در این کار، ما نظریه کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی را بررسی میکنیم، و بر تفاوتها در رویکردهای لاکهینا و همکاران و نویسندگان بعدی تأکید کرده و این تفاوتها را با ارائه نمونه ها و مثالها نشان میدهیم. ما برای تشخیص ناهنجاری در شبکه های ارتباطی به عنوان پایش شبکه آماری چندمتغیره ( (MSNMبه رویکردی که نظریه کنترل فرآیند آماری چندمتغیره را دنبال میکند اشاره میکنیم. در پایش شبکه آماری چندمتغیره، واژه آخر یعنی «پایش» برای کنترل ترجیح داده شده است، که به ندرت در جامعه شبکه ای استفاده قرار میشود. به علاوه، واژه «کنترل» مانند کنترل بازخورد خودکار معانی متفاوتی در زمینههای دیگر نسبت به آمار دارد (کاماچو، ۲۰۰۷؛ مک گریگور و کورتی ، ۱۹۹۵). بقیه مقاله به شرح زیر سازماندهی شده است. بخش ۲ به بررسی کارهای اصلی بر روی تشخیص ناهنجاری شبکه بر مبنای تحلیل مؤلفههای اصلی میپردازد. بخش ۳ اصول کنترل فرآیند آماری را به خصوص در مورد استفاده از کنترل فرایند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی نشان میدهد. پس از آن بخش ۴ به بحث قبل از پردازش داده های شبکه ای میپردازد تا با تحلیل مؤلفه های اصلی تحلیل شود، در حالی که پردازش مناسب برای مدلسازی دینامیکی متعاقبا ً در بخش ۵ توضیح داده میشود. بحث و استدلال انجام شده تا زمانی که این نکته با استفاده از برخی مثالهای گویا در بخش ۶ نشان داده شود. در نهایت، بخش ۷ سهم اصلی کار و چالشهای آینده را نشان میدهد.
پیش نمایش مقاله
پیش نمایش مقاله  پایش شبکه چندمتغیره آماری مبتنی بر تحلیل مؤلفههای اصلی  برای تشخیص ناهنجاری

چکیده انگلیسی

The multivariate approach based on Principal Component Analysis (PCA) for anomaly detection received a lot of attention from the networking community one decade ago, mainly thanks to the work of Lakhina and co-workers. However, this work was criticized by several authors who claimed a number of limitations of the approach. Neither the original proposal nor the critic publications were completely aware of the established methodology for PCA anomaly detection, which by that time had been developed for more than three decades in the area of industrial monitoring and chemometrics as part of the Multivariate Statistical Process Control (MSPC) theory. In this paper, the main steps of the MSPC approach based on PCA are introduced; related networking literature is reviewed, highlighting some differences with MSPC and drawbacks in their approaches; and specificities and challenges in the application of MSPC to networking are analyzed. All of this is demonstrated through illustrative experimentation that supports our discussion and reasoning.