ترجمه فارسی عنوان مقاله
پایش شبکه چندمتغیره آماری مبتنی بر تحلیل مؤلفههای اصلی برای تشخیص ناهنجاری
عنوان انگلیسی
PCA-based multivariate statistical network monitoring for anomaly detection
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
76890 | 2016 | 20 صفحه PDF |
منبع
![الزویر - ساینس دایرکت دانلود مقاله ساینس دایرکت - الزویر](https://isiarticles.com/bundles/Article/front/images/Elsevier-Logo.png)
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Computers & Security, Volume 59, June 2016, Pages 118–137
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1.مقدمه
2. کار مرتبط
3. کنترل فرآیند آماری
3.1 تحلیل مولفههای اصلی
3.2 کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی
۳.۳ تشخیص
3.4 کالیبراسیون مدل: تعداد مؤلفه های اصلی و نرمال سازی
4. پیش پردازش داده ها
5. کنترل دینامیک
۶. بخش آزمایشی
6.1 مطالعه موردی 1: دومین چالش کوچک VAST 2012
6.2 مطالعه موردی 2: سناریو کنترل شده
۷. نتیجه گیری
کلمات کلیدی
1.مقدمه
2. کار مرتبط
3. کنترل فرآیند آماری
3.1 تحلیل مولفههای اصلی
3.2 کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی
۳.۳ تشخیص
3.4 کالیبراسیون مدل: تعداد مؤلفه های اصلی و نرمال سازی
4. پیش پردازش داده ها
5. کنترل دینامیک
۶. بخش آزمایشی
6.1 مطالعه موردی 1: دومین چالش کوچک VAST 2012
6.2 مطالعه موردی 2: سناریو کنترل شده
۷. نتیجه گیری
ترجمه کلمات کلیدی
کنترل فرایند آماری چند متغیره؛ نظارت بر شبکه - امنیت شبکه؛ تجزیه و تحلیل مولفه های اصلی؛ تشخیص ناهنجاری
کلمات کلیدی انگلیسی
Multivariate statistical process control; Network monitoring; Network security; Principal component analysis; Anomaly detection
ترجمه چکیده
یک دهه قبل رویکرد چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی (PCA) برای تشخیص ناهنجاری شدیداً توجه جامعه شبکه ای را عمدتاً به خاطر مقاله لاکهینا و همکاران جلب کرد. با این حال، چندین نویسنده که خواستار تعدادی از محدودیتهای رویکرد بودند از این مقاله انتقاد کردند. هیچکدام از مقالات اصلی و انتقادی که تا آن زمان برای بیش از سه دهه در حوزه پایش صنعتی و شیمی سنجی به عنوان بخشی از تئوری کنترل فرآیند آماری چندمتغیره (MSPC) توسعه یافته بودند به طور کامل از روش تثبیت شده برای تشخیص ناهنجاری تحلیل مؤلفه های اصلی مطلع نبودند. در این مقاله، گام های اصلی رویکرد کنترل فرآیند آماری چندمتغیره بر مبنای تحلیل مؤلفه های اصلی معرفی شده اند؛ نوشتجات مربوط به شبکه بندی بررسی شده است، روی برخی تفاوتها با کنترل فرآیند آماری چندمتغیره و اشکالات در رویکردهای آنها تأکید میشود؛ و ویژگیها و چالشهای موجود در کاربرد کنترل فرآیند آماری چندمتغیره در شبکه بندی تحلیل میشوند. تمام این موارد از طریق آزمایش گویا نشان داده شده است که بحث و استدلال ما را پشتیبانی میکند.
ترجمه مقدمه
قابلیت برجسته تحلیل چند متغیره برای تشخیص ناهنجاریها در چندین حوزه از جمله پایش صنعتی (کاماچو و همکاران، 2009؛ چن و همکاران، 2002؛ هو و همکاران، 2008؛ نومیکاس و مک گریگور، 1994) و شبکه سازی (بروکوف همکاران، 2009؛ کاتزیگیاناکیس و اندرولیداکیس، 2009؛ لاکهینا و همکاران، 2004؛ مونز، 2010؛ رینگبرگ و همکاران، 2007) . استفاده از تحلیل چندمتغیره برای تشخیص ناهنجاری به طور معمول به کنترل فرآیند آماری چندمتغیره اشاره دارد (فریر، 2014). ابزار اصلی در رل فرآیند آماری چندمتغیره تحلیل مؤلفه های اصلی است.
کار پیشرو توسط لاکهینا و همکاران (2004) استفاده از تحلیل مؤلفه های اصلی برای تشخیص ناهنجاری شبکه را معرفی کرد. یک دهه پیش رویکرد آنها شدیداً توجه جامعه شبکه ای را جلب کرد و در نتیجه انواع پیشنهادهای دیگر براساس آن ایجاد شد. با این حال، این رویکرد نیز توسط تعدادی از مقالات مورد انتقاد قرار گرفت. رینگبرگ و همکاران (2007) ادعا کردند که این رویکرد نسبت به تنظیمات درجه بندی حساس است. به خصوص این که:
1. نرخ مثبت کاذب نسبت به تفاوتهای کوچک در تعداد مؤلفه های اصلی در زیرفضای نرمال بسیار حساس است.
2. کارایی تحلیل مؤلفه های اصلی نسبت به میزان تراکم اندازه گیریهای ترافیک حساس است.
3. یک ناهنجاری بزرگ ممکن است ناخواسته زیرفضای نرمال را آلوده کرده و ناشناخته بماند.
4. تشخیص صحیح یک مشکل ذاتاً چالش برانگیز است.
در اینجا ما استدلال میکنیم که این مشکلات فرضی نتیجه نقص در پذیرش تحلیل مؤلفه های اصلی برای حوزه تشخیص ناهنجاری است. لازم به ذکر است که چنین نقایصی نه تنها در رویکرد اصلی بلکه در منتقدان
--------------------------
نویسنده مربوطه نیز یافت میشوند. اگرچه لاکهینا و همکارانش متوجه شدند که رویکردهای مشابهی قبلاً در حوزه مهندسی شیمی به کار گرفته میشدند، اما بخش عمدهای (تا آن زمان) از فرضیه مسلم کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی در مقالات آنها نادیده گرفته شده است.
در این کار، ما نظریه کنترل فرآیند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی را بررسی میکنیم، و بر تفاوتها در رویکردهای لاکهینا و همکاران و نویسندگان بعدی تأکید کرده و این تفاوتها را با ارائه نمونه ها و مثالها نشان میدهیم. ما برای تشخیص ناهنجاری در شبکه های ارتباطی به عنوان پایش شبکه آماری چندمتغیره ( (MSNMبه رویکردی که نظریه کنترل فرآیند آماری چندمتغیره را دنبال میکند اشاره میکنیم. در پایش شبکه آماری چندمتغیره، واژه آخر یعنی «پایش» برای کنترل ترجیح داده شده است، که به ندرت در جامعه شبکه ای استفاده قرار میشود. به علاوه، واژه «کنترل» مانند کنترل بازخورد خودکار معانی متفاوتی در زمینههای دیگر نسبت به آمار دارد (کاماچو، ۲۰۰۷؛ مک گریگور و کورتی ، ۱۹۹۵).
بقیه مقاله به شرح زیر سازماندهی شده است. بخش ۲ به بررسی کارهای اصلی بر روی تشخیص ناهنجاری شبکه بر مبنای تحلیل مؤلفههای اصلی میپردازد. بخش ۳ اصول کنترل فرآیند آماری را به خصوص در مورد استفاده از کنترل فرایند آماری چندمتغیره مبتنی بر تحلیل مؤلفه های اصلی نشان میدهد. پس از آن بخش ۴ به بحث قبل از پردازش داده های شبکه ای میپردازد تا با تحلیل مؤلفه های اصلی تحلیل شود، در حالی که پردازش مناسب برای مدلسازی دینامیکی متعاقبا ً در بخش ۵ توضیح داده میشود. بحث و استدلال انجام شده تا زمانی که این نکته با استفاده از برخی مثالهای گویا در بخش ۶ نشان داده شود. در نهایت، بخش ۷ سهم اصلی کار و چالشهای آینده را نشان میدهد.