ترجمه فارسی عنوان مقاله
پیش بینی معیارهای عملکردی چندپردازنده ای با حافظه اشتراکی توزیع شده نوری با استفاده از رگرسیون بردارپشتیبان
عنوان انگلیسی
Predicting the performance measures of an optical distributed shared memory multiprocessor by using support vector regression
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
25269 | 2010 | 9 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Expert Systems with Applications, Volume 37, Issue 9, September 2010, Pages 6293–6301
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1- مقدمه
2- مروری بر اتصال SOME-Bus
3- رگرسیون بردار پشتیبان
3-1- SVR خطی
3-2- SVR غیرخطی
4- روش پیش بینی عملکرد با استفاده از SVR
4-1- چارچوب شبیه سازی و ایجاد مجموعه داده
4-2- مدل SVR
5- نتایج و بحث
6- جمع بندی و نتیجه گیری
کلمات کلیدی
1- مقدمه
2- مروری بر اتصال SOME-Bus
3- رگرسیون بردار پشتیبان
3-1- SVR خطی
3-2- SVR غیرخطی
4- روش پیش بینی عملکرد با استفاده از SVR
4-1- چارچوب شبیه سازی و ایجاد مجموعه داده
4-2- مدل SVR
5- نتایج و بحث
6- جمع بندی و نتیجه گیری
ترجمه کلمات کلیدی
رگرسیون بردار پشتیبانی - چند پردازنده ها - حافظه داخلی توزیع شده - شبکه های میان ارتباطی
کلمات کلیدی انگلیسی
Support vector regression,Multiprocessors,Distributed shared memory,Interconnection networks
ترجمه چکیده
پیشرفت های اخیر در توسعه فناوری های نوری، به ظهور احتمالی اتصال های نوری در داخل چندپردازنده های با حافظه اشتراکی توزیع شده (DSM) رهنمون شده است. عملکرد این معماری های DSM باید تحت مقادیر مختلف پارامترهای DSM مورد ارزیابی قرار گیرد. در این مقاله، ما به ارائه مدل رگرسیون برداری پشتیبان (SVR) برای پیش بینی معیارهای عملکرد (یعنی تأخیر میانگین شبکه، زمان انتظار کانال میانگین و میانگین بکارگیری پردازنده) برای معماری چندپردازنده ای DSM که با گذرگاه های تبادل چندپردازنده ای نوری همزمان (SOME) به هم متصل شده اند، خواهیم پرداخت. این گذرگاه ، دارای پهنای باند بالا و شبکه ارتباطی فیبر نوری است. ایده اصلی، جمع اوری تعداد کمی نقاط داده ای با استفاده از شبیه سازی آماری و پیش بینی معیارهای عملکرد سیستم برای مجموعه بزرگی از پارامترهای ورودی بر پایه ی این داده هاست. ازOPNET Modeler برای شبیه سازی معماری چندپردازنده ای برمبنای DSM و با گذرگاه SOME و همچنین ایجاد مجموعه داده-های آموزش و آزمایش برای آن استفاده می گردد. خطای پیش بینی و ضرایب مربوط به مدل SVR با مدل های رگرسیون خطی چندگانه (MLR) و شبکه عصبی مصنوعی (ANN) پیش خوراند مقایسه می گردد. نتایج نشان می دهند که مدل SVR-RBF دارای کمترین خطای پیش بینی بوده و از همه قدرتمندتر است. چنین جمع بندی می شود که مدلSVR زمان لازم برای بدست آوردن معیارهای عملکردی چندپردازنده DSM را اندکی کاهش داده و می تواند به عنوان ابزاری مؤثر در این راستا به کارگرفته شود.
ترجمه مقدمه
چندپردازنده های DSM با مقیاس بزرگ، عملی ترین راه برای دستیابی به قدرت محاسباتی عظیم در بسیاری از کاربردهای علمی و مهندسی است. سیستم های DSM، قادر به فراهم آوردن فضای آدرس دهی اشتراکی با توزیع فیزیکی حافظه در بین پردازنده های مختلف هستند (Culler, Singh, & Gupta, 1997). قدرت اصلی سیستم های به اینکه ارتباطات در آن ها به طور ضمنی در نتیجه دستورالعمل های معمول دسترسی به حافظه (یعنی بارها و طبقات) صورت می گیرد، برمی گردد. چنین موضوعی، برنامه نویسی آن ها را ساده تر می کند. هرچند، موفقیت این سیستم ها شدیداً به کارایی شبکه اتصال نهفته در آن ها، که امکان ارتباط بین گره های پردازشی را با یکدیگر فراهم می کنند، وابسته است. این شبکه اتصال، تأثیر مستقیمی بر تأخیر حافظه راه دور، که از دسترسی به مکان حافظه ای در پردازنده ای به جز پردازنده ای که درخواست در اصل از سوی آن ارسال شده ناشی می گردد، دارد. هر دسترسی به حافظه راه دور، حدود 3 تا 5 برابر از نظر مرتبه بزرگی بیشتر از دسترسی به حافظه محلی زمان می برد (Hagersten &Koster, 1999; Laudon & Lenoski, 1997). بیشتر این زمان، صرف ارتباط روی شبکه اتصال سیستم می گردد. اگرچه سیستم های DSM از روش های کاهش/مخفی-سازی تأخیربرای کاهش تأخیر دسترسی به حافظه راه دور بهره می برند (Gharachorloo et al., 1990)، این روش ها نیازمند پهنای باند اضافی بوده و ترافیک حافظه را با آوردن داده هایی بیشتر از میزان موردنیاز، به میزان زیادی افزایش می دهند (Lenoski & Weber, 1995). به علاوه، هر تبادل در سیستم DSM، از درخواست، پاسخ (داده) و چند پیغام اعلام وصول و همخوانی تشکیل یافته است. هنگامی که اندازه سیستم افزایش می یابد، پردازنده های بیشتری مشغول وارد کردن پیغام های بیشتر (هم پیغام های مربوط به تبادل و هم درخواست های تحمل تأخیر)درون شبکه می شوندکه سبب رقابت شبکه (Pai & Panda, 1997) برای منابع اشتراکی مختلف می گردد.
سیستم های DSM کوچکتر که دارای 4 تا 8 گره هستند، معمولاً از طریق تنها یک سوئیچ به هم متصل می-شوند. در سیستمی بزرگتر، به سلسله مراتبی از سوئیچ ها نیاز است. این موضوع، سبب تأخیر در مراحل سوئیچینگ اضافی شده و به نوبه ی خود تأخیر دسترسی راه دور را افزایش می دهد (Cray, 2004). در مرجع Huang, Sze, Landin, Lytel, and Davidson (2003) گزارش شده که با تغییر از چندپردازنده ای با اندازه متوسط تا چندپردازنده ای بزرگ، تأخیر دسترسی به حافظه تا 60% افزایش پیدا نموده است. سیستم های DSM با عملکرد بالا در آینده، از پردازنده های تجاری با تولید انبوه استفاده می کنند که نیاز به پهنای باند محاسباتی و ارتباطی انباشته از مرتبه 4 تا 40 ترابایت بر ثانیه دارند (Lemoff et al., 2004). بنابراین، نبود پهنای باند کافی، مانعی اساسی بر سر راه سیستم های DSM بزرگ در آینده خواهد بود.
یکی از فناوری هایی که دارای قابلیتی بالقوه در فراهم نمودن پهنای باندهای بالاتر و تأخیرهای کمتر از اتصال های الکترونیکی حال حاضر است، اتصال های نوری است (Collet et al., 2000; Puet al., 1999).
فیبرهای نوری دارای پهنای باند بسیار بالایی هستند و می توان از چندتای آن ها برای ایجاد تعداد زیادی از کانال-های ارتباطی مستقل، در کنار هم استفاده نمود. با پیشرفت قابل توجهی که اخیراً در ابزارهای نوری و نوری-الکترونیکی ایجاد شده، اتصال های نوری به گزینه ای مناسب و اقتصادی برای شبکه های اتصال نوری با پهنای باند بالا، تأخیر کم و بزرگ تبدیل شده اند. یکی از این اتصال های نوری، گذرگاه SOME است که ابزارهای نوری-الکترونیکی را در معماری پردازشی دارای عملکرد بسیار بالا جای می دهد. این نوع گذرگاه،دارای شبکه ای اتصالی با تأخیر پایین، پهنای باند بالا، با فیبر نوری است که هر گره را مستقیماً به همه گره های دیگر وصل می نماید. یکی از ویژگی های کلیدی این نوع گذرگاه، آن است که هر یک از N گره دارای کانال پخشی اختصاصی است که در سرعت 20 تا 30 گیگابایت کار می کند و توسط گروهی از طول موج ها در فیبری مشخص درک می شود. همچنین، این گره ها دارای واسط کانالی ورودی بر پایه ی آرایه ای از N دریافت کننده، که به طور همزمان همه N کانال را پایش می کنند، هستند. این موضوع سبب داشتن شبکه ای که به طور مؤثر کاملاً با هم ارتباط دارند، می-گردد. جزئیات بیشتر در مورد شبکه اتصال گذرگاه SOME را می توانید در مرجع Akay and Katsinis (2008) ملاحظه کنید.
تحلیل عملکرد معماری شبکه، عاملی حیاتی در طراحی سیستم های چندپردازنده ای DSM است. غالباً، به دلیل ماهیت مسئله، در این مورد شبیه سازی تنها روش عملی است؛ چون استفاده از روش های تحلیلی بسیار دشوار است. شبیه سازی می تواند در سطوح متعددی، از مدار گرفته تا سیستم و با درجه های مختلفی از جزئیات با کامل شدن طراحی صورت پذیرد. شبیه سازی های چندپردازنده ای اجرایی و مبتنی بر ردیابی (Sendag, Yilmazer, Yi, & Uht, 2007; Thiele, Wandeler, & Chakraborty, 2005) به طور گسترده به منظور دستیابی به پیش بینی قابل اعتماد و دقیقی از طراحی نهایی صورت می گیرند. یکی از مشکلات شبیه-سازی آن است که هرچند این شبیه سازی ها می توانند در سطح انتزاعی بالایی انجام شوند، اما همچنان زمان بر هستند. دلایل متعددی وجود دارد که سبب این موضوع می گردد. اولاً، محک هایی که نیاز به شبیه سازی دارند، معمولاً از چندین صد میلیارد دستورالعمل های به صورت دینامیکی اجرا شده تشکیل می شود. ثانیاً، نیاز است که چند مورد از این محک ها به منظور پوشش مجموعه نماینده ای از کاربردها شبیه سازی شوند. ثالثاً، پیچیدگی سیستم هدف، انعکاس دهنده ی پیچیدگی در شبیه ساز بوده و سبب می شود تا شبیه ساز دست کم چهار مرتبه بزرگی آهسته تر از اجرای سخت افزار اصلی است. رابعاً، در حین برون یابی فضای طراحی، نیاز است که همه محک ها چندین مرتبه به منظور تشخیص طراحی بهینه برای تابع هزینه ای معین که عملکرد، توان، سطح، هزینه، قابلیت اعتماد و … را دربرمی گیرد، شبیه سازی شوند.
در راستای کاهش زمان شبیه سازی بدون از دست رفتن دقت، در سال های اخیرپیشنهادهای جالبی ارائه شده است.پیشنهاد اول، شبیه سازی نمونه برداری شده است که در آن به روشی هوشمندانه بخش کوچکی از برنامه برای ردیابی شبیه سازی می شود (Wenisch, Wunderlich, Falsafi, & Hoe, 2006). روش پیشنهادی دوم، استفاده از مجموعه کاهش یافته ای از ورودی های هر محک است (Eeckhout, Sampson, & Calder, 2005). در نهایت، روش مدل سازی آماری و شبیه سازی، که رفتار برنامه و معماری را با توزیع های احتمالی مشخص می کند، پیشنهاد شده است (Genbrugge & Eeckhout, 2007; Nussbaum & Smith, 2002). با این وجود، اگرچه شبیه سازی آماری ابزاری قدرتمند در طراحی چندپردازنده هاست، این روش همچنان زمان بر است. این مسئله، به ویژه وقتی سیستم چندپردازنده ای DSMی که قرار است شبیه سازی شود، دارای پارامترهای بسیار بوده و این پارامترها باید با توزیع های احتمال یا مقادیر مختلف آزمایش شوند، مطرح می گردد. به عنوان نمونه، زمان اجرای شبیه ساز آماری گذرگاه SOME ما روی کامپیوتری با عملکرد بالا، زمانی که قصد داشتیم 500 معیار عملکرد را با مقادیر مختلف از پنج پارامتر ورودی جمع آوری کنیم، حدود 25 دقیقه شد. به دلیل این مشکل، پیشنهاد می کنیم که از روش های هوشمند برای پیش بینی عملکرد چندپردازنده DSM برای داشتن روشی سریع تر استفاده گردد. ایده اصلی، جمع آوری تعداد کمی نقاط داده ای با استفاده از شبیه سازی آماری و پیش بینی معیارهای عملکرد سیستم برای مجموعه بزرگی از پارامترهای ورودی بر پایه ی این داده هاست.
SVR به عنوان روش آموزش آماری مؤثری برای مسائل رگرسیون پیشنهاد شده است. شالوده روش SVR توسط Vapnik (2000) بنا نهاده شد. این روش به دلیل قابلیت های تعمیم خود، فراگیرتر شده است.
اخیراً، در مطالعات متعددی (Cherkassky & Ma, 2004a; Wu, Ho, & Lee, 2003; Yang, Chan, & King, 2002; Yang, King, & Chan, 2002)روش SVR برای تخمین تابع، به صورت موفقیت آمیزی به کار گرفته شده است. با این وجود، تا آنجایی که ما می دانیم، از روش SVR تاکنون برای پیش-بینی معیارهای عملکردی چندپردازنده DSM استفاده نشده است.
در این مقاله، OPNET Modeler (OPNET Inc., 2007) برای ایجاد شبیه سازی اماری از معماری چندپردازنده ای که دارای اتصال های شبکه نوری گذرگاه SOMEاست، مورد استفاده قرار می گیرد. همه توالی-های رویداد محتمل که می تواند حین پردازش مرجعی از حافظه اتفاق بیفتد، در محیط شبیه سازی در نظر گرفته می شود. این شبیه ساز برای مقادیر مختلف پارامترهای DSM زیر اجرا گردید: نسبت میانگین زمان انتقال کانال پیغام به میانگین زمان اجرای thread (T/R)، احتمال اینکه بتوان بلوکی را در وضعیت تغییریافته پیدا نمود {P(M)}، احتمال اینکه پیغام داده ای ناشی از اشتباه نوشتاری باشد {P(W)}، احتمال پر بودن حافظه کش {P(CF)} و احتمال داشتن درخواست ارتقای مالکیت {P(UOR)}.معیارهای عملکردی از قبیل میانگین به کارگیری پردازنده (یعنی کسر میانگین زمانی که ها در حال اجرا هستند)، میانگین زمان پاسخ دهی (یعنی وقفه زمانی بین لحظه ای که اشتباه کشی سبب قرار گرفتن پیغامی در صف انتظار کانال خروجی می شود تا لحظه ای که داده یا پیغام وصول شده مربوطه به صف انتظار ورودی می رسد) و میانگین زمان انتظار کانال (یعنی وقفه زمانی بین لحظه ای که بسته داده در صف انتظار کانال خروجی قرار می گیرد تا لحظه ای که این بسته مورد استفاده قرار می گیرد) اندازه گیری شدند. 162 نقطه داده ای برای تشکیل مجموعه داده ی اموزشی جمع آوری شدند.SVR، شبکه های عصبی مصنوعی (ANN) و رگرسیون خطی چندگانه (MLR) به طور مجزا برای ساخت مدل های رگرسیونی روی مجموعه داده آموزشی بکار گرفته شدند. از این مدل های رگرسیونی سپس برای پیش بینی معیارهای عملکردی چندپردازنده با گذرگاه SOME استفاده گردید. معیارهای متعددی از قبیل میانگین خطای مطلق (MAE)، خطای ریشه میانگین مربعات (RMSE)، خطای مطلق نسبی (RAE)،خطای ریشه مربعات نسبی (RRSE)، ضریب همبستگی و درصد خطای مطلق برای ارزیابی عملکرد هر مدل رگرسیونی مورد استفاده قرار گرفتند. نتایج نشان می دهد که مدل SVR-RBF دارای کم ترین خطای پیش بینی بوده و می توان از آن به عنوان ابزاری مؤثر در پیش بینی معیارهای عملکردی معماری چندپردازنده ای DSM استفاده نمود.
در بخش 2، شبکه اتصال گذرگاه SOME نوری به طور خلاصه معرفی شده است. در بخش 3، مروری بر SVR خطی و غیرخطی صورت گرفته و در بخش 4 به ارائه جزئیات چارچوب شبیه سازی بر پایه و مدل SVR برای پیش بینی عملکرد چندپردازنده SOME-Bus پرداخته شده است. دو تابع کرنل در حین انتخاب مدل بررسی می شوند. در بخش 5، به ارائه دقت پیش بینی مدل های SVR و مقایسه آن با دقت مدل های MLR و ANN، که همانند مدل SVR قادر به یادگیری ارتباط بین معیارهای عملکردی و پارامترهای ورودی هستند، پرداخته می شود. بحث در مورد نتایج نیز در همین بخش ارائه می گردد. در پایان، به جمع بندی مقاله با ارائه پیشنهادهایی برای کارهای آتی می پردازیم.