دانلود مقاله ISI انگلیسی شماره 25269
ترجمه فارسی عنوان مقاله

پیش بینی معیارهای عملکردی چندپردازنده ای با حافظه اشتراکی توزیع شده نوری با استفاده از رگرسیون بردارپشتیبان

عنوان انگلیسی
Predicting the performance measures of an optical distributed shared memory multiprocessor by using support vector regression
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
25269 2010 9 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Expert Systems with Applications, Volume 37, Issue 9, September 2010, Pages 6293–6301

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1- مقدمه

2- مروری بر اتصال SOME-Bus

3- رگرسیون بردار پشتیبان

3-1- SVR خطی

3-2- SVR غیرخطی

4- روش پیش بینی عملکرد با استفاده از SVR

4-1- چارچوب شبیه سازی و ایجاد مجموعه داده

4-2- مدل SVR

5- نتایج و بحث

6- جمع بندی و نتیجه گیری
ترجمه کلمات کلیدی
رگرسیون بردار پشتیبانی - چند پردازنده ها - حافظه داخلی توزیع شده - شبکه های میان ارتباطی
کلمات کلیدی انگلیسی
Support vector regression,Multiprocessors,Distributed shared memory,Interconnection networks
ترجمه چکیده
پیشرفت های اخیر در توسعه فناوری های نوری، به ظهور احتمالی اتصال های نوری در داخل چندپردازنده های با حافظه اشتراکی توزیع شده (DSM) رهنمون شده است. عملکرد این معماری های DSM باید تحت مقادیر مختلف پارامترهای DSM مورد ارزیابی قرار گیرد. در این مقاله، ما به ارائه مدل رگرسیون برداری پشتیبان (SVR) برای پیش بینی معیارهای عملکرد (یعنی تأخیر میانگین شبکه، زمان انتظار کانال میانگین و میانگین بکارگیری پردازنده) برای معماری چندپردازنده ای DSM که با گذرگاه های تبادل چندپردازنده ای نوری همزمان (SOME) به هم متصل شده اند، خواهیم پرداخت. این گذرگاه ، دارای پهنای باند بالا و شبکه ارتباطی فیبر نوری است. ایده اصلی، جمع اوری تعداد کمی نقاط داده ای با استفاده از شبیه سازی آماری و پیش بینی معیارهای عملکرد سیستم برای مجموعه بزرگی از پارامترهای ورودی بر پایه ی این داده هاست. ازOPNET Modeler برای شبیه سازی معماری چندپردازنده ای برمبنای DSM و با گذرگاه SOME و همچنین ایجاد مجموعه داده-های آموزش و آزمایش برای آن استفاده می گردد. خطای پیش بینی و ضرایب مربوط به مدل SVR با مدل های رگرسیون خطی چندگانه (MLR) و شبکه عصبی مصنوعی (ANN) پیش خوراند مقایسه می گردد. نتایج نشان می دهند که مدل SVR-RBF دارای کمترین خطای پیش بینی بوده و از همه قدرتمندتر است. چنین جمع بندی می شود که مدلSVR زمان لازم برای بدست آوردن معیارهای عملکردی چندپردازنده DSM را اندکی کاهش داده و می تواند به عنوان ابزاری مؤثر در این راستا به کارگرفته شود.
ترجمه مقدمه
چندپردازنده های DSM با مقیاس بزرگ، عملی ترین راه برای دستیابی به قدرت محاسباتی عظیم در بسیاری از کاربردهای علمی و مهندسی است. سیستم های DSM، قادر به فراهم آوردن فضای آدرس دهی اشتراکی با توزیع فیزیکی حافظه در بین پردازنده های مختلف هستند (Culler, Singh, & Gupta, 1997). قدرت اصلی سیستم های به اینکه ارتباطات در آن ها به طور ضمنی در نتیجه دستورالعمل های معمول دسترسی به حافظه (یعنی بارها و طبقات) صورت می گیرد، برمی گردد. چنین موضوعی، برنامه نویسی آن ها را ساده تر می کند. هرچند، موفقیت این سیستم ها شدیداً به کارایی شبکه اتصال نهفته در آن ها، که امکان ارتباط بین گره های پردازشی را با یکدیگر فراهم می کنند، وابسته است. این شبکه اتصال، تأثیر مستقیمی بر تأخیر حافظه راه دور، که از دسترسی به مکان حافظه ای در پردازنده ای به جز پردازنده ای که درخواست در اصل از سوی آن ارسال شده ناشی می گردد، دارد. هر دسترسی به حافظه راه دور، حدود 3 تا 5 برابر از نظر مرتبه بزرگی بیشتر از دسترسی به حافظه محلی زمان می برد (Hagersten &Koster, 1999; Laudon & Lenoski, 1997). بیشتر این زمان، صرف ارتباط روی شبکه اتصال سیستم می گردد. اگرچه سیستم های DSM از روش های کاهش/مخفی-سازی تأخیربرای کاهش تأخیر دسترسی به حافظه راه دور بهره می برند (Gharachorloo et al., 1990)، این روش ها نیازمند پهنای باند اضافی بوده و ترافیک حافظه را با آوردن داده هایی بیشتر از میزان موردنیاز، به میزان زیادی افزایش می دهند (Lenoski & Weber, 1995). به علاوه، هر تبادل در سیستم DSM، از درخواست، پاسخ (داده) و چند پیغام اعلام وصول و همخوانی تشکیل یافته است. هنگامی که اندازه سیستم افزایش می یابد، پردازنده های بیشتری مشغول وارد کردن پیغام های بیشتر (هم پیغام های مربوط به تبادل و هم درخواست های تحمل تأخیر)درون شبکه می شوندکه سبب رقابت شبکه (Pai & Panda, 1997) برای منابع اشتراکی مختلف می گردد. سیستم های DSM کوچکتر که دارای 4 تا 8 گره هستند، معمولاً از طریق تنها یک سوئیچ به هم متصل می-شوند. در سیستمی بزرگتر، به سلسله مراتبی از سوئیچ ها نیاز است. این موضوع، سبب تأخیر در مراحل سوئیچینگ اضافی شده و به نوبه ی خود تأخیر دسترسی راه دور را افزایش می دهد (Cray, 2004). در مرجع Huang, Sze, Landin, Lytel, and Davidson (2003) گزارش شده که با تغییر از چندپردازنده ای با اندازه متوسط تا چندپردازنده ای بزرگ، تأخیر دسترسی به حافظه تا 60% افزایش پیدا نموده است. سیستم های DSM با عملکرد بالا در آینده، از پردازنده های تجاری با تولید انبوه استفاده می کنند که نیاز به پهنای باند محاسباتی و ارتباطی انباشته از مرتبه 4 تا 40 ترابایت بر ثانیه دارند (Lemoff et al., 2004). بنابراین، نبود پهنای باند کافی، مانعی اساسی بر سر راه سیستم های DSM بزرگ در آینده خواهد بود. یکی از فناوری هایی که دارای قابلیتی بالقوه در فراهم نمودن پهنای باندهای بالاتر و تأخیرهای کمتر از اتصال های الکترونیکی حال حاضر است، اتصال های نوری است (Collet et al., 2000; Puet al., 1999). فیبرهای نوری دارای پهنای باند بسیار بالایی هستند و می توان از چندتای آن ها برای ایجاد تعداد زیادی از کانال-های ارتباطی مستقل، در کنار هم استفاده نمود. با پیشرفت قابل توجهی که اخیراً در ابزارهای نوری و نوری-الکترونیکی ایجاد شده، اتصال های نوری به گزینه ای مناسب و اقتصادی برای شبکه های اتصال نوری با پهنای باند بالا، تأخیر کم و بزرگ تبدیل شده اند. یکی از این اتصال های نوری، گذرگاه SOME است که ابزارهای نوری-الکترونیکی را در معماری پردازشی دارای عملکرد بسیار بالا جای می دهد. این نوع گذرگاه،دارای شبکه ای اتصالی با تأخیر پایین، پهنای باند بالا، با فیبر نوری است که هر گره را مستقیماً به همه گره های دیگر وصل می نماید. یکی از ویژگی های کلیدی این نوع گذرگاه، آن است که هر یک از N گره دارای کانال پخشی اختصاصی است که در سرعت 20 تا 30 گیگابایت کار می کند و توسط گروهی از طول موج ها در فیبری مشخص درک می شود. همچنین، این گره ها دارای واسط کانالی ورودی بر پایه ی آرایه ای از N دریافت کننده، که به طور همزمان همه N کانال را پایش می کنند، هستند. این موضوع سبب داشتن شبکه ای که به طور مؤثر کاملاً با هم ارتباط دارند، می-گردد. جزئیات بیشتر در مورد شبکه اتصال گذرگاه SOME را می توانید در مرجع Akay and Katsinis (2008) ملاحظه کنید. تحلیل عملکرد معماری شبکه، عاملی حیاتی در طراحی سیستم های چندپردازنده ای DSM است. غالباً، به دلیل ماهیت مسئله، در این مورد شبیه سازی تنها روش عملی است؛ چون استفاده از روش های تحلیلی بسیار دشوار است. شبیه سازی می تواند در سطوح متعددی، از مدار گرفته تا سیستم و با درجه های مختلفی از جزئیات با کامل شدن طراحی صورت پذیرد. شبیه سازی های چندپردازنده ای اجرایی و مبتنی بر ردیابی (Sendag, Yilmazer, Yi, & Uht, 2007; Thiele, Wandeler, & Chakraborty, 2005) به طور گسترده به منظور دستیابی به پیش بینی قابل اعتماد و دقیقی از طراحی نهایی صورت می گیرند. یکی از مشکلات شبیه-سازی آن است که هرچند این شبیه سازی ها می توانند در سطح انتزاعی بالایی انجام شوند، اما همچنان زمان بر هستند. دلایل متعددی وجود دارد که سبب این موضوع می گردد. اولاً، محک هایی که نیاز به شبیه سازی دارند، معمولاً از چندین صد میلیارد دستورالعمل های به صورت دینامیکی اجرا شده تشکیل می شود. ثانیاً، نیاز است که چند مورد از این محک ها به منظور پوشش مجموعه نماینده ای از کاربردها شبیه سازی شوند. ثالثاً، پیچیدگی سیستم هدف، انعکاس دهنده ی پیچیدگی در شبیه ساز بوده و سبب می شود تا شبیه ساز دست کم چهار مرتبه بزرگی آهسته تر از اجرای سخت افزار اصلی است. رابعاً، در حین برون یابی فضای طراحی، نیاز است که همه محک ها چندین مرتبه به منظور تشخیص طراحی بهینه برای تابع هزینه ای معین که عملکرد، توان، سطح، هزینه، قابلیت اعتماد و … را دربرمی گیرد، شبیه سازی شوند. در راستای کاهش زمان شبیه سازی بدون از دست رفتن دقت، در سال های اخیرپیشنهادهای جالبی ارائه شده است.پیشنهاد اول، شبیه سازی نمونه برداری شده است که در آن به روشی هوشمندانه بخش کوچکی از برنامه برای ردیابی شبیه سازی می شود (Wenisch, Wunderlich, Falsafi, & Hoe, 2006). روش پیشنهادی دوم، استفاده از مجموعه کاهش یافته ای از ورودی های هر محک است (Eeckhout, Sampson, & Calder, 2005). در نهایت، روش مدل سازی آماری و شبیه سازی، که رفتار برنامه و معماری را با توزیع های احتمالی مشخص می کند، پیشنهاد شده است (Genbrugge & Eeckhout, 2007; Nussbaum & Smith, 2002). با این وجود، اگرچه شبیه سازی آماری ابزاری قدرتمند در طراحی چندپردازنده هاست، این روش همچنان زمان بر است. این مسئله، به ویژه وقتی سیستم چندپردازنده ای DSMی که قرار است شبیه سازی شود، دارای پارامترهای بسیار بوده و این پارامترها باید با توزیع های احتمال یا مقادیر مختلف آزمایش شوند، مطرح می گردد. به عنوان نمونه، زمان اجرای شبیه ساز آماری گذرگاه SOME ما روی کامپیوتری با عملکرد بالا، زمانی که قصد داشتیم 500 معیار عملکرد را با مقادیر مختلف از پنج پارامتر ورودی جمع آوری کنیم، حدود 25 دقیقه شد. به دلیل این مشکل، پیشنهاد می کنیم که از روش های هوشمند برای پیش بینی عملکرد چندپردازنده DSM برای داشتن روشی سریع تر استفاده گردد. ایده اصلی، جمع آوری تعداد کمی نقاط داده ای با استفاده از شبیه سازی آماری و پیش بینی معیارهای عملکرد سیستم برای مجموعه بزرگی از پارامترهای ورودی بر پایه ی این داده هاست. SVR به عنوان روش آموزش آماری مؤثری برای مسائل رگرسیون پیشنهاد شده است. شالوده روش SVR توسط Vapnik (2000) بنا نهاده شد. این روش به دلیل قابلیت های تعمیم خود، فراگیرتر شده است. اخیراً، در مطالعات متعددی (Cherkassky & Ma, 2004a; Wu, Ho, & Lee, 2003; Yang, Chan, & King, 2002; Yang, King, & Chan, 2002)روش SVR برای تخمین تابع، به صورت موفقیت آمیزی به کار گرفته شده است. با این وجود، تا آنجایی که ما می دانیم، از روش SVR تاکنون برای پیش-بینی معیارهای عملکردی چندپردازنده DSM استفاده نشده است. در این مقاله، OPNET Modeler (OPNET Inc., 2007) برای ایجاد شبیه سازی اماری از معماری چندپردازنده ای که دارای اتصال های شبکه نوری گذرگاه SOMEاست، مورد استفاده قرار می گیرد. همه توالی-های رویداد محتمل که می تواند حین پردازش مرجعی از حافظه اتفاق بیفتد، در محیط شبیه سازی در نظر گرفته می شود. این شبیه ساز برای مقادیر مختلف پارامترهای DSM زیر اجرا گردید: نسبت میانگین زمان انتقال کانال پیغام به میانگین زمان اجرای thread (T/R)، احتمال اینکه بتوان بلوکی را در وضعیت تغییریافته پیدا نمود {P(M)}، احتمال اینکه پیغام داده ای ناشی از اشتباه نوشتاری باشد {P(W)}، احتمال پر بودن حافظه کش {P(CF)} و احتمال داشتن درخواست ارتقای مالکیت {P(UOR)}.معیارهای عملکردی از قبیل میانگین به کارگیری پردازنده (یعنی کسر میانگین زمانی که ها در حال اجرا هستند)، میانگین زمان پاسخ دهی (یعنی وقفه زمانی بین لحظه ای که اشتباه کشی سبب قرار گرفتن پیغامی در صف انتظار کانال خروجی می شود تا لحظه ای که داده یا پیغام وصول شده مربوطه به صف انتظار ورودی می رسد) و میانگین زمان انتظار کانال (یعنی وقفه زمانی بین لحظه ای که بسته داده در صف انتظار کانال خروجی قرار می گیرد تا لحظه ای که این بسته مورد استفاده قرار می گیرد) اندازه گیری شدند. 162 نقطه داده ای برای تشکیل مجموعه داده ی اموزشی جمع آوری شدند.SVR، شبکه های عصبی مصنوعی (ANN) و رگرسیون خطی چندگانه (MLR) به طور مجزا برای ساخت مدل های رگرسیونی روی مجموعه داده آموزشی بکار گرفته شدند. از این مدل های رگرسیونی سپس برای پیش بینی معیارهای عملکردی چندپردازنده با گذرگاه SOME استفاده گردید. معیارهای متعددی از قبیل میانگین خطای مطلق (MAE)، خطای ریشه میانگین مربعات (RMSE)، خطای مطلق نسبی (RAE)،خطای ریشه مربعات نسبی (RRSE)، ضریب همبستگی و درصد خطای مطلق برای ارزیابی عملکرد هر مدل رگرسیونی مورد استفاده قرار گرفتند. نتایج نشان می دهد که مدل SVR-RBF دارای کم ترین خطای پیش بینی بوده و می توان از آن به عنوان ابزاری مؤثر در پیش بینی معیارهای عملکردی معماری چندپردازنده ای DSM استفاده نمود. در بخش 2، شبکه اتصال گذرگاه SOME نوری به طور خلاصه معرفی شده است. در بخش 3، مروری بر SVR خطی و غیرخطی صورت گرفته و در بخش 4 به ارائه جزئیات چارچوب شبیه سازی بر پایه و مدل SVR برای پیش بینی عملکرد چندپردازنده SOME-Bus پرداخته شده است. دو تابع کرنل در حین انتخاب مدل بررسی می شوند. در بخش 5، به ارائه دقت پیش بینی مدل های SVR و مقایسه آن با دقت مدل های MLR و ANN، که همانند مدل SVR قادر به یادگیری ارتباط بین معیارهای عملکردی و پارامترهای ورودی هستند، پرداخته می شود. بحث در مورد نتایج نیز در همین بخش ارائه می گردد. در پایان، به جمع بندی مقاله با ارائه پیشنهادهایی برای کارهای آتی می پردازیم.
پیش نمایش مقاله
پیش نمایش مقاله  پیش بینی معیارهای عملکردی چندپردازنده ای با حافظه اشتراکی توزیع شده نوری با استفاده از رگرسیون بردارپشتیبان

چکیده انگلیسی

Recent advances in the development of optical technologies suggest the possible emergence of optical interconnects within distributed shared memory (DSM) multiprocessors. The performance of these DSM architectures must be evaluated under varying values of DSM parameters. In this paper, we develop a Support Vector Regression (SVR) model for predicting the performance measures (i.e. average network latency, average channel waiting time and average processor utilization) of a DSM multiprocessor architecture interconnected by the Simultaneous Optical Multiprocessor Exchange Bus (SOME-Bus), which is a high-bandwidth, fiber-optic interconnection network. The basic idea is to collect a small number of data points by using a statistical simulation and predict the performance measures of the system for a large set of input parameters based on these. OPNET Modeler is used to simulate the DSM-based SOME-Bus multiprocessor architecture and to create the training and testing datasets. The prediction error and correlation coefficient of the SVR model is compared to that of Multiple Linear Regression (MLR) and feedforward Artificial Neural Network (ANN) models. Results show that the SVR-RBF model has the lowest prediction error and is more robust. It is concluded that SVR model shortens the time quite a bit for obtaining the performance measures of a DSM multiprocessor and can be used as an effective tool for this purpose.

مقدمه انگلیسی

Large-scale DSM multiprocessors are the most feasible way of achieving the enormous computational power required in many science and engineering applications. DSM systems provide a shared address space by physically distributing the memory among different processors (Culler, Singh, & Gupta, 1997). The key strength of DSM systems is that communication occurs implicitly as a result of conventional memory access instructions (i.e. loads and stores), which makes them easier to program. Their success, however, is highly dependent on the efficiency of the underlying interconnection network, which allows the processing nodes to communicate with each other. The interconnection network has a direct effect on the remote memory latency, which is caused by accessing a memory location in a processor other than the one originating the request. A remote memory access takes 3–5 orders of magnitude longer than the local memory access (Hagersten and Koster, 1999 and Laudon and Lenoski, 1997) with most of the time consumed in communication over the interconnection network of the system. Although DSM systems use latency reducing/hiding techniques (Gharachorloo et al., 1990) to reduce remote memory latency, these techniques require extra bandwidth and greatly increase memory traffic by fetching more data than needed (Lenoski & Weber, 1995). Additionally, every transaction in a DSM system consists of a request, response (data), several acknowledge and coherence messages. As the system size increases, more processors are injecting more messages (both transaction related messages and latency tolerating requests) into the network that causes network contention (Pai & Panda, 1997) for various shared resources. Smaller DSM systems ranging from 4 to 8 nodes usually interconnect via a single switch. An enlarged system requires a hierarchy of switches, which causes a significant routing or switching delay in the additional switching stages, which in turn increases remote latency (Cray, 2004). Huang, Sze, Landin, Lytel, and Davidson (2003) reported that scaling from a medium to a large-scale multiprocessor increases memory access latency by 60%. Future high performance DSM systems will utilize commercial off-the-shelf processors that require aggregate computational and communication bandwidths on the order of 4–40 terabits per second (Lemoff et al., 2004). Thus, lack of sufficient bandwidth will be the fundamental obstacle to future scalable DSM systems. One technology that has the potential for providing higher-bandwidths and lower latencies than current electronic-based interconnects is optical interconnects (Collet et al., 2000 and Pu et al., 1999). Optical fibers exhibit extremely high-bandwidth and can be multiplexed to provide a large number of independent communication channels. Recently, there have been significant developments in optical and optoelectronic devices which make optical interconnects a viable and cost-effective option for building high-bandwidth, low-latency and scalable optical interconnection networks. One such optical interconnect is the SOME-Bus, which incorporates optoelectronic devices into a very high performance processing architecture. It is a low-latency, high-bandwidth, fiber-optic interconnection network, which directly connects each node to all other nodes. One of its key features is that each of N nodes has a dedicated broadcast channel operating at 20–30 GB/s, realized by a group of wavelengths in a specific fiber, and an input channel interface based on an array of N receivers, which simultaneously monitors all N channels, resulting in an effectively fully connected network. Further details about the SOME-Bus interconnection network can be found in Akay and Katsinis (2008). The performance analysis of network architecture is a very crucial factor in designing DSM multiprocessor systems. Very often, simulation is the only feasible method because of the nature of the problem and because analytical techniques become too difficult to handle. Simulation occurs at many levels, from circuit to system, and at different degrees of detail as the design evolves. Execution-driven and trace-driven multiprocessor simulations (Sendag et al., 2007 and Thiele et al., 2005) have been extensively used in order to obtain a reliable and accurate prediction of the final design. One of the problems with simulation is that although these simulations can be done at a high level of abstraction, they still are extremely time consuming. There are several reasons why this is the case. First, the benchmarks that need to be simulated typically consist of several hundreds of billions of dynamically executed instructions. Second, multiple of these benchmarks need to be simulated in order to cover a representative set of applications. Third, the complexity of the target system reflects itself in the complexity of the simulator making the simulator at least four orders of magnitude slower than native hardware execution. Fourth, during design space exploration all benchmarks need to be simulated multiple times in order to identify the optimal design for a given cost function covering performance, power, area, cost, reliability, etc. With the objective of reducing simulation time without loosing accuracy, some interesting proposals have appeared in the last years. The first one is the sampled simulation, which chooses in an intelligent way a small portion of the program trace to simulate (Wenisch, Wunderlich, Falsafi, & Hoe, 2006). The second one is using a reduced set of the inputs of a benchmark (Eeckhout, Sampson, & Calder, 2005). Finally, there is statistical modeling and simulation, which characterizes the behavior of the program and architecture with some probability distributions (Genbrugge and Eeckhout, 2007 and Nussbaum and Smith, 2002). However, although statistical simulation is a powerful tool in multiprocessor design, it can still be time consuming especially when the DSM multiprocessor system to be simulated has many parameters and these parameters have to be tested with different probability distributions or values. For instance, the run time of our statistical SOME-Bus simulator on a high performance computer is about 25 min when we would like to collect 500 performance measures with different values of five input parameters. Due to this problem, we propose to apply intelligent techniques for predicting the performance of a DSM multiprocessor in a faster way. The basic idea is to collect a small number of multiprocessor performance measures by using a statistical simulation and predict the performance of the system for a large set of input parameters based on these. SVR has been proposed as an effective statistical learning method for regression problems. The foundation of SVR was developed by Vapnik (2000), and it became more popular due to the generalization capabilities it demonstrated. Recently, several studies (Cherkassky and Ma, 2004a, Wu et al., 2003, Yang et al., 2002 and Yang et al., 2002b) have successfully applied SVR for function estimation. However, to the best of our knowledge, SVR has not been used for predicting the performance measures of a DSM multiprocessor. In this paper, OPNET Modeler (OPNET Inc., 2007) is used to develop a statistical simulator of a multiprocessor architecture interconnected by the SOME-Bus optical network. All possible sequences of events that can occur during the processing of a memory reference are taken into account in the simulation environment. The simulator has been run for different values of the following DSM parameters: ratio of the mean message channel transfer time to the mean thread run time (T/R), probability that a block can be found in modified state {P(M)}, probability that a data message is due to a write miss {P(W)}, probability that a cache is full {P(CF)} and probability of having an upgrade ownership request {P(UOR)}. Performance measures such as average processor utilization (i.e. average fraction of time that threads are executing), average response time (i.e. the time interval between the instant when a cache miss causes a message to be enqueued in the output channel until the instant when the corresponding data or acknowledge message arrives at the input queue) and average channel waiting time (i.e. the time interval between the instant when a packet is enqueued in the output channel until the instant when the packet goes under service) have been measured. One hundred and sixty two data points are collected to form a training dataset. SVR, Artificial Neural Networks (ANN) and Multiple Linear Regression (MLR) have been applied separately on the training dataset to build regression models. The regression models are then used to predict the performance measures of the SOME-Bus multiprocessor. Several metrics such as the mean absolute error (MAE), root mean squared error (RMSE), relative absolute error (RAE), root relative squared error (RRSE), correlation coefficient and absolute percent error are used to evaluate the performance of each regression model. The results show that the SVR-RBF model has the lowest prediction error and can be used as an effective tool for predicting the performance measures of a DSM multiprocessor architecture. Section 2 summarizes the optical SOME-Bus interconnection network. Section 3 presents overview of linear and nonlinear SVR. Section 4 gives details of the OPNET-based simulation framework and the SVR model for predicting the performance of the SOME-Bus multiprocessor. Two kernel functions are examined during the selection of the model. Section 5 presents the prediction accuracy of the SVR models and compares it with the prediction accuracy of the models of MLR and ANN that, like the SVR model, can learn the relationship between performance measures and input parameters. Discussion of the results is also presented in this section. Finally, Section 6 concludes the paper along with outlining future directions.

نتیجه گیری انگلیسی

Statistical simulation is an effective tool for evaluating the performance measures of a DSM multiprocessor architecture. However, it takes considerable time to obtain the performance measures especially when the architecture has to be evaluated under varying values of system parameters. This paper proposes to use SVR-based models to predict the performance measures of a DSM multiprocessor architecture in a faster way. The basic idea is to collect a small number of performance measures by using a statistical simulation and predict the performance of the system for a large set of input parameters based on these. OPNET Modeler is used to simulate the DSM-based SOME-Bus multiprocessor architecture and to create the training and testing datasets. The performance of the SVR models are compared with that of the MLR and ANN models, and it is observed that the SVR-RBF model offers the lowest prediction error and highest correlation coefficient. Future research can be performed in a number of areas. The first area would be expanding the number of input parameters in the dataset. For instance, the number of sharers and the number of threads running in each processor queue can be used as additional input parameters. The second area would be feature extraction on input variables. In this case, the critical attributes that best predict performance measures can be selected from a candidate set of attributes through feature selection algorithms combined with SVR.