دانلود مقاله ISI انگلیسی شماره 65671
ترجمه فارسی عنوان مقاله

نقشه برداری خودکار و تحمل ناهمگنی آگاهانه خطا: مزایای بهینه سازی زمان اجرا و توسعه نرم افزار

عنوان انگلیسی
Automatic task mapping and heterogeneity-aware fault tolerance: The benefits for runtime optimization and application development
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
65671 2015 11 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Journal of Systems Architecture, Volume 61, Issue 10, November 2015, Pages 628–638

ترجمه کلمات کلیدی
محاسبات ناهمگن، شتاب دهنده ها، سیستم های مقاوم در برابر شکست سیستم های اجرا
کلمات کلیدی انگلیسی
Heterogeneous computing; Accelerators; Fault-tolerant systems; Runtime systems
ترجمه چکیده
بهترین نقشه برداری یک وظیفه به یک یا چند واحد پردازش در یک سیستم ناهمگن بستگی به چندین متغیر دارد. چندین روش مبتنی بر سیستم های زمانبندی ارائه شده است که بهترین نقشه برداری را در شرایط داده شده به صورت خودکار تعیین می کند. بعضی از آنها همچنین رویدادهای پویا مانند اندازه های مختلف مشکل یا رقابت منابع را در نظر می گیرند که ممکن است بهترین نقشه بندی را در طول برنامه کاربردی تغییر دهند، اما تنها چند حتی تصور می کنند که اجرای کار ممکن است نتواند انجام شود. در حالی که پیری یا گرمای بیش از حد، علل شناخته شده برای گسل های ناگهانی هستند، انتظار می رود که مینیاتوری در حال انجام و پیچیدگی رو به رشد محاسبات ناهمگن تهدیدی برای اجرای موفق برنامه باشد. با این حال، اگر به درستی متصل شده، سیستم های ناهمگونی نیز فرصتی برای بازیابی از انواع گسل ها در سخت افزار و همچنین در نرم افزار فراهم می کند. در این کار، ما پیشنهاد می کنیم ترکیبی از هر دو موضوع، نقشه برداری کارآیی پویا و قابلیت اطمینان، برای استفاده از این فرصت. همانطور که ما نشان خواهیم داد، این ترکیب نه تنها قادر به تحمل گسل ها در سخت افزار و نرم افزار با کمک جزئی توسعه دهنده است، بلکه برای توسعه نرم افزار خود و همچنین برای عملکرد نرم افزار در صورت بروز گسل ها با توجه به مدیریت داده های متریک و خودکار اتوماتیک، مزایایی می دهد.

چکیده انگلیسی

The best mapping of a task to one or more processing units in a heterogeneous system depends on multiple variables. Several approaches based on runtime systems have been proposed that determine the best mapping under given circumstances automatically. Some of them also consider dynamic events like varying problem sizes or resource competition that may change the best mapping during application runtime but only a few even consider that task execution may fail. While aging or overheating are well-known causes for sudden faults, the ongoing miniaturization and the growing complexity of heterogeneous computing are expected to create further threats for successful application execution. However, if properly incorporated, heterogeneous systems also offer the opportunity to recover from different types of faults in hardware as well as in software. In this work, we propose a combination of both topics, dynamic performance-oriented task mapping and dependability, to leverage this opportunity. As we will show, this combination not only enables tolerating faults in hardware and software with minor assistance of the developer, it also provides benefits for application development itself and for application performance in case of faults due to a new metric and automatic data management.