دانلود مقاله ISI انگلیسی شماره 78501
ترجمه فارسی عنوان مقاله

CloudFlow: یک مدل برنامه نویسی داده آگاه برای برنامه های گردش کار ابری در سیستم های HPC مدرن

عنوان انگلیسی
CloudFlow: A data-aware programming model for cloud workflow applications on modern HPC systems
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
78501 2015 13 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Future Generation Computer Systems, Volume 51, October 2015, Pages 98–110

ترجمه کلمات کلیدی
همزمانی؛ اطلاعات آگاه؛ MapReduce؛ HPC؛ مدل برنامه نویسی
کلمات کلیدی انگلیسی
Concurrency; Data aware; MapReduce; HPC; Programming model
پیش نمایش مقاله
پیش نمایش مقاله  CloudFlow: یک مدل برنامه نویسی داده آگاه برای برنامه های گردش کار ابری در سیستم های HPC مدرن

چکیده انگلیسی

To enhance the capability of managing workflow in modern HPC system, this paper presents CloudFlow, a Hadoop MapReduce based programming model for cloud workflow applications. CloudFlow is built on top of MapReduce, which is proposed not only being data aware, but also shared-data aware. It identifies the most frequently shared data, from both task-level and job-level, replicates them to each compute node for data locality purposes. It also supports user-defined multiple Map- and Reduce functions, allowing users to orchestrate the required data-flow logic. Mathematically, we prove the correctness of the whole scheduling framework by performing theoretical analysis. Further more, experimental evaluation also shows that the execution runtime speedup exceeds 4X compared to traditional MapReduce implementation with a manageable time overhead.