دانلود مقاله ISI انگلیسی شماره 111764
ترجمه فارسی عنوان مقاله

برنامه نویسی تقریبی پویا از طریق تابع مجازات *

عنوان انگلیسی
Approximate Dynamic Programming via Penalty Functions*
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
111764 2017 8 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : IFAC-PapersOnLine, Volume 50, Issue 1, July 2017, Pages 11814-11821

ترجمه کلمات کلیدی
مشکلات کنترل بهینه تصادفی برنامه ریزی پویا تقریبی محدودیت های نرم افزاری،
کلمات کلیدی انگلیسی
Stochastic optimal control problems; Approximate dynamic programming; Soft constraints;
ترجمه چکیده
در این مقاله، یک فرمول جدید برای رمزگذاری محدودیت های دولتی را به روش برنامه ریزی خطی برای برنامه نویسی تقریبی پویا از طریق استفاده از توابع مجاز پیشنهاد می کنیم. برای حفظ رضایتمندی از نتیجه بهینه سازی نتیجه که باید حل شود، پیشنهاد می کنیم یک تابع نقض مجاز باشد که به عنوان حداکثر حداکثر نقطه ای برای یک خانواده از چند جمله ای های کم نظیر ساخته شده است. هنگامی که توابع مجاز طراحی شده اند، تقریبی اضافی با فرمول پیشنهاد شده معرفی نمی شود. اثربخشی و پایداری عددی فرمولاسیون از طریق نمونه ها نشان داده شده است.
پیش نمایش مقاله
پیش نمایش مقاله  برنامه نویسی تقریبی پویا از طریق تابع مجازات *

چکیده انگلیسی

In this paper, we propose a novel formulation for encoding state constraints into the Linear Programming approach to Approximate Dynamic Programming via the use of penalty functions. To maintain tractability of the resulting optimization problem that needs to be solved, we suggest a penalty function that is constructed as a point-wise maximum taken over a family of low-order polynomials. Once the penalty functions are designed, no additional approximations are introduced by the proposed formulation. The effectiveness and numerical stability of the formulation is demonstrated through examples.