دانلود مقاله ISI انگلیسی شماره 111779
ترجمه فارسی عنوان مقاله

یک رویکرد رگرسیون کارآمد برای حل مشکلات دوگانه برنامه های پویا *

عنوان انگلیسی
An Efficient Regression Approach to Solving the Dual Problems of Dynamic Programs*
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
111779 2017 8 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : IFAC-PapersOnLine, Volume 50, Issue 1, July 2017, Pages 6140-6147

ترجمه کلمات کلیدی
آرامش اطلاعات، برنامه های پویا، بهترین مجازات دوگانه، پسرفت، غیر توده
کلمات کلیدی انگلیسی
Information relaxation; dynamic programs; optimal dual penalty; regression; non-nested;
ترجمه چکیده
در سال های اخیر، آرامش اطلاعات و دوگانگی در برنامه های پویا به طور گسترده مورد مطالعه قرار گرفته است، و رویکرد اولیه دوگانه به روش قدرتمند در حل برنامه های پویا با ارائه مرزهای پایین تر بر تابع ارزش بهینه تبدیل شده است. به لحاظ تئوری، با به اصطلاح جبران خسارت بهینه مبتنی بر ارزش، بهینه سازی عملکرد ارزش می تواند دقیقا از طریق دوگانگی قوی بهبود یابد؛ با این حال، در عمل، تولید محدوده دوگانه تنگ معمولا مستلزم تقریب خوبی از مجازات دوگانه بهینه است، که می تواند به دلیل شرایط احتمالی شرطی باشد که باید از طریق شبیه سازی توزیع تخمینی برآورد شود. در این مقاله، با بررسی ساختار فضای مجاز دوگانهای دوگانه، یک رویکرد رگرسیسی کارآمد برای تقریب مجازات دوگانه بهینه در یک روش غیرواقعی ایجاد خواهیم کرد. تقریب حاصل می شود مجازات دوگانه امکان پذیر است، که منجر به یک اعتبار دوگانه معتبر در عملکرد ارزش مطلوب می شود. ما نشان می دهیم که رویکرد پیشنهادی کارآیی محاسباتی است و مجازات دوگانه منجر به یک مشکل دوگانه عددی می شود.
پیش نمایش مقاله
پیش نمایش مقاله  یک رویکرد رگرسیون کارآمد برای حل مشکلات دوگانه برنامه های پویا *

چکیده انگلیسی

In recent years, information relaxation and duality in dynamic programs have been studied extensively, and the resulted primal-dual approach has become a powerful procedure in solving dynamic programs by providing lower-upper bounds on the optimal value function. Theoretically, with the so called value-based optimal dual penalty, the optimal value function could be recovered exactly via strong duality; however, in practice, generating tight dual bounds usually requires good approximations of the optimal dual penalty, which could be time-consuming due to the conditional expectation terms that need to be estimated via nested simulation. In this paper, we will develop an efficient regression approach to approximating the optimal dual penalty in a non-nested manner, by exploring the structure of the feasible dual penalty space. The resulted approximation maintains to be a dual feasible penalty, leading to a valid dual bound on the optimal value function. We show that the proposed approach is computationally efficient, and the resulted dual penalty leads to a numerically tractable dual problem.