ترجمه فارسی عنوان مقاله
یادگیری تقویت بر اساس تکرار ارزش عمومی برای حل مسئله کنترل ردیابی بهینه از سیستم های غیر خطی وابسته به مداوم
عنوان انگلیسی
General value iteration based reinforcement learning for solving optimal tracking control problem of continuoustime affine nonlinear systems
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
105792 | 2017 | 34 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Neurocomputing, Volume 245, 5 July 2017, Pages 114-123
ترجمه کلمات کلیدی
برنامه ریزی پویا سازگار، کنترل بهینه، تقویت یادگیری، سیستم های مداوم،
کلمات کلیدی انگلیسی
Adaptive dynamic programming; Optimal control; Reinforcement learning; Continuousâtime systems;