دانلود مقاله ISI انگلیسی شماره 111793
ترجمه فارسی عنوان مقاله

کنترل تقریبی بهینه مبتنی بر داده ها برای بازی های غیرضروری سیستم های چند نفره با استفاده از برنامه ریزی پویای تطبیقی

عنوان انگلیسی
Data-based approximate optimal control for nonzero-sum games of multi-player systems using adaptive dynamic programming
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
111793 2018 28 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 275, 31 January 2018, Pages 192-199

ترجمه کلمات کلیدی
تقویت یادگیری، برنامه ریزی پویا سازگار، مبتنی بر داده ها، شبکه های عصبی،
کلمات کلیدی انگلیسی
Reinforcement learning; Adaptive dynamic programming; Data-based; Neural networks;
پیش نمایش مقاله
پیش نمایش مقاله  کنترل تقریبی بهینه مبتنی بر داده ها برای بازی های غیرضروری سیستم های چند نفره با استفاده از برنامه ریزی پویای تطبیقی

چکیده انگلیسی

This paper investigates the non-zerosum game issue for unknown nonlinear systems with multi-player by using data-based adaptive dynamic programming (ADP) methods. It is known that the traditional ADP approaches require accurate system models to compute the solutions of non-zerosum games. However, for the practical nonlinear systems, system models are difficult to be obtained and thus these methods will be invalid. To overcome this difficulty, we propose two neural-network-based identification schemes. Combined with the identification results, we design a data-based actor-critic algorithm to learn and approximate the optimal solutions in real time. Subsequently, in order to reduce the computation burden of dual network algorithm, we develop a single network one. To test the feasibility and validity of our schemes, we provide two simulation examples including a linear one and a nonlinear one.