دانلود مقاله ISI انگلیسی شماره 111717
ترجمه فارسی عنوان مقاله

کنترل بهینه خطی-درجه دوم برای سیستم زمان گسسته زمانه تصادفی میدان متوسط ​​با استفاده از روش برنامه ریزی پویای سازگار

عنوان انگلیسی
Linear-quadratic optimal control for unknown mean-field stochastic discrete-time system via adaptive dynamic programming approach
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
111717 2018 18 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 282, 22 March 2018, Pages 16-24

ترجمه کلمات کلیدی
کنترل بهینه خطی-درجه دوم، سیستم تصادفی متوسط برنامه ریزی پویا سازگار، شبکه عصبی پخش برگشتی،
کلمات کلیدی انگلیسی
Linear-quadratic optimal control; Mean-field stochastic system; Adaptive dynamic programming; Back propagation neural network;
پیش نمایش مقاله
پیش نمایش مقاله  کنترل بهینه خطی-درجه دوم برای سیستم زمان گسسته زمانه تصادفی میدان متوسط ​​با استفاده از روش برنامه ریزی پویای سازگار

چکیده انگلیسی

We develop an adaptive dynamic programming (ADP) approach to deal with the linear-quadratic (LQ) optimal control problem with unknown discrete-time mean-field stochastic system in this paper. At first, the mean-field stochastic LQ problem is transformed into the deterministic case by system transition. Secondly, a value iteration ADP approach is proposed and convergence proof is also discussed. Once again, in order to achieve the iteration method without any knowledge of the dynamics, back propagation neural network (BPNN) is applied to design model network, critic network and action network to ensure unknown system model, value function and control strategy, respectively. At last, it is demonstrated that the ADP approach is valid through simulation.