دانلود مقاله ISI انگلیسی شماره 105777
ترجمه فارسی عنوان مقاله

روش یادگیری تکرار همگام بر پایه عصبی-شبکه برای بازی های چندجملهای صفر

عنوان انگلیسی
Neural-network-based synchronous iteration learning method for multi-player zero-sum games
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
105777 2017 26 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 242, 14 June 2017, Pages 73-82

ترجمه کلمات کلیدی
برنامه ریزی پویا سازگار، برنامه ریزی پویا تقریبی طراحی منتقدان سازگار، چند نفره، یادگیری تلطیف شبکه عصبی،
کلمات کلیدی انگلیسی
Adaptive dynamic programming; Approximate dynamic programming; Adaptive critic designs; Multi-player; Iteration learning; Neural network;
پیش نمایش مقاله
پیش نمایش مقاله  روش یادگیری تکرار همگام بر پایه عصبی-شبکه برای بازی های چندجملهای صفر

چکیده انگلیسی

In this paper, a synchronous solution method for multi-player zero-sum games without system dynamics is established based on neural network. The policy iteration (PI) algorithm is presented to solve the Hamilton–Jacobi–Bellman (HJB) equation. It is proven that the obtained iterative cost function is convergent to the optimal game value. For avoiding system dynamics, off-policy learning method is given to obtain the iterative cost function, controls and disturbances based on PI. Critic neural network (CNN), action neural networks (ANNs) and disturbance neural networks (DNNs) are used to approximate the cost function, controls and disturbances. The weights of neural networks compose the synchronous weight matrix, and the uniformly ultimately bounded (UUB) of the synchronous weight matrix is proven. Two examples are given to show that the effectiveness of the proposed synchronous solution method for multi-player ZS games.