دانلود مقاله ISI انگلیسی شماره 79597
ترجمه فارسی عنوان مقاله

برنامه نویسی پویای تطبیقی خود آموزش برای Gomoku

عنوان انگلیسی
Self-teaching adaptive dynamic programming for Gomoku
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
79597 2012 7 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 78, Issue 1, 15 February 2012, Pages 23–29

ترجمه کلمات کلیدی
Gomoku؛ یادگیری تقویت؛ برنامه نویسی پویا تطبیقی؛ یادگیری تفاوت زمانی؛ شبکه عصبی
کلمات کلیدی انگلیسی
Gomoku; Reinforcement learning; Adaptive dynamic programming; Temporal difference learning; Neural network
پیش نمایش مقاله
پیش نمایش مقاله  برنامه نویسی پویای تطبیقی خود آموزش برای Gomoku

چکیده انگلیسی

In this paper adaptive dynamic programming (ADP) is applied to learn to play Gomoku. The critic network is used to evaluate board situations. The basic idea is to penalize the last move taken by the loser and reward the last move selected by the winner at the end of a game. The results show that the presented program is able to improve its performance by playing against itself and has approached the candidate level of a commercial Gomoku program called 5-star Gomoku. We also examined the influence of two methods for generating games: self-teaching and learning through watching two experts playing against each other and presented the comparison results and reasons.