ترجمه فارسی عنوان مقاله
انحراف سیاست تحت تحریم پاداش برای یادگیری تقویت چند هدف
عنوان انگلیسی
Policy invariance under reward transformations for multi-objective reinforcement learning
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
112675 | 2017 | 42 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Neurocomputing, Volume 263, 8 November 2017, Pages 60-73
ترجمه کلمات کلیدی
تقویت یادگیری، چند هدفه، مبتنی بر پتانسیل، شکل دادن به پاداش، سیستم های چندگانه،
کلمات کلیدی انگلیسی
Reinforcement learning; Multi-objective; Potential-based; Reward shaping; Multi-agent systems;