ترجمه فارسی عنوان مقاله
بر پایه ی توانایی یادگیری در بازی ها با مشاهدات بازپرداخت غیرمنتظره است
عنوان انگلیسی
On the robustness of learning in games with stochastically perturbed payoff observations
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
114008 | 2017 | 38 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Games and Economic Behavior, Volume 103, May 2017, Pages 41-66
ترجمه چکیده
انگیزه کمبود بازخورد دقیق بازخورد در کاربرد عملی تئوری بازی، ما یک کلاس از دینامیک یادگیری را بررسی می کنیم که بازیکنان انتخاب خود را براساس مشاهدات گذشته پرداخت می کنند که در معرض سر و صدا و اختلالات تصادفی هستند. اول، در مورد تک نفره (مربوط به یک عامل برای سازگاری با یک محیط به طور دائمی در حال تغییر)، نشان می دهد که دینامیک تصادفی تحت مطالعه منجر به هیچ گونه پشیمانی تقریبا مطمئنا، صرف نظر از سطح سر و صدا در مشاهدات بازیکن. در مورد چند نفره، ما دریافتیم که استراتژی های تحت سلطه منقرض می شوند و ما نشان می دهیم که تعادل دقیق ناش به طور اتفاقی پایدار و جذاب است؛ برعکس، اگر یک دولت با ثبات یا جذب با احتمال مثبت جذب شود، این یک تعادل نها است. در نهایت، ما یک اصل عادی برای بازی های دو نفره ارائه می دهیم، و ما نشان می دهیم که در بازی های صفر با تعادل داخلی، میانگین زمان برای هر سطح نویز همگام با تعادل نجات می شود.