دانلود مقاله ISI انگلیسی شماره 79719
ترجمه فارسی عنوان مقاله

برنامه نویسی پویای فرآیند گوسی

عنوان انگلیسی
Gaussian process dynamic programming
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی ترجمه فارسی
79719 2009 17 صفحه PDF سفارش دهید
دانلود فوری مقاله + سفارش ترجمه

نسخه انگلیسی مقاله همین الان قابل دانلود است.

هزینه ترجمه مقاله بر اساس تعداد کلمات مقاله انگلیسی محاسبه می شود.

این مقاله تقریباً شامل 17378 کلمه می باشد.

هزینه ترجمه مقاله توسط مترجمان با تجربه، طبق جدول زیر محاسبه می شود:

شرح تعرفه ترجمه زمان تحویل جمع هزینه
ترجمه تخصصی - سرعت عادی هر کلمه 18 تومان 23 روز بعد از پرداخت 312,804 تومان
ترجمه تخصصی - سرعت فوری هر کلمه 36 تومان 12 روز بعد از پرداخت 625,608 تومان
پس از پرداخت، فوراً می توانید مقاله را دانلود فرمایید.
تولید محتوا برای سایت شما
پایگاه ISIArticles آمادگی دارد با همکاری مجموعه «شهر محتوا» با بهره گیری از منابع معتبر علمی، برای کتاب، سایت، وبلاگ، نشریه و سایر رسانه های شما، به زبان فارسی «تولید محتوا» نماید.
  • تولید محتوا با مقالات ISI برای سایت یا وبلاگ شما
  • تولید محتوا با مقالات ISI برای کتاب شما
  • تولید محتوا با مقالات ISI برای نشریه یا رسانه شما
  • و...

پیشنهاد می کنیم کیفیت محتوای سایت خود را با استفاده از منابع علمی، افزایش دهید.

سفارش تولید محتوا کد تخفیف 10 درصدی: isiArticles
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 72, Issues 7–9, March 2009, Pages 1508–1524

ترجمه کلمات کلیدی
یادگیری تقویت؛ کنترل بهینه - برنامه نویسی پویا؛ فرآیندهای گاوسی؛ یادگیری فعال بیزی - یادگیری سیاست
کلمات کلیدی انگلیسی
Reinforcement learning; Optimal control; Dynamic programming; Gaussian processes; Bayesian active learning; Policy learning
پیش نمایش مقاله
پیش نمایش مقاله برنامه نویسی پویای فرآیند گوسی

چکیده انگلیسی

Reinforcement learning (RL) and optimal control of systems with continuous states and actions require approximation techniques in most interesting cases. In this article, we introduce Gaussian process dynamic programming (GPDP), an approximate value function-based RL algorithm. We consider both a classic optimal control problem, where problem-specific prior knowledge is available, and a classic RL problem, where only very general priors can be used. For the classic optimal control problem, GPDP models the unknown value functions with Gaussian processes and generalizes dynamic programming to continuous-valued states and actions. For the RL problem, GPDP starts from a given initial state and explores the state space using Bayesian active learning. To design a fast learner, available data have to be used efficiently. Hence, we propose to learn probabilistic models of the a priori unknown transition dynamics and the value functions on the fly. In both cases, we successfully apply the resulting continuous-valued controllers to the under-actuated pendulum swing up and analyze the performances of the suggested algorithms. It turns out that GPDP uses data very efficiently and can be applied to problems, where classic dynamic programming would be cumbersome.

دانلود فوری مقاله + سفارش ترجمه

نسخه انگلیسی مقاله همین الان قابل دانلود است.

هزینه ترجمه مقاله بر اساس تعداد کلمات مقاله انگلیسی محاسبه می شود.

این مقاله شامل 17378 کلمه می باشد.

هزینه ترجمه مقاله توسط مترجمان با تجربه، طبق جدول زیر محاسبه می شود:

شرح تعرفه ترجمه زمان تحویل جمع هزینه
ترجمه تخصصی - سرعت عادی هر کلمه 18 تومان 23 روز بعد از پرداخت 312,804 تومان
ترجمه تخصصی - سرعت فوری هر کلمه 36 تومان 12 روز بعد از پرداخت 625,608 تومان
پس از پرداخت، فوراً می توانید مقاله را دانلود فرمایید.