دانلود مقاله ISI انگلیسی شماره 79637
ترجمه فارسی عنوان مقاله

کنترل ردیابی عصبی هزینه تضمین شده برای یک کلاس از سیستم های غیر خطی نامشخص با استفاده از برنامه نویسی پویای تطبیقی ☆

عنوان انگلیسی
Guaranteed cost neural tracking control for a class of uncertain nonlinear systems using adaptive dynamic programming ☆
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
79637 2016 11 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 198, 19 July 2016, Pages 80–90

ترجمه کلمات کلیدی
برنامه نویسی پویای تطبیقی؛ کنترل هزینه تضمین شده - معادله هامیلتون-ژاکوبی-بلمن، شبکه عصبی؛ سیستم غیر خطی؛ یادگیری تقویت
کلمات کلیدی انگلیسی
Adaptive dynamic programming; Guaranteed cost control; Hamilton–Jacobi–Bellman equation; Neural network; Nonlinear system; Reinforcement learning
پیش نمایش مقاله
پیش نمایش مقاله  کنترل ردیابی عصبی هزینه تضمین شده برای یک کلاس از سیستم های غیر خطی نامشخص با استفاده از برنامه نویسی پویای تطبیقی ☆

چکیده انگلیسی

This paper presents an adaptive dynamic programming-based guaranteed cost neural tracking control algorithm for a class of continuous-time matched uncertain nonlinear systems. By introducing an augmented system and employing a modified cost function with a discount factor, the guaranteed cost tracking control problem is transformed into an optimal tracking control problem. Unlike existing optimal tracking control algorithms often requiring the control matrix to be invertible, the developed control algorithm relaxes this restrictive condition under the assumption that the system is controllable. A single critic neural network (NN) is constructed to approximate the solution of the modified Hamilton–Jacobi–Bellman equation corresponding to the nominal augmented error dynamics. Utilizing the newly developed critic NN, the optimal tracking control can be derived without policy iteration. All signals in the closed-loop system are proved to be uniformly ultimately bounded via Lyapunov׳s direct method. In addition, the developed control scheme is verified to guarantee that the tracking errors converge to an adjustable neighborhood of the origin. Two numerical examples are provided to illustrate the effectiveness and applicability of the developed approach.