ترجمه فارسی عنوان مقاله
مبتنی بر مدل افزایشی برنامه ریزی دوبعدی اکتشافی دوبعدی برای کنترل انطباق غیر خطی
عنوان انگلیسی
Incremental model based online dual heuristic programming for nonlinear adaptive control
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
151717 | 2018 | 13 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Control Engineering Practice, Volume 73, April 2018, Pages 13-25
ترجمه کلمات کلیدی
تقویت یادگیری، یادگیری آنلاین، برنامه نویسی دوگانه کنترل انعطاف پذیر، کنترل غیرخطی
کلمات کلیدی انگلیسی
Reinforcement learning; Online learning; Dual heuristic programming; Adaptive control; Nonlinear control;
ترجمه چکیده
برنامه های دوگانه اکتشافی در سال های اخیر علاقه ای فراوانی به خود جلب کرده است؛ زیرا این فرایند موثر برای کنترل سازگاری مطلوب سیستم های غیر خطی نامشخص است. با این حال، به یک مرحله خارج از خط نیاز است تا یک مدل سیستم جهانی را از یک مدل نمایندگی، که اغلب غیرممکن است برای به دست آوردن در عمل، آموزش دهد. این مقاله یک رویکرد جدید و کارآمد برای کنترل خودآموز آنلاین بر پایه برنامه نویسی دوگانه است. این روش از یک روش حداقل مربع بازگشتی استفاده می کند تا یک مدل افزایشی از سیستم را به جای یک مدل سیستم جهانی شناسایی کند. مدل افزایشی مبتنی بر روش برنامه ریزی دوگانه اکتشافی، می تواند به طور انحصاری یک کنترل کننده نزدیک به مطلوب آنلاین بدون اطلاعات پیشین از پویایی سیستم یا یک مرحله آموزش خارج از خط تولید کند. برای مقایسه سازگاری آنلاین از روش برنامه ریزی دوبعدی اکتشافی معمول و روش جدید پیشنهاد شده، دو آزمایش عددی انجام می شود: یک کار ردیابی مرجع آنلاین و یک کار کنترل کنترل تحمل گسل. نتایج نشان می دهد که روش پیشنهادی از روش برنامه ریزی دوگانه اکتشافی متعارف در ظرفیت یادگیری آنلاین، کارایی، دقت و استحکام بهتر است.