عنوان مقاله فارسی: کنترل ردیابی تطبیقی تحمل خطا برای سیستمهای گسسته - زمان MIMO از طریق الگوریتم یادگیری تقویتی با پارامترهای یادگیری کمتر
عنوان مقاله لاتین: Adaptive Fault-Tolerant Tracking Control for MIMO Discrete-Time Systems via Reinforcement Learning Algorithm With Less Learning Parameters
نویسندگان: Lei Liu; Zhanshan Wang; Huaguang Zhang
تعداد صفحات: 14
سال انتشار: 2017
زبان: لاتین
Abstract:
This paper is concerned with a reinforcement learning-based adaptive tracking control technique to tolerate faults for a class of unknown multiple-input multiple-output nonlinear discrete-time systems with less learning parameters. Not only abrupt faults are considered, but also incipient faults are taken into account. Based on the approximation ability of neural networks, action network and critic network are proposed to approximate the optimal signal and to generate the novel cost function, respectively. The remarkable feature of the proposed method is that it can reduce the cost in the procedure of tolerating fault and can decrease the number of learning parameters and thus reduce the computational burden. Stability analysis is given to ensure the uniform boundedness of adaptive control signals and tracking errors. Finally, three simulations are used to show the effectiveness of the present strategy.
این مقاله به یک روش کنترل تطبیقی مبتنی بر یادگیری تقویتی میپردازد تا خطاها را برای دستهای از سیستمهای گسسته غیر خطی چند ورودی چند خروجی با پارامترهای یادگیری کمتر تحمل کند. نه تنها خطاهای ناگهانی در نظر گرفته میشوند، بلکه خطاهای اولیه نیز در نظر گرفته میشوند. براساس توانایی تقریب شبکههای عصبی، شبکه عملیاتی و شبکه انتقادی به ترتیب برای تخمین سیگنال بهینه و تولید تابع هزینه جدید پیشنهاد شدهاند. ویژگی قابلتوجه روش پیشنهادی این است که میتواند هزینه در روش تحمل خطا را کاهش دهد و میتواند تعداد پارامترهای یادگیری را کاهش دهد و بنابراین بار محاسباتی را کاهش دهد. تحلیل پایداری برای اطمینان از محدوده یکنواخت سیگنالهای کنترل تطبیقی و خطاهای ردیابی ارائه شدهاست. در نهایت، سه شبیهسازی برای نشان دادن اثربخشی استراتژی حاضر استفاده میشود.
adaptive fault-tolerant tracking control for mimo discrete-time systems via reinforcement learning algorithm with less learning parameters_1618928571_47663_4145_1883.zip3.62 MB |