خانه راهنمای خرید پیگیری سفارش پشتیبانی درباره ما تماس با ما
محصولات مرتبط
دانلود قالب پاورپوینت مهندسی کامپیوتر Computer PowerPoint
دانلود قالب پاورپوینت مهندسی کامپیوتر Computer PowerPoint
قیمت : 10,500 تومان
دانلود حل المسائل مهندسی نرم افزار یان سامرویل Ian Sommerville
دانلود حل المسائل مهندسی نرم افزار یان سامرویل Ian Sommerville
قیمت : 50,000 تومان
مقاله بررسی چارچوب های یادگیری عمیق مقیاس پذیر
مقاله بررسی چارچوب های یادگیری عمیق مقیاس پذیر
قیمت : 15,750 تومان
مقاله مروری بر معماری یادگیری عمیق برای تصویربرداری مغز مبتنی بر EEG
مقاله مروری بر معماری یادگیری عمیق برای تصویربرداری مغز مبتنی بر EEG
قیمت : 15,750 تومان

مقاله کنترل بهینه مبتنی بر داده برای سیستم‌های چند عاملی گسسته زمانی

مقاله کنترل بهینه مبتنی بر داده برای سیستم‌های چند عاملی گسسته زمانی

عنوان مقاله فارسی: کنترل بهینه مبتنی بر داده برای سیستم‌های چند عاملی گسسته - زمانی با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی

عنوان مقاله لاتین: Data-Driven Optimal Consensus Control for Discrete-Time Multi-Agent Systems With Unknown Dynamics Using Reinforcement Learning Method

نویسندگان: Huaguang Zhang; He Jiang; Yanhong Luo; Geyang Xiao

تعداد صفحات: 9

سال انتشار: 2017

زبان: لاتین


Abstract:


This paper investigates the optimal consensus control problem for discrete-time multi-agent systems with completely unknown dynamics by utilizing a data-driven reinforcement learning method. It is known that the optimal consensus control for multi-agent systems relies on the solution of the coupled Hamilton-Jacobi-Bellman equation, which is generally impossible to be solved analytically. Even worse, most real-world systems are too complicated to obtain accurate mathematical models. To overcome these deficiencies, a data-based adaptive dynamic programming method is presented using the current and past system data rather than the accurate system models also instead of the traditional identification scheme which would cause the approximation residual errors. First, we establish a discounted performance index and formulate the optimal consensus problem via Bellman optimality principle. Then, we introduce the policy iteration algorithm which motivates this paper. To implement the proposed online action-dependent heuristic dynamic programming method, two neural networks (NNs), 1) critic NN and 2) actor NN, are employed to approximate the iterative performance index functions and control policies, respectively, in real time. Finally, two simulation examples are provided to demonstrate the effectiveness of the proposed method.


فایل هایی که پس از خرید می توانید دانلود نمائید

data-driven optimal consensus control for discrete-time multi-agent systems with unknown dynamics using reinforcement learning method_1622970223_48870_4145_1856.zip2.76 MB
پرداخت و دانلود محصول
بررسی اعتبار کد دریافت کد تخفیف
مبلغ قابل پرداخت : 15,750 تومان پرداخت از طریق درگاه
انتقال به صفحه پرداخت