了得網圖書_基於強化學習的數據驅動優化控制方法圖書

作者:楊永亮著

定價:98

出版社:科學出版社

出版日期:2022年09月01日

頁數:168

裝幀:平裝

ISBN:9787030728692

●“博士後文庫”序言
前言
符號說明
第1章緒論
1.1 很優控制理論
1.1.1 離散時間動態繫統的很優控制
1.1.2 連續時間動態繫統的很優控制
1.2 強化學習與自適應動態規劃
1.2.1 自適應動態規劃理論基本原理
1.2.2 自適應動態規劃理論發展現狀
1.3 微分博弈理論
1.4 多智能體繫統的協同控制
1.5 事件觸發機制
第2章離散時間不確定線性繫統的數據驅動魯棒控制設計方法
2.1 引言
2.2 問題描述
2.3 基於代數裡卡蒂方程的魯棒控制器設計方法
2.4 同軌策略強化學習算法
2.4.1 基於模型的同軌策略強化學習
2.4.2 帶有探測噪聲的同軌策略強化學習
2.5 異軌策略強化學習
2.5.1 基於模型的異軌策略強化學習
2.5.2 帶有探測噪聲的異軌策略強化學習
2.5.3 無模型的異軌策略強化學習
2.6 仿真研究
2.7 小結
第3章基於數據驅動的離散繫統非零和博弈問題求解方法
3.1 引言
3.2 問題描述
3.2.1 非零和博弈問題
3.2.2 耦合代數裡卡蒂方程
3.3 基於模型的自適應動態規劃
3.3.1 同軌策略強化學習算法
3.3.2 異軌策略強化學習算法
3.4 無模型自適應動態規劃
3.5 仿真研究
3.5.1 案例一：離線迭代強化學習算法
3.5.2 案例二：同軌策略強化學習算法
3.5.3 實例三：異軌策略強化學習算法
3.6 小結
第4章連續時間動態繫統非零和博弈問題的數據驅動積分型強化學習方法
4.1 引言
4.2 問題描述
4.2.1 帶衰減繫數的非零和博弈的耦合代數裡卡蒂方程
4.2.2 離線策略迭代算法
4.3 積分值迭代算法
4.3.1 積分值迭代算法
4.3.2 具有衰減繫數的等價積分值迭代
4.4 理論分析
4.4.1 積分值迭代算法的正定性分析
4.4.2 積分值迭代算法的穩定性分析
4.4.3 積分值迭代算法的收斂性分析
4.5 仿真研究
4.6 小結
第5章基於Q學習的數據驅動間歇反饋控制器設計方法
5.1 引言
5.2 問題描述
5.2.1 時間觸發很優控制
5.2.2 間歇反饋控制
5.3 靜態間歇反饋設計
5.3.1 基於模型的靜態事件觸發控制
5.3.2 基於數據的靜態事件觸發控制
5.4 基於Q學習的數據驅動間歇反饋控制
5.5 仿真研究
5.6 小結
第6章一類異構多智能體繫統的數據驅動模型參考分布式包含控制設計方法
6.1 引言
6.2 問題描述
6.3 分布式自適應觀測器設計
6.4 分布式很優模型參考包含控制
6.4.1 問題描述
6.4.2 非齊次貝爾曼方程
6.4.3 非齊次代數裡卡蒂方程和很優性討論
6.4.4 非齊次代數裡卡蒂方程的求解與穩定性分析
6.5 接近分布式很優模型參考自適應包含控制
6.6 基於強化學習的接近分布式自適應很優包含控制設計
6.6.1 基於模型的強化學習設計方案
6.6.2 基於數據的強化學習設計方案
6.7 仿真研究
6.8 小結
第7章數據驅動多智能體繫統的事件觸發包含控制設計方法
7.1 引言
7.2 問題描述
7.3 時間觸發包含控制設計
7.4 事件觸發分布式包含控制設計
7.4.1 事件觸發方案設計
7.4.2 事件觸發機制的可行性分析
7.5 異軌策略強化學習
7.6 仿真研究
7.7 小結
參考文獻
編後記
彩圖

本書結合作者近年來在優化理論、采樣理論和控制理論方面的研究工作，繫統地介紹了自適應優化控制問題中的強化學習設計方法，充分考慮了學習算法的收斂性和學習過程中閉環繫統的穩定性，重點闡述了基於數據驅動的優化設計方案。針對魯棒控制問題、多玩家非零和博弈問題、多智能體分布式協同控制問題、事件觸發采樣機制設計與間歇反饋控制優化問題，建立了繫統的數據驅動優化控制設計與分析方法。本書既注重理論方法分析，又結合工程實際需求，可供從事自動控制工作的科研人員、工程技術人員，以及高等院校自動化、應用數學及其他相關專業的高年級本科生、研究生和教師研究與參考。

商品搜索

商品分类

【醫學】

【各大出版社】