![內容虛線](http://img.alicdn.com/imgextra/i4/101450072/TB2uhKJhB0kpuFjSsppXXcGTXXa-101450072.png)
內容簡介
![](http://img.alicdn.com/imgextra/i2/101450072/TB2LvCmhxXkpuFjy0FiXXbUfFXa-101450072.png)
從與環境交互中學習是人類獲取知識的主要方法,也是人類提高智能水平的基本途徑。人類智能研究的一個很核心問題就是構建具有類似人類智能的繫統。該繫統的一個主要特征就是能夠適應未知環境,並逐漸增強其自身能力。本書對連續狀態空間的理論、算法及應用進行了研究和論述。主要包括:強化學習基本理論和大規模強化學習基本理論。
|
|
首頁 | 電影 | 連續劇 | 音樂 | 圖書 | 女裝 | 男裝 | 童裝 | 內衣 | 百貨家居 | 包包 | 女鞋 | 男鞋 | 童鞋 | 計算機周邊 |
商品搜索商品分类新类目管理投资理财 经济 社会科学
|
|
![]() | |||
|