產品名稱:揭秘深度強化學習 是否是套裝:否 書名:揭秘深度強化學習 揭秘深度強化學習 代碼:89 出版社名稱:中國水利水電出版社 作者:彭偉 作者地區:中國大陸 ISBN編號:9787517062387
" 揭秘深度強化學習 作 者:彭偉 編著 定 價:89.8 出 版 社:中國水利水電出版社 出版日期:2018年05月01日 頁 數:360 裝 幀:平裝 ISBN:9787517062387 ●第1章深度強化學習概覽 ●1.1什麼是深度強化學習? ●1.1.1俯瞰強化學習 ●1.1.2來一杯深度學習 ●1.1.3Hello,深度強化學習 ●1.2深度強化學習的學習策略 ●1.3本書的內容概要 ●參考文獻 ●第2章強化學習基礎 ●2.1真相--經典的隱馬爾科夫模型(HMM) ●2.1.1HMM引例 ●2.1.2模型理解與推導 ●2.1.3隱馬爾科夫應用舉例 ●2.2逢考必過—馬爾科夫決策過程(MDP) ●2.2.1MDP生活化引例 ●2.2.2MDP模型 ●2.2.3MDP模型引例 ●2.2.4模型理解 ●2.2.5探索與利用 ●2.2.6值函數和動作值函數...... 內容簡介 深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結合,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL 算法潛力無限,AlphaGo 是目前該算法很成功的使用案例。DRL 算法以馬爾科夫決策過程為基礎,是在深度學習強大的非線性函數的擬合能力下構成的一種增強算法。深度強化學習算法主要包括基於動態規劃(DP)的算法以及基於策略優化的算法,本書的目的就是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。《揭秘深度強化學習人工智能機器學習技術叢書》共10 章,首先以AlphaGo 在圍棋大戰的偉大事跡開始,引起對人工智能發展和現狀的介紹,進而介紹深度強化學習的基本知識。然後分別介紹了強化學習(重點介紹蒙特卡洛算法和時序差分算...... 彭偉 編著 彭偉,AvatarWorks人工智能實驗室研究員,電子科技大學EE學士,廈門大學計算機碩士,具有良好的軟硬件能力。目前主要從事人工智能、機器學習算法的研究。主要的項目經歷包括視覺目標跟蹤、行人檢測、目標檢測、3D動畫風格傳輸、虛擬機器人行為繫統等,具有豐富的實戰經驗。 前 言深度強化學習(Deep Reinforcement Learning,DRL)是一種新興的通用人工智能算法技術,是人工智能邁向智能決策的重要一步。前 言深度強化學習(Deep Reinforcement Learning,DRL)是一種新興的通用人工智能算法技術,是人工智能邁向智能決策的重要一步。關於深度強化學習的文章目前比較少,繫統介紹深度強化學習的教材幾乎沒有。本書繫統地介紹深度強化學習算法的基礎知識。學習該算法的人員需要人工智能相關專業的背景,但是並不需要比較深的背景。本書以一種通俗易懂的、細致的方式對深度強化學習算法進行了講解,力求幫助讀者較快入門。深度強化學習涉及的知識面比較廣,但其算法原理並不是想像得那麼復雜。因此,本書會對其相關知識點進行簡要的介紹,保證沒有相關經驗的讀者也能夠很好地理解本書的內容。通過本書的學...... "
|