[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 動手學強化學習 圖書
    該商品所屬分類:圖書 ->
    【市場價】
    518-752
    【優惠價】
    324-470
    【作者】 張偉楠瀋鍵俞勇 
    【出版社】人民郵電出版社 
    【ISBN】9787115584519
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:人民郵電出版社
    ISBN:9787115584519
    商品編碼:10049406519916

    品牌:文軒
    出版時間:2022-05-01
    代碼:89

    作者:張偉楠,瀋鍵,俞勇

        
        
    "



    作  者:張偉楠,瀋鍵,俞勇 著
    /
    定  價:89.9
    /
    出 版 社:人民郵電出版社
    /
    出版日期:2022年05月01日
    /
    頁  數:260
    /
    裝  幀:平裝
    /
    ISBN:9787115584519
    /
    主編推薦
    ·名家作品:上海交通大學ACM班創始人俞勇教授、博士生導師張偉楠副教授、APEX實驗室博士生瀋鍵編寫;·理論扎實:基於上交大ACM班的人工智能專業課程構建強化學習的學習體繫;·配套資源豐富:在線代碼運行環境+在線視頻課程+在線討論區+在線習題+配套課件;·多位業內大咖力薦:字節跳動人工智能實驗室總監李航、1986年圖靈獎得主John Hopcroft、北京大學數學科學學院統計學教授張志華、倫敦大學學院計算機科學繫講席教授汪軍、亞馬遜資深科學家、《動手學深度學習》作者李沐
    目錄
    ●第一部分 強化學習基礎
    第1章 初探強化學習
    1.1 簡介
    1.2 什麼是強化學習
    1.3 強化學習的環境
    1.4 強化學習的目標
    1.5 強化學習中的數據
    1.6 強化學習的獨特性
    1.7 小結
    第2章 多臂老虎機問題
    2.1 簡介
    2.2 問題介紹
    2.2.1 問題定義
    2.2.2 形式化描述
    2.2.3 累積懊悔
    2.2.4 估計期望獎勵
    2.3 探索與利用的平衡
    2.4 □(特殊字符)-貪婪算法
    2.5 上置信界算法
    2.6 湯普森采樣算法
    2.7 小結
    2.8 參考文獻
    第3章 馬爾可夫決策過程
    3.1 簡介
    3.2 馬爾可夫過程
    3.2.1 隨機過程
    3.2.2 馬爾可夫性質
    3.2.3 馬爾可夫過程
    3.3 馬爾可夫獎勵過程
    3.3.1 回報
    3.3.2 價值函數
    3.4 馬爾可夫決策過程
    3.4.1 策略
    3.4.2 狀態價值函數
    3.4.3 動作價值函數
    3.4.4 貝爾曼期望方程
    3.5 蒙特卡洛方法
    3.6 占用度量
    3.7 很優策略
    3.8 小結
    3.9 參考文獻
    第4章 動態規劃算法
    4.1 簡介
    4.2 懸崖漫步環境
    4.3 策略迭代算法
    4.3.1 策略評估
    4.3.2 策略提升
    4.3.3 策略迭代
    4.4 價值迭代算法
    4.5 冰湖環境
    ……
    第二部分 強化學習進階
    第三部分 強化學習前沿
    總結與展望
    中英文術語對照表與符號表
    內容簡介
    本書繫統地介紹了強化學習的原理和實現,是一本理論扎實、落地性強的圖書。本書包含3個部分:第一部分為強化學習基礎,講解強化學習的基礎概念和表格型強化學習方法;第二部分為強化學習進階,討論深度強化學習的思維方式、深度價值函數和深度策略學習方法;第三部分為強化學習前沿,介紹學術界在深度強化學習領域的主要關注方向和前沿算法。同時,本書提供配套的線上代碼實踐平臺,展示源碼的編寫和運行過程,讓讀者進一步掌握強化學習算法的運行機制。本書理論與實踐並重,在介紹強化學習理論的同時,輔之以線上代碼實踐平臺,幫助讀者通過實踐加深對理論的理解。本書適合對強化學習感興趣的高校學生、教師,以及相關行業的開發和研究人員閱讀、實踐。



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部