[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 用Python動手學強化學習(改訂第2版) 圖書
    該商品所屬分類:圖書 -> 科技
    【市場價】
    518-752
    【優惠價】
    324-470
    【作者】 久保隆宏 
    【出版社】人民郵電出版社 
    【ISBN】9787115564221
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:人民郵電出版社
    ISBN:9787115564221
    商品編碼:10033906209517

    品牌:文軒
    出版時間:2021-07-01
    代碼:89

    作者:久保隆宏

        
        
    "
    作  者:(日)久保隆宏 著 梁垿,程引 譯
    /
    定  價:89.8
    /
    出 版 社:人民郵電出版社
    /
    出版日期:2021年07月01日
    /
    頁  數:280
    /
    裝  幀:平裝
    /
    ISBN:9787115564221
    /
    主編推薦
    1.從基礎到應用,一本書快速入門強化學習2.基於Python實現強化學習,直觀理解運作過程3.內容豐富,涵蓋強化學習基本概念、算法詳解、前沿應用、弱點及對策4.132張圖表與大量示例,全彩印刷圖文並茂提供良好閱讀體驗5.附免費下載源代碼為讀者提供親身實踐機會
    目錄
    ●第1章 了解強化學習
    1.1 強化學習與各關鍵詞之間的關繫
    1.2 強化學習的優點和弱點
    1.3 強化學習的問題設定:馬爾可夫決策過程
    第2章 強化學習的解法(1):根據環境制訂計劃
    2.1 價值的定義和計算:貝爾曼方程
    2.2 基於動態規劃法的價值近似的學習:價值迭代
    2.3 基於動態規劃法的策略的學習:策略迭代
    2.4 基於模型的方法和無模型的方法的區別
    第3章 強化學習的解法(2):根據經驗制訂計劃
    3.1 平衡經驗的積累與利用:Epsilon-Greedy算法
    3.2 是根據實際獎勵還是預測來修正計劃:蒙特卡洛方法和時序差分學習
    3.3 用經驗來更新價值近似還是策略:基於價值和基於策略
    第4章 使用面向強化學習的神經網絡
    4.1 將神經網絡應用於強化學習
    4.2 通過含有參數的函數實現價值近似:價值函數近似
    4.3 將深度學習應用於價值近似:DQN
    4.4 通過含有參數的函數實現策略:策略梯度
    4.5 將深度學習應用於策略:A2C
    4.6 是價值近似還是策略呢
    第5章 強化學習的弱點
    5.1 獲取樣本的效率低
    5.2 容易陷入局部很優行動和過擬合
    5.3 復現性差
    5.4 以弱點為前提的對策
    第6章 克服強化學習弱點的方法
    6.1 應對采樣效率低的方法:與基於模型的方法一起使用、表征學習
    6.2 改善復現性的方法:進化策略
    6.3 應對局部很優行動和過擬合的方法:模仿學習和逆強化學習
    第7章 強化學習的應用領域
    7.1 行動的很優化
    7.2 學習的很優化
    參考文獻
    內容簡介
    強化學習是機器學習的重要分支之一。本書結合實際可運行的Python代碼,通過簡明的文字、豐富的插圖和示例,通俗易懂地介紹了從基礎概念到前沿應用等方方面面的內容,包括根據環境和經驗制訂計劃的學習方法、強化學習與神經網絡的組合,以及強化學習的弱點和克服方法。讀者通過下載書中代碼並親自動手運行,可以快速入門強化學習並進行實踐。本書適合具有一定編程經驗、對強化學習感興趣的工程師閱讀。



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    【同作者商品】
    久保隆宏
      本網站暫時沒有該作者的其它商品。
    有該作者的商品通知您嗎?
    請選擇作者:
    久保隆宏
    您的Email地址
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部