[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 深度強化學習落地指南 圖書
    該商品所屬分類:圖書 -> 科技
    【市場價】
    673-976
    【優惠價】
    421-610
    【作者】 魏寧 
    【出版社】電子工業出版社 
    【ISBN】9787121416446
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:電子工業出版社
    ISBN:9787121416446
    商品編碼:10035725052046

    品牌:文軒
    出版時間:2021-08-01
    代碼:109

    作者:魏寧

        
        
    "
    作  者:魏寧 著
    /
    定  價:109
    /
    出 版 社:電子工業出版社
    /
    出版日期:2021年08月01日
    /
    頁  數:196
    /
    裝  幀:平裝
    /
    ISBN:9787121416446
    /
    主編推薦
    "√一本討論強化學習落地應用的技術書√從實用性角度對強化學習進行歸納和梳理,重點圍繞如何解決實際問題展開√重難點技術剖析:動作空間的設計、狀態空間的搭建、回報函數的構造、算法的選擇和調試等√《深度強化學習落地指南》囊括了作者對強化學習應用落地的全新思考"
    目錄
    ●第1章 需求分析1
    1.1 需求分析:勿做DRL鐵錘人1
    1.2 一問“是不是”2
    1.2.1 Agent和環境定義2
    1.2.2 馬爾可夫決策過程和強化學習3
    1.3 二問“值不值”5
    1.3.1 試試規則和啟發式搜索5
    1.3.2 別忘了傳統強化學習7
    1.3.3 使用DRL的理由7
    1.4 三問“能不能”9
    1.4.1 場景固定:兩個分布一致9
    1.4.2 數據廉價:多、快、好、費13
    1.5 四問“邊界在哪裡”16
    1.6 本章小結18
    參考文獻19
    第2章 動作空間設計23
    2.1 動作空間設計:這裡大有可為23
    2.1.1 被忽視的價值23
    2.1.2 動作空間的常見類型24
    2.1.3 動作空間設計的基本原則26
    2.2 動作空間的完備性26
    2.2.1 功能完備27
    2.2.2 時效完備29
    2.3 動作空間的高效性30
    2.3.1 化整為零:以精度換效率31
    2.3.2 有機組合:尺度很重要33
    2.4 動作空間的合法性35
    2.4.1 非法動作屏蔽機制36
    2.4.2 Agent的知情權37
    2.5 本章小結39
    參考文獻40
    第3章 狀態空間設計43
    3.1 狀態空間設計:特征工程的誘惑43
    3.2 狀態空間設計的兩種常見誤區44
    3.2.1 過分依賴端到端特征學習44
    3.2.2 很好特征工程44
    3.3 與動作空間和回報函數的協同設計45
    3.3.1 與動作空間尺度一致45
    3.3.2 以回報函數為中心46
    3.4 狀態空間設計的四個步驟47
    3.4.1 任務分析47
    3.4.2 相關信息篩選49
    3.4.3 泛化性考量53
    3.4.4 效果驗證58
    3.5 本章小結61
    參考文獻62
    第4章 回報函數設計64
    4.1 回報函數設計:面向強化學習的編程64
    4.2 稀疏回報問題65
    4.2.1 孤獨無援的主線回報65
    4.2.2 稀疏回報問題的本質66
    4.3 輔助回報67
    4.3.1 子目標回報67
    4.3.2 塑形回報70
    4.3.3 內驅回報76
    4.3.4 回報取值的注意事項77
    4.4 回報函數設計的常見陷阱78
    4.4.1 魯莽79
    4.4.2 貪婪80
    4.4.3 懦弱82
    4.5 很優回報問題83
    4.6 基於學習的回報函數84
    4.6.1 經典方法84
    4.6.2 前沿方法85
    4.7 本章小結87
    參考文獻88
    第5章 算法選擇92
    5.1 算法選擇:拿來主義和改良主義92
    5.1.1 DRL算法的發展脈絡92
    5.1.2 一篩、二比、三改良94
    5.1.3 從獨當一面到眾星捧月96
    5.2 牢記經典勿忘本97
    5.2.1 DQN98
    5.2.2 DDPG99
    5.2.3 A3C102
    5.3 關注SOTA算法別留戀105
    5.3.1 TD3105
    5.3.2 SAC107
    5.3.3 PPO110
    5.4 其他算法112
    5.5 本章小結113
    參考文獻113
    第6章 訓練調試119
    6.1 訓練調試:此事要躬行119
    6.2 訓練前的準備工作120
    6.2.1 制定訓練方案120
    6.2.2 選擇網絡結構124
    6.2.3 隨機漫步128
    6.2.4 數據預處理129
    6.3 訓練進行時131
    6.3.1 反脆弱:擁抱不確定性131
    6.3.2 調節超參數134
    6.3.3 監控訓練狀態143
    6.4 給初學者的建議146
    6.5 本章小結148
    參考文獻149
    第7章 性能衝刺154
    7.1 性能衝刺:為DRL注入強心劑154
    7.2 課程學習155
    7.2.1 源任務及其分類155
    7.2.2 應用方式157
    7.3 額外監督信號162
    7.3.1 有監督預訓練163
    7.3.2 輔助任務164
    7.4 進化策略169
    7.4.1 基本原理169
    7.4.2 關鍵細節170
    7.4.3 應用方式174
    7.5 本章小結175
    參考文獻176
    內容簡介
    本書從工業界一線算法工作者的視角,對深度強化學習落地實踐中的工程經驗和相關方法論做出了深度思考和繫統歸納。本書跳出了原理介紹加應用案例的傳統敘述模式,轉而在橫向上對深度強化學習落地過程中的核心環節進行了完整復盤。主要內容包括需求分析和算法選擇的方法,動作空間、狀態空間和回報函數設計的理念,訓練調試和性能衝刺的技巧等。本書既是前人智慧與作者個人經驗的交叉印證和精心整合,又構成了從理論到實踐再到統一方法論的認知閉環,與市面上側重於算法原理和代碼實現的強化學習書籍形成了完美互補。
    作者簡介
    魏寧 著
    魏寧,本科和碩士分別畢業於西安交通大學和中國科學院大學計算機專業,在國際很好會 議和期刊上發表多篇學術論文,曾就職於德國KUKA Robotics從事協作機器人智能應用研發工作,目前在海康威視研究院任算法專家,負責深度學習、強化學習等領域的創新研究和落地應用,同時也是互聯網社區“深度強化學習實驗室”核心成員,在強化學習應用方面具有豐富的實踐經驗。



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    【同作者商品】
    魏寧
      本網站暫時沒有該作者的其它商品。
    有該作者的商品通知您嗎?
    請選擇作者:
    魏寧
    您的Email地址
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部