[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

  •  文化

  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

     保健/养生
     体育/运动
     手工/DIY
     休闲/爱好
     英文原版书
     港台图书
     研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学
  • 統計強化學習:現代機器學習方法
    該商品所屬分類:圖書 -> 人工智能
    【市場價】
    596-864
    【優惠價】
    373-540
    【作者】 杉山將 
    【出版社】機械工業出版社 
    【ISBN】9787111622451
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:機械工業出版社
    ISBN:9787111622451
    商品編碼:51943527301

    品牌:文軒
    出版時間:2019-05-01
    代碼:79

    作者:杉山將

        
        
    "
    作  者:[日]杉山將(Masashi Sugiyama) 著 高陽 等 譯
    /
    定  價:79
    /
    出 版 社:機械工業出版社
    /
    出版日期:2019年05月01日
    /
    頁  數:188
    /
    裝  幀:平裝
    /
    ISBN:9787111622451
    /
    目錄
    ●譯者序序前言作者簡介第一部分  簡介第1章  強化學習介紹3  1.1  強化學習3  1.2  數學形式化8  1.3  本書結構11    1.3.1  模型無關策略迭代11    1.3.2  模型無關策略搜索12    1.3.3  基於模型的強化學習13第二部分  模型無關策略迭代第2章  基於值函數近似的策略迭代17  2.1  值函數17    2.1.1  狀態值函數17    2.1.2  狀態-動作值函數18  2.2  最小二乘策略迭代19    2.2.1  瞬時獎賞回歸20    2.2.2  算法21    2.2.3  正則化23    2.2.4  模型選擇25  2.3  本章小結26第3章  值函數近似中的基函數設計27  3.1  圖中的高斯核27    3.1.1  MDP-誘導圖27    3.1.2  通用高斯核28    3.1.3  測地線高斯核29    3.1.4  擴展到連續狀態空間30  3.2  圖解說明30    3.2.1  配置30    3.2.2  測地線高斯核31    3.2.3  通用高斯核33    3.2.4  圖拉普拉斯特征基33    3.2.5  擴散小波35  3.3  數值示例35    3.3.1  機器人手臂控制35    3.3.2  機器人導航39  3.4  本章小結46第4章  策略迭代中的樣本重用47  4.1  形式化47  4.2  離策略值函數近似48    4.2.1  片段重要性加權49    4.2.2  每次決策的重要性加權50    4.2.3  自適應的每次決策重要性加權50    4.2.4  圖解說明51  4.3  展平參數的自動選擇54    4.3.1  重要性加權交叉驗證54    4.3.2  圖解說明55  4.4  樣本重用策略迭代56    4.4.1  算法56    4.4.2  圖解說明56  4.5  數值示例58    4.5.1  倒立擺58    4.5.2  小車爬山61  4.6  本章小結64第5章  策略迭代中的主動學習65  5.1  主動學習的高效探索65    5.1.1  問題配置65    5.1.2  泛化誤差的分解66    5.1.3  估計泛化誤差67    5.1.4  設計采樣策略68    5.1.5  圖解說明69  5.2  主動策略迭代72    5.2.1  具有主動學習的樣本重用策略迭代72    5.2.2  圖解說明73  5.3  數值示例74  5.4  本章小結76第6章  魯棒策略迭代79  6.1  策略迭代中的魯棒性和可靠性79    6.1.1  魯棒性79    6.1.2  可靠性80  6.2  最小絕對策略迭代81    6.2.1  算法81    6.2.2  圖解說明81    6.2.3  性質82  6.3  數值示例83  6.4  可能的拓展88    6.4.1  Huber損失88    6.4.2  pinball損失89    6.4.3  deadzone-linear損失90    6.4.4  切比雪夫逼近90    6.4.5  條件風險值91  6.5  本章小結92第三部分  模型無關策略搜索第7章  梯度上升的直接策略搜索95  7.1  形式化95  7.2  梯度方法96    7.2.1  梯度上升96    7.2.2  方差約簡的基線減法98    7.2.3  梯度估計量的方差分析99  7.3  自然梯度法101    7.3.1  自然梯度上升101    7.3.2  圖解說明103  7.4  計算機圖形中的應用:藝術家智能體104    7.4.1  東方山水畫繪畫104    7.4.2  狀態、動作和瞬時獎賞的設計106    7.4.3  實驗結果111  7.5  本章小結113第8章  期望優選化的直接策略搜索117  8.1  期望優選化方法117  8.2  樣本重用119    8.2.1  片段重要性加權119    8.2.2  每次決策的重要性加權122    8.2.3  自適應的每次決策重要性加權123    8.2.4  展平參數的自動選擇123    8.2.5  樣本重用的加權獎賞回歸125  8.3  數值示例125  8.4  本章小結131第9章  策略優先搜索133  9.1  形式化133  9.2  基於參數探索的策略梯度134    9.2.1  策略優先的梯度上升134    9.2.2  方差約簡的基線減法135    9.2.3  梯度估計量的方差分析136    9.2.4  數值示例138  9.3  策略優先搜索中的樣本重用142    9.3.1  重要性加權142    9.3.2  基線減法的方差約簡144    9.3.3  數值示例146  9.4  本章小結153第四部分  基於模型的強化學習第10章  轉移模型估計157  10.1  條件密度估計157    10.1.1  基於回歸的方法157    10.1.2  ε-鄰域核密度估計158    10.1.3  最小二乘條件密度估計159  10.2  基於模型的強化學習161  10.3  數值示例162    10.3.1  連續型鏈條遊走162    10.3.2  人形機器人控制167  10.4  本章小結171第11章  轉移模型估計的維度約簡173  11.1  充分維度約簡173  11.2  平方損失條件熵173    11.2.1  條件獨立174    11.2.2  利用SCE進行維度約簡175    11.2.3  SCE與平方損失互信息的關繫176  11.3  數值示例176    11.3.1  人工和標準數據集176    11.3.2  人形機器人179  11.4  本章小結182參考文獻183
    內容簡介
    本書從現代機器學習的視角介紹了統計強化學習的基本概念和實用算法。它涵蓋了各種類型的強化學習方法,包括基於模型的方法和與模型無關的方法,策略迭代和策略搜索方法。
    作者簡介
    [日]杉山將(Masashi Sugiyama) 著 高陽 等 譯
    杉山將(Masashi Sugiyama) 東京大學教授,研究興趣為機器學習與數據挖掘的理論、算法和應用。2007年獲得IBM學者獎,以表彰其在機器學習領域非平穩性方面做出的貢獻。2011年獲得日本信息處理協會頒發的Nagao特別研究員獎,以及日本文部科學省頒發的青年科學家獎,以表彰其對機器學習密度比範型的貢獻。
    摘要
    在即將到來的大數據時代,統計學與機器學習正成為數據挖掘不可或缺的工具。根據數據分析的類型,機器學習方法分為三類:●監督學習:給定輸入和輸出的數據,監督學習的目標是分析輸入、輸出數據之間的關繫。監督學習典型的任務包括回歸(預測真實取值)、分類(預測類別)以及排序(預測順序)。監督學習是最常用的數據分析工具,並且已經在統計學領域被研究了很長時間。監督學習在機器學習中近期的趨勢是利用輸入、輸出數據的輔助信息來進一步改善預測的精度。例如,半監督學習利用額外的輸入數據,遷移學習借用來自其他相似學習任務的數據,多任務學習同時解決多個相關學習任務。●無監督學習:僅給定輸入數據,無監督學習的目標是在數據中找到有用的東西。由於這種模糊的定義,無監督學習研究往往比監督學習更具特色。然而,由於其自動化以及廉價的特性,無監督學習被認為是數據挖掘中最重要的工具之一。無監督學習典型的任務包括聚類(根據數據的相似性進行等



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    【同作者商品】
    杉山將
      本網站暫時沒有該作者的其它商品。
    有該作者的商品通知您嗎?
    請選擇作者:
    杉山將
    您的Email地址
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部