[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

大規模強化學習
該商品所屬分類:圖書 -> 人工智能
【市場價】
828-1200
【優惠價】
518-750
【作者】 劉全等著 
【出版社】科學出版社 
【ISBN】9787030477477
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



出版社:科學出版社
ISBN:9787030477477
商品編碼:10325280769

品牌:文軒
出版時間:2016-03-01
代碼:96

作者:劉全等著

    
    
"
作  者:劉全 等 著
/
定  價:96
/
出 版 社:科學出版社
/
出版日期:2016年03月01日
/
頁  數:277
/
裝  幀:平裝
/
ISBN:9787030477477
/
目錄
●前言
●第1章強化學習概述
●1.1簡介
●1.2形式框架
●1.2.1馬爾可夫決策過程
●1.2.2策略
●1.2.3回報
●1.3值函數
●1.4解決強化學習問題
●1.4.1動態規劃:基於模型的解決技術
●1.4.2強化學習:模型無關的解決技術
●1.5本章小結
●參考文獻
●第2章大規模或連續狀態空間的強化學習
●2.1簡介
●2.2近似表示
●2.2.1帶參數化值函數逼近
●2.2.2非參數化值函數逼近
●2.3值函數逼近求解方法
●2.3.1梯度下降方法
●部分目錄
內容簡介
從與環境交互中學習是人類獲取知識的主要方法,也是人類提高智能水平的基本途徑。人類智能研究的一個很核心問題就是構建具有類似人類智能的繫統。該繫統的一個主要特征就是能夠適應未知環境,並逐漸增強其自身能力。本書對連續狀態空間的理論、算法及應用進行了研究和論述。主要包括:強化學習基本理論和大規模強化學習基本理論。



"
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
【同作者商品】
劉全等著
  本網站暫時沒有該作者的其它商品。
有該作者的商品通知您嗎?
請選擇作者:
劉全等著
您的Email地址
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部