了得網圖書_大規模強化學習

	[ 收藏 ] [ 繁体中文 ]
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款，4-7個工作日送達，999元臺幣免運費　　　在線留言商品價格為新臺幣

計算機周邊

商品搜索

类别：

关键字：

商品分类

點擊放大圖片

大規模強化學習
該商品所屬分類：圖書 -> 人工智能
【市場價】	828-1200元
【優惠價】	518-750元
【作者】	劉全等著
【出版社】	科學出版社
【ISBN】	9787030477477
【折扣說明】	一次購物滿999元台幣免運費+贈品一次購物滿2000元台幣95折+免運費+贈品一次購物滿3000元台幣92折+免運費+贈品一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】	①優質無紡布環保袋，做工棒！②品牌簽字筆 ③品牌手帕紙巾

版本	正版全新電子版PDF檔
您已选择：	正版全新
溫馨提示：如果有多種選項，請先選擇再點擊加入購物車。 . 電子圖書價格是0.69折，例如了得網價格是100元，電子書pdf的價格則是69元。 . 購買電子書不支持貨到付款，購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意，可以聯絡我們退款。謝謝。

內容介紹

字體縮小

字體放大

出版社：科學出版社

ISBN：9787030477477

商品編碼：10325280769

品牌：文軒

出版時間：2016-03-01

代碼：96

作者：劉全等著

　　　　

　　　　

"

作者:劉全等著

定價:96

出版社:科學出版社

出版日期:2016年03月01日

頁數:277

裝幀:平裝

ISBN:9787030477477

●前言
●第1章強化學習概述
●1.1簡介
●1.2形式框架
●1.2.1馬爾可夫決策過程
●1.2.2策略
●1.2.3回報
●1.3值函數
●1.4解決強化學習問題
●1.4.1動態規劃：基於模型的解決技術
●1.4.2強化學習：模型無關的解決技術
●1.5本章小結
●參考文獻
●第2章大規模或連續狀態空間的強化學習
●2.1簡介
●2.2近似表示
●2.2.1帶參數化值函數逼近
●2.2.2非參數化值函數逼近
●2.3值函數逼近求解方法
●2.3.1梯度下降方法
●部分目錄

內容簡介

從與環境交互中學習是人類獲取知識的主要方法，也是人類提高智能水平的基本途徑。人類智能研究的一個很核心問題就是構建具有類似人類智能的繫統。該繫統的一個主要特征就是能夠適應未知環境，並逐漸增強其自身能力。本書對連續狀態空間的理論、算法及應用進行了研究和論述。主要包括：強化學習基本理論和大規模強化學習基本理論。

"

網友評論我們期待著您對此商品發表評論

相關商品

【同作者商品】

劉全等著
	本網站暫時沒有該作者的其它商品。

☆有該作者的商品通知您嗎？
請選擇作者：
劉全等著
您的Email地址

在線留言 商品價格為新臺幣

關於我們送貨時間安全付款會員登入加入會員我的帳戶網站聯盟

DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.