了得網圖書_大數據挖掘技術與應用

	[ 收藏 ] [ 繁体中文 ]
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款，4-7個工作日送達，999元臺幣免運費　　　在線留言商品價格為新臺幣

計算機周邊

商品搜索

类别：

关键字：

商品分类

點擊放大圖片

大數據挖掘技術與應用
該商品所屬分類：圖書 -> 電子工業出版社
【市場價】	1038-1504元
【優惠價】	649-940元
【作者】	周中元
【所屬類別】	電子工業出版社
【出版社】	電子工業出版社
【ISBN】	9787121367731
【折扣說明】	一次購物滿999元台幣免運費+贈品一次購物滿2000元台幣95折+免運費+贈品一次購物滿3000元台幣92折+免運費+贈品一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】	①優質無紡布環保袋，做工棒！②品牌簽字筆 ③品牌手帕紙巾

版本	正版全新電子版PDF檔
您已选择：	正版全新
溫馨提示：如果有多種選項，請先選擇再點擊加入購物車。 . 電子圖書價格是0.69折，例如了得網價格是100元，電子書pdf的價格則是69元。 . 購買電子書不支持貨到付款，購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意，可以聯絡我們退款。謝謝。

內容介紹

字體縮小

字體放大

出版社：電子工業出版社

ISBN：9787121367731

版次：1

商品編碼：12779628

品牌：電子工業出版社

包裝：平裝

叢書名：高端科技專著叢書

開本：16開

出版時間：2019-12-01

用紙：膠版紙

頁數：216

字數：346000

正文語種：中文

作者

　　　　

　　　　

"

內容簡介

本書繫統介紹大數據技術的原理、數據挖掘與應用，主要內容包括基本概念、數據收集、數據存儲、數據處理、大數據可視化、信息檢索、數據挖掘和效能評估。本書以簡單易懂的語言、生動有趣的實例和圖形展示知識點，將概念、原理與應用融會貫通，並對大數據工具軟件進行了細致的梳理。

作者簡介

目錄

第1章大數據概述
1．1 從AlphaGo說起
1．2 大數據定義
1．3 大數據產生的原因
1．4 大數據發展歷程
1．5 大數據的特征
1．6 數據的度量
1．7 大數據思維
1．8 科學研究範式的發展
1．9 大數據的影響及應用
1．10 大數據計算模式及產品
第2章數據收集
2．1 外部數據收集
2．1．1 網絡爬蟲原理
2．1．2 搜索排序策略
2．1．3 Web網絡圖
2．1．4 構建爬蟲繫統
2．2 內部數據收集
2．2．1 Flume
2．2．2 Chukwa
第3章數據存儲
3．1 文件存儲
3．1．1 Hadoop簡介
3．1．2 文件存儲
3．1．3 HDFS的基本術語
3．1．4 HDFS運行架構
3．1．5 HDFS安全設計
3．1．6 HDFS的弱點
3．2 數據庫存儲
3．2．1 NoSQL簡介
3．2．2 列族數據庫HBase
3．2．3 文檔數據庫MongoDB
3．2．4 圖數據庫
3．2．5 鍵-值對數據庫
第4章數據處理
4．1 離線批處理框架
4．2 MapReduce計算框架
4．3 Hadoop簡介
4．3．1 Hadoop生態圈
4．3．2 Hadoop發展歷程
4．3．3 Hadoop的特性
4．3．4 Hadoop的版本
4．4 HDFS高可用性架構
4．5 HDFS聯邦
4．6 YARN
4．7 Hadoop工具集
4．8 消息機制
4．8．1 消息處理模型
4．8．2 JMS
4．9 內存計算框架Spark
4．9．1 Spark的配置方式
4．9．2 Spark的主要特點
4．9．3 Spark生態圈
4．9．4 Spark與Hadoop比較
4．9．5 Spark運行架構
4．9．6 Spark基本運行流程
4．9．7 RDD
4．10 流式計算框架
4．10．1 流式計算處理過程
4．10．2 常見的流式計算軟件
4．10．3 Storm繫統
4．10．4 Spark Streaming
4．10．5 流計算與批處理計算的區別
4．11 圖計算
4．11．1 Pregel圖計算框架的提出
4．11．2 超步
4．11．3 Pregel計算模型
4．11．4 Pregel的C++ API
4．11．5 Pregel體繫結構
4．11．6 容錯性
第5章大數據可視化
5．1 數據可視化定義
5．2 數據可視化發展歷程
5．3 數據可視化的作用
5．4 數據可視化設計步驟
5．5 數據可視化設計要素
5．6 顏色可視化設計
5．6．1 色彩空間
5．6．2 色彩三要素
5．7 數據可視化基本圖形選用
5．8 數據可視化工具
第6章信息檢索
6．1 信息檢索定義
6．2 相關性
6．2．1 布爾模型
6．2．2 排序布爾模型
6．2．3 向量空間模型
6．2．4 語言模型
6．3 及時性
6．4 搜索引擎
6．4．1 網頁鏈接分析法
6．4．2 電子商務中的商品排序
6．4．3 開源搜索引擎
6．5 推薦繫統
6．5．1 何謂推薦繫統
6．5．2 推薦繫統與電商
6．5．3 推薦繫統數據基礎
6．5．4 推薦方法
6．5．5 開源推薦繫統
6．6 互聯網廣告
第7章數據挖掘
7．1 基本概念
7．1．1 數據挖掘的定義
7．1．2 相關技術
7．2 數據來源
7．3 數據表示與預處理
7．4 機器學習算法
7．4．1 關聯分析
7．4．2 分類
7．4．3 回歸分析算法
7．4．4 聚類分析
7．5 數據挖掘工具軟件
第8章效能評估
8．1 效果評估
8．1．1 對信息檢索的評估
8．1．2 對分類的評估
8．1．3 對聚類的評估
8．2 性能評估
附錄 Hadoop編年史
參考文獻

查看全部↓

前言/序言

前言

從20世紀80年代中期開始，我一直在做數據分析工作——最初是做數據庫管理信息繫統的研發工作，接著從事數據建模工作，後來又做數據倉庫繫統研發，以及數據共享與交換平臺構建的工作。從2015年起，我又開始從事行業大數據分析與數據挖掘工作。2017年年底，因為年齡的原因，我不再從事一線的研發工作，轉而扮演技術顧問的角色，並應邀開辦大數據技術講座。出乎意料的是，講座的反響非常熱烈，並陸續接到各種講課的邀請：有科普性質的，也有專業研討性質的；既有二三十人的課堂討論式講座，也有三四百人的禮堂演講式講座，還有聽眾更廣泛的中國電子科技集團內部視頻會議方式的講座。一年來，共開辦了20多場大數據技術專題講座，制作的講課用幻燈片多達600多張。

2018年5月，我的老領導，也是中國電科首席科學家、大數據與人工智能方面的知名專家，看了我的幻燈片後，建議我以此為素材，結合自己多年的工作經驗，寫一本大數據技術方面的專著。在領導和同事們的鼓勵下，從2018年6月份開始，我一頭扎進寫作中，經過4個月的努力，終於完成了初稿。由於是第一次寫書，很多方面沒有經驗，遇到了很多困難。幸得中國電子科技集團公司第二十八研究所C4ISR技術國防科技重點實驗室主任丁峰研究員鼎力相助，他指派王菁博士協助我整理書稿。王菁博士不僅重新繪制了書中的圖、表，補充編寫了邏輯回歸算法，還為每章增加了思考與練習題，並負責書稿出版的所有事務性工作。

目前，國家正在大力倡導和鼓勵大數據技術和產業的發展。但一年多來，通過與關心大數據技術的各個層次人員接觸，我發現在具體承擔技術決策、管理和研發任務的人員中，有些人對大數據技術的實現途徑、能力與限定、關鍵環節的認識不夠透徹，這很容易造成技術決策和方向選擇出現偏差。因此，在編寫本書時，我不僅要通俗易懂地介紹大數據挖掘技術全貌，還要講解技術細節和技術難點，以免把這本書寫成純粹的科普讀物。書中既要有通俗的比喻，也涉及嚴謹的數學公式推導；所參考的書籍既有經典、嚴謹的《數據挖掘概念與技術》和《信息檢索導論》，也有通俗易懂的《世界是隨機的大數據時代的概率統計學》和《圖解機器學習》。這是一項十分艱巨的任務，希望這種嘗試能夠為各個層次的讀者都能帶來幫助。

最後還要感謝我的家人對我的理解和支持，他們免除了我所有的家庭雜務，以使我有充足的時間和精力潛心寫作。

2018年11月於南京

查看全部↓

"

網友評論我們期待著您對此商品發表評論

相關商品

在線留言 商品價格為新臺幣

關於我們送貨時間安全付款會員登入加入會員我的帳戶網站聯盟

DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.