了得網圖書_大數據分析原理與實踐王宏志數據科學與工程技術叢書

	[ 收藏 ] [ 简体中文 ]
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款，4-7個工作日送達，999元臺幣免運費　　　在線留言商品價格為新臺幣

計算機周邊

商品搜索

类别：

关键字：

商品分类

新类目

　管理
　投资理财
　经济
　社会科学

點擊放大圖片

大數據分析原理與實踐王宏志數據科學與工程技術叢書
該商品所屬分類：圖書 -> 機械工業出版社
【市場價】	608-880元
【優惠價】	380-550元
【作者】	王宏志
【出版社】	機械工業出版社
【ISBN】	9787111569435
【折扣說明】	一次購物滿999元台幣免運費+贈品一次購物滿2000元台幣95折+免運費+贈品一次購物滿3000元台幣92折+免運費+贈品一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】	①優質無紡布環保袋，做工棒！②品牌簽字筆 ③品牌手帕紙巾

版本	正版全新電子版PDF檔
您已选择：	正版全新
溫馨提示：如果有多種選項，請先選擇再點擊加入購物車。 . 電子圖書價格是0.69折，例如了得網價格是100元，電子書pdf的價格則是69元。 . 購買電子書不支持貨到付款，購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意，可以聯絡我們退款。謝謝。

內容介紹

字體縮小

字體放大

店鋪：機械工業出版社官方旗艦店

出版社：機械工業出版社

ISBN：9787111569435

商品編碼：10026499532139

品牌：機械工業出版社（CMP）

出版時間：2017-07-01

頁數：200

字數：472000

審圖號：9787111569435

作者：王宏志

　　　　

　　　　

"

商品參數

商品基本信息
商品名稱：	大數據分析原理與實踐
作者：	王宏志
市場價：	79.00
ISBN號：	9787111569435
版次：	1-1
出版日期：	2017-07
頁數：	443
字數：	472
出版社：	機械工業出版社

內容介紹

內容簡介

本書介紹了大數據分析的多種模型、所涉及的算法和技術、實現大數據分析繫統所需的工具以及大數據分析的具體應用。本書共16章。*1章為緒論，就大數據、大數據分析等概念進行了闡釋，並對本書內容進行了概述；*2~7章介紹了關聯分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型；第8章介紹大數據分析的數據預處理問題；第9章介紹降維方法；*10章介紹了數據倉庫的概念、內涵、組成、體繫結構和建立方法，還介紹了分布式數據倉庫繫統和內存數據倉庫繫統。*11章介紹大數據分析算法中的回歸算法、關聯規則挖掘算法、分類算法以及聚類算法的實現。*12~14章介紹了三種用於實現大數據分析算法的平臺，即並行計算平臺、流式計算平臺和大圖分析平臺。*15章和*16章介紹兩類大數據分析的具體應用，分別講述了社會網絡分析和推薦繫統。本書可作為高等院校大數據相關專業的教學用書，也可以作為從事大數據相關工作的工程技術人員的參考用書。

目錄

目錄

目錄
序
前言
教學建議
*1章緒論 1
1.1什麼是大數據 1
1.2哪裡有大數據 3
1.3什麼是大數據分析 4
1.4大數據分析的過程、技術與難點 5
1.5全書概覽 8
小結 10
習題 10
*2章大數據分析模型 11
2.1大數據分析模型建立方法 11
2.2基本統計量 13
2.2.1全表統計量 14
2.2.2皮爾森相關繫數 15
2.3推斷統計 16
2.3.1參數估計 16
2.3.2假設檢驗 20
2.3.3假設檢驗的阿裡雲實現 23
小結 28
習題 28
第3章關聯分析模型 30
3.1回歸分析 31
3.1.1回歸分析概述 31
3.1.2回歸模型的拓展 35
3.1.3回歸的阿裡雲實現 43
3.2關聯規則分析 52
3.3相關分析 54
小結 57
習題 58
第4章分類分析模型 60
4.1分類分析的定義 60
4.2判別分析的原理和方法 61
4.2.1距離判別法 61
4.2.2Fisher判別法 64
4.2.3貝葉斯判別法 67
4.3基於機器學習分類的模型 71
4.3.1支持向量機 72
4.3.2邏輯回歸 74
4.3.3決策樹與回歸樹 75
4.3.4k近鄰 78
4.3.5隨機森林 78
4.3.6樸素貝葉斯 81
4.4分類分析實例 82
4.4.1二分類實例 82
4.4.2多分類實例 94
小結 101
習題 102
第5章聚類分析模型 105
5.1聚類分析的定義 105
5.1.1基於距離的親疏關繫度量 105
5.1.2基於相似繫數的相似性度量 108
5.1.3個體與類以及類間的親疏關繫度量 110
5.1.4變量的選擇與處理 111
5.2聚類分析的分類 111
5.3聚類有效性的評價 112
5.4聚類分析方法概述 112
5.5聚類分析的應用 113
5.6聚類分析的阿裡雲實現 114
小結 119
習題 119
第6章結構分析模型 122
6.1*短路徑 122
6.2鏈接排名 123
6.3結構計數 125
6.4結構聚類 126
6.5社團發現 128
6.5.1社團的定義 128
6.5.2社團的分類 128
6.5.3社團的用途 128
6.5.4社團的數學定義 128
6.5.5基於阿裡雲的社團發現 130
小結 132
習題 133
第7章文本分析模型 135
7.1文本分析模型概述 135
7.2文本分析方法概述 136
7.2.1SplitWord 136
7.2.2詞頻統計 137
7.2.3TF-IDF 138
7.2.4PLDA 140
7.2.5Word2Vec 147
小結 148
習題 149
第8章大數據分析的數據預處理 150
8.1數據抽樣和過濾 150
8.1.1數據抽樣 150
8.1.2數據過濾 154
8.1.3基於阿裡雲的抽樣和過濾實現 154
8.2數據標準化與歸一化 157
8.3數據清洗 159
8.3.1數據質量概述 159
8.3.2缺失值填充 160
8.3.3實體識別與真值發現 162
8.3.4錯誤發現與修復 169
小結 171
習題 171
第9章降維 173
9.1特征工程 173
9.1.1特征工程概述 173
9.1.2特征變換 175
9.1.3特征選擇 178
9.1.4特征重要性評估 183
9.2主成分分析 191
9.2.1什麼是主成分分析 191
9.2.2主成分分析的計算過程 192
9.2.3基於阿裡雲的主成分分析 194
9.2.4主成分的表現度量 195
9.3因子分析 196
9.3.1因子分析概述 196
9.3.2因子分析的主要分析指標 196
9.3.3因子分析的計算方法 197
9.4壓縮感知 203
9.4.1什麼是壓縮感知 203
9.4.2壓縮感知的具體模型 204
9.5面向神經網絡的降維 205
9.5.1面向神經網絡的降維方法概述 205
9.5.2如何利用神經網絡降維 206
9.6基於特征散列的維度縮減 207
9.6.1特征散列方法概述 207
9.6.2特征散列算法 207
9.7基於Lasso算法的降維 208
9.7.1Lasso方法簡介 208
9.7.2Lasso方法 209
9.7.3Lasso算法的適用情景 211
小結 211
習題 212
*10章面向大數據的數據倉庫繫統 214
10.1數據倉庫概述 214
10.1.1數據倉庫的基本概念 214
10.1.2數據倉庫的內涵 215
10.1.3數據倉庫的基本組成 215
10.1.4數據倉庫繫統的體繫結構 216
10.1.5數據倉庫的建立 217
10.2分布式數據倉庫繫統 221
10.2.1基於Hadoop的數據倉庫繫統 221
10.2.2Shark：基於Spark的數據倉庫繫統 227
10.2.3Mesa 228
10.3內存數據倉庫繫統 231
10.3.1SAP HANA 231
10.3.2HyPer 234
10.4阿裡雲數據倉庫簡介 236
小結 238
習題 239
*11章大數據分析算法 240
11.1大數據分析算法概述 240
11.2回歸算法 242
11.3關聯規則挖掘算法 248
11.4分類算法 255
11.4.1二分類算法 256
11.4.2多分類算法 273
11.5聚類算法 283
11.5.1k-means算法 283
11.5.2CLARANS算法 291
小結 293
習題 293
*12章大數據計算平臺 295
12.1Spark 295
12.1.1Spark簡介 295
12.1.2基於Spark的大數據分析實例 296
12.2Hyracks 299
12.2.1Hyracks簡介 299
12.2.2基於Hyracks的大數據分析實例 299
12.3DPark

"

網友評論我們期待著您對此商品發表評論

相關商品

在線留言 商品價格為新臺幣

關於我們送貨時間安全付款會員登入加入會員我的帳戶網站聯盟

DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.