| | | 大數據分析原理與實踐 王宏志 數據科學與工程技術叢書 | 該商品所屬分類:圖書 -> 機械工業出版社 | 【市場價】 | 608-880元 | 【優惠價】 | 380-550元 | 【作者】 | 王宏志 | 【出版社】 | 機械工業出版社 | 【ISBN】 | 9787111569435 | 【折扣說明】 | 一次購物滿999元台幣免運費+贈品 一次購物滿2000元台幣95折+免運費+贈品 一次購物滿3000元台幣92折+免運費+贈品 一次購物滿4000元台幣88折+免運費+贈品
| 【本期贈品】 | ①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
| |
版本 | 正版全新電子版PDF檔 | 您已选择: | 正版全新 | 溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。 *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。 | | | | 內容介紹 | |
![](/c49/99/10026499532139.jpg)
店鋪:機械工業出版社官方旗艦店 出版社:機械工業出版社 ISBN:9787111569435 商品編碼:10026499532139 品牌:機械工業出版社(CMP) 出版時間:2017-07-01 頁數:200 字數:472000 審圖號:9787111569435 作者:王宏志
"![baecf198635367d9.jpg](https://img10.360buyimg.com/cms/jfs/t1/180445/28/6295/377762/60b0bd82E6c4ef32e/baecf198635367d9.jpg) 商品參數 商品基本信息 | 商品名稱: | 大數據分析原理與實踐 | 作者: | 王宏志 | 市場價: | 79.00 | ISBN號: | 9787111569435 | 版次: | 1-1 | 出版日期: | 2017-07 | 頁數: | 443 | 字數: | 472 | 出版社: | 機械工業出版社 | 內容介紹 內容簡介 | 本書介紹了大數據分析的多種模型、所涉及的算法和技術、實現大數據分析繫統所需的工具以及大數據分析的具體應用。本書共16章。*1章為緒論,就大數據、大數據分析等概念進行了闡釋,並對本書內容進行了概述;*2~7章介紹了關聯分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型;第8章介紹大數據分析的數據預處理問題;第9章介紹降維方法;*10章介紹了數據倉庫的概念、內涵、組成、體繫結構和建立方法,還介紹了分布式數據倉庫繫統和內存數據倉庫繫統。*11章介紹大數據分析算法中的回歸算法、關聯規則挖掘算法、分類算法以及聚類算法的實現。*12~14章介紹了三種用於實現大數據分析算法的平臺,即並行計算平臺、流式計算平臺和大圖分析平臺。*15章和*16章介紹兩類大數據分析的具體應用,分別講述了社會網絡分析和推薦繫統。本書可作為高等院校大數據相關專業的教學用書,也可以作為從事大數據相關工作的工程技術人員的參考用書。 | 目錄 目錄 | 目錄 序 前言 教學建議 *1章緒論 1 1.1什麼是大數據 1 1.2哪裡有大數據 3 1.3什麼是大數據分析 4 1.4大數據分析的過程、技術與難點 5 1.5全書概覽 8 小結 10 習題 10 *2章大數據分析模型 11 2.1大數據分析模型建立方法 11 2.2基本統計量 13 2.2.1全表統計量 14 2.2.2皮爾森相關繫數 15 2.3推斷統計 16 2.3.1參數估計 16 2.3.2假設檢驗 20 2.3.3假設檢驗的阿裡雲實現 23 小結 28 習題 28 第3章關聯分析模型 30 3.1回歸分析 31 3.1.1回歸分析概述 31 3.1.2回歸模型的拓展 35 3.1.3回歸的阿裡雲實現 43 3.2關聯規則分析 52 3.3相關分析 54 小結 57 習題 58 第4章分類分析模型 60 4.1分類分析的定義 60 4.2判別分析的原理和方法 61 4.2.1距離判別法 61 4.2.2Fisher判別法 64 4.2.3貝葉斯判別法 67 4.3基於機器學習分類的模型 71 4.3.1支持向量機 72 4.3.2邏輯回歸 74 4.3.3決策樹與回歸樹 75 4.3.4k近鄰 78 4.3.5隨機森林 78 4.3.6樸素貝葉斯 81 4.4分類分析實例 82 4.4.1二分類實例 82 4.4.2多分類實例 94 小結 101 習題 102 第5章聚類分析模型 105 5.1聚類分析的定義 105 5.1.1基於距離的親疏關繫度量 105 5.1.2基於相似繫數的相似性度量 108 5.1.3個體與類以及類間的親疏關繫度量 110 5.1.4變量的選擇與處理 111 5.2聚類分析的分類 111 5.3聚類有效性的評價 112 5.4聚類分析方法概述 112 5.5聚類分析的應用 113 5.6聚類分析的阿裡雲實現 114 小結 119 習題 119 第6章結構分析模型 122 6.1*短路徑 122 6.2鏈接排名 123 6.3結構計數 125 6.4結構聚類 126 6.5社團發現 128 6.5.1社團的定義 128 6.5.2社團的分類 128 6.5.3社團的用途 128 6.5.4社團的數學定義 128 6.5.5基於阿裡雲的社團發現 130 小結 132 習題 133 第7章文本分析模型 135 7.1文本分析模型概述 135 7.2文本分析方法概述 136 7.2.1SplitWord 136 7.2.2詞頻統計 137 7.2.3TF-IDF 138 7.2.4PLDA 140 7.2.5Word2Vec 147 小結 148 習題 149 第8章大數據分析的數據預處理 150 8.1數據抽樣和過濾 150 8.1.1數據抽樣 150 8.1.2數據過濾 154 8.1.3基於阿裡雲的抽樣和過濾實現 154 8.2數據標準化與歸一化 157 8.3數據清洗 159 8.3.1數據質量概述 159 8.3.2缺失值填充 160 8.3.3實體識別與真值發現 162 8.3.4錯誤發現與修復 169 小結 171 習題 171 第9章降維 173 9.1特征工程 173 9.1.1特征工程概述 173 9.1.2特征變換 175 9.1.3特征選擇 178 9.1.4特征重要性評估 183 9.2主成分分析 191 9.2.1什麼是主成分分析 191 9.2.2主成分分析的計算過程 192 9.2.3基於阿裡雲的主成分分析 194 9.2.4主成分的表現度量 195 9.3因子分析 196 9.3.1因子分析概述 196 9.3.2因子分析的主要分析指標 196 9.3.3因子分析的計算方法 197 9.4壓縮感知 203 9.4.1什麼是壓縮感知 203 9.4.2壓縮感知的具體模型 204 9.5面向神經網絡的降維 205 9.5.1面向神經網絡的降維方法概述 205 9.5.2如何利用神經網絡降維 206 9.6基於特征散列的維度縮減 207 9.6.1特征散列方法概述 207 9.6.2特征散列算法 207 9.7基於Lasso算法的降維 208 9.7.1Lasso方法簡介 208 9.7.2Lasso方法 209 9.7.3Lasso算法的適用情景 211 小結 211 習題 212 *10章面向大數據的數據倉庫繫統 214 10.1數據倉庫概述 214 10.1.1數據倉庫的基本概念 214 10.1.2數據倉庫的內涵 215 10.1.3數據倉庫的基本組成 215 10.1.4數據倉庫繫統的體繫結構 216 10.1.5數據倉庫的建立 217 10.2分布式數據倉庫繫統 221 10.2.1基於Hadoop的數據倉庫繫統 221 10.2.2Shark:基於Spark的數據倉庫繫統 227 10.2.3Mesa 228 10.3內存數據倉庫繫統 231 10.3.1SAP HANA 231 10.3.2HyPer 234 10.4阿裡雲數據倉庫簡介 236 小結 238 習題 239 *11章大數據分析算法 240 11.1大數據分析算法概述 240 11.2回歸算法 242 11.3關聯規則挖掘算法 248 11.4分類算法 255 11.4.1二分類算法 256 11.4.2多分類算法 273 11.5聚類算法 283 11.5.1k-means算法 283 11.5.2CLARANS算法 291 小結 293 習題 293 *12章大數據計算平臺 295 12.1Spark 295 12.1.1Spark簡介 295 12.1.2基於Spark的大數據分析實例 296 12.2Hyracks 299 12.2.1Hyracks簡介 299 12.2.2基於Hyracks的大數據分析實例 299 12.3DPark
|
" | | | | | |