[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

  •  文化

  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

     保健/养生
     体育/运动
     手工/DIY
     休闲/爱好
     英文原版书
     港台图书
     研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学
  • 大數據采集與處理
    該商品所屬分類:計算機/網絡 -> 數據庫
    【市場價】
    1412-2048
    【優惠價】
    883-1280
    【作者】 張雪萍 
    【所屬類別】 圖書  計算機/網絡  數據庫  數據庫理論 
    【出版社】電子工業出版社 
    【ISBN】9787121420115
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:128開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787121420115
    叢書名:大數據及人工智能產教融合繫列叢書

    作者:張雪萍
    出版社:電子工業出版社
    出版時間:2021年09月 


        
        
    "

    產品特色

    內容簡介

    本書是一本專門論述大數據采集與處理相關技術及應用的著作,也是一線研發工程師的實戰經驗結晶。本書依次介紹了大數據采集、大數據預處理、大數據存儲與計算、大數據安全等相關內容,並結合大數據應用各行業背景,介紹了電商、煤炭、教育、醫療、電信、交通等行業的大數據采集與處理。後,本書以某電商網站數據分析為背景,介紹一個完整的數據采集、清洗、處理的離線數據分析案例,以期給讀者展示一個繫統的實踐操作過程。與本書所述技術相關的論著較少,所著內容新穎、繫統全面、實踐指導性強。

    作者簡介

    張雪萍,博士,教授,*新世紀優秀人纔,河南省高校科技創新人纔,河南省教育廳學術技術帶頭人。長期從事計算機科學與技術、地理信息繫統領域的的教學與科研工作,主要研究興趣包括空間數據挖掘與信息共享、數據庫版權保護、軟件測試、大數據與人工智能技術及應用等。近年來完成國家"八五”、"十五”科技攻關、"十一五”科技支撐計劃、*新世紀優秀人纔支持計劃等20餘項科研項目,其中獲地廳級科學技術進步一等獎4項、二等獎3項、三等獎1項;在LNAI、LNCS等國內外重要學術期刊上發表論文60餘篇,其中被EI收錄30餘篇;出版學術著作6部,其中獲河南省信息技術優秀一等獎1項,二等獎1項。

    目錄
    第1章 大數據基礎 1
    1.1 大數據概念及特征 1
    1.2 大數據采集與處理基本流程 2
    1.2.1 大數據采集 3
    1.2.2 大數據預處理 3
    1.2.3 大數據處理 4
    1.3 大數據分析 5
    1.4 大數據應用 6
    1.4.1 大數據應用行業分類 6
    1.4.2 大數據分析在商業上的應用 7
    習題 9
    參考文獻 9
    第2章 開源Hadoop 10
    2.1 Hadoop概述 10

    第1章 大數據基礎 1
    1.1 大數據概念及特征 1
    1.2 大數據采集與處理基本流程 2
    1.2.1 大數據采集 3
    1.2.2 大數據預處理 3
    1.2.3 大數據處理 4
    1.3 大數據分析 5
    1.4 大數據應用 6
    1.4.1 大數據應用行業分類 6
    1.4.2 大數據分析在商業上的應用 7
    習題 9
    參考文獻 9
    第2章 開源Hadoop 10
    2.1 Hadoop概述 10
    2.1.1 Hadoop簡介 10
    2.1.2 Hadoop起源及發展史 11
    2.1.3 Hadoop發行版本 12
    2.1.4 Hadoop特性 13
    2.2 Hadoop生態繫統 13
    2.2.1 HDFS 14
    2.2.2 MapReduce 15
    2.2.3 Hive 15
    2.2.4 ZooKeeper 16
    2.2.5 Flume 17
    2.2.6 Kafka 17
    2.2.7 Spark 18
    2.2.8 Storm 19
    2.2.9 Flink 20
    2.2.10 YARN 20
    2.3 Hadoop的安裝與使用 21
    2.3.1 環境準備 22
    2.3.2 單機模式 24
    2.3.3 偽分布式 25
    2.3.4 完全分布式安裝 38
    習題 44
    參考文獻 45
    第3章 大數據采集 46
    3.1 數據采集與大數據采集 46
    3.1.1 數據采集 47
    3.1.2 大數據采集及數據來源 47
    3.1.3 傳統數據采集與大數據采集的區別 48
    3.1.4 大數據采集分類 48
    3.2 大數據采集方法 49
    3.2.1 數據庫采集 50
    3.2.2 繫統日志采集 50
    3.2.3 網絡數據采集 51
    3.2.4 傳感器采集 51
    3.2.5 眾包采集 51
    3.3 常用采集工具及平臺 52
    3.3.1 Flume 52
    3.3.2 Fluentd 53
    3.3.3 Logstash 55
    3.3.4 Chukwa 56
    3.3.5 Scribe 57
    3.3.6 Splunk 58
    3.3.7 Scrapy 59
    3.4 網絡爬蟲 61
    3.4.1 網絡爬蟲分類 61
    3.4.2 網絡爬蟲發展現狀 62
    3.4.3 網絡爬蟲使用技術 63
    3.5 實戰 64
    3.5.1 項目準備 64
    3.5.2 架構設計 65
    3.5.3 代碼實現 66
    3.5.4 結果展示 73
    習題 78
    參考文獻 78
    第4章 日志采集 79
    4.1 日志采集概述 79
    4.1.1 繫統日志分類 79
    4.1.2 日志分析繫統架構及日志采集方式 80
    4.1.3 日志采集應用場景與日志分析應用場景 81
    4.1.4 日志采集繫統關鍵技術 82
    4.2 Scribe 83
    4.2.1 Scribe概述 83
    4.2.2 Scribe全局配置 83
    4.2.3 Scribe的存儲類型配置 84
    4.3 Chukwa 88
    4.3.1 Chukwa概述 88
    4.3.2 Chukwa架構 88
    4.3.3 Chukwa數據收集應用 89
    4.4 Kafka 90
    4.4.1 Kafka概述 90
    4.4.2 Kafka架構 91
    4.4.3 Kafka日志采集 93
    4.5 Flume 94
    4.5.1 Flume概述 94
    4.5.2 Flume架構 95
    4.5.3 Flume的優勢 95
    4.6 實戰 95
    4.6.1 Flume安裝部署 96
    4.6.2 環境測試 98
    4.6.3 采集目錄到HDFS 99
    4.6.4 采集文件到HDFS 100
    習題 101
    參考文獻 101
    第5章 大數據預處理 102
    5.1 為什麼要進行數據預處理 102
    5.2 大數據預處理總體架構 104
    5.3 大數據預處理方法 105
    5.3.1 數據清洗 105
    5.3.2 數據集成 108
    5.3.3 數據轉換 109
    5.3.4 數據消減 110
    5.4 ETL工具Kettle 116
    5.4.1 ETL介紹 116
    5.4.2 Kettle介紹 119
    5.4.3 Kettle安裝與配置 142
    5.5 實戰 151
    5.5.1 基於Python的數據預處理 151
    5.5.2 基於Hadoop生態圈的Kettle應用 155
    習題 179
    參考文獻 180
    第6章 大數據存儲 182
    6.1 大數據存儲概述 183
    6.1.1 大數據存儲面臨的問題 183
    6.1.2 大數據存儲方式 184
    6.1.3 大數據存儲技術路線 184
    6.2 HDFS 185
    6.2.1 HDFS架構 186
    6.2.2 HDFS存儲機制 187
    6.2.3 NameNode和DataNode工作機制 190
    6.3 NoSQL 193
    6.3.1 NoSQL數據庫概述 193
    6.3.2 HBase 198
    6.3.3 MongoDB 206
    6.3.4 Redis 214
    6.4 ElasticSearch 220
    6.4.1 ElasticSearch概述 220
    6.4.2 ElasticSearch基本概念 221
    6.4.3 ElasticSearch工作原理 223
    6.4.4 ElasticSearch存儲機制 224
    6.4.5 ElasticSearch分布式存儲 226
    6.4.6 ElasticSearch安裝與運行 229
    6.5 實戰 231
    6.5.1 主從模式搭建 231
    6.5.2 Sentinel模式搭建 235
    6.5.3 Cluster模式搭建 238
    習題 245
    參考文獻 245
    第7章 MapReduce 246
    7.1 概述 246
    7.2 MapReduce計算框架 247
    7.2.1 MapReduce模型 247
    7.2.2 MapReduce函數 249
    7.2.3 MapReduce資源管理 250
    7.2.4 MapReduce生命周期管理 251
    7.3 MapReduce工作流程及原理 253
    7.3.1 MapReduce工作流程 253
    7.3.2 MapReduce工作原理 254
    7.4 深入Shuffle過程 255
    7.4.1 Map端Shuffle 256
    7.4.2 Reduce端Shuffle 260
    7.5 實戰 262
    7.5.1 任務準備 262
    7.5.2 編寫Map程序 262
    7.5.3 編寫Reduce 程序 263
    7.5.4 編寫main函數 265
    7.5.5 核心代碼包 265
    7.5.6 運行代碼 266
    習題 266
    參考文獻 267
    第8章 Hive數據倉庫 268
    8.1 數據倉庫簡介 269
    8.1.1 數據倉庫概念 269
    8.1.2 數據倉庫的結構 269
    8.1.3 傳統數據倉庫的問題 271
    8.1.4 數據倉庫的發展 271
    8.2 Hive 272
    8.2.1 Hive簡介 272
    8.2.2 Hive與傳統數據庫的對比 273
    8.2.3 Hive繫統架構 275
    8.2.4 Hive體繫結構 276
    8.2.5 Hive工作原理 277
    8.2.6 Hive的數據模型 283
    8.2.7 Hive基本操作 284
    8.3 Impala 288
    8.3.1 Impala簡介 288
    8.3.2 Impala架構 290
    8.3.3 Impala執行過程 292
    8.3.4 Impala與Hive比較 294
    8.3.5 Impala基本操作 294
    8.4 Spark SQL 296
    8.4.1 Spark SQL簡介 296
    8.4.2 Spark SQL繫統架構 297
    8.4.3 HiveContext和SQLContext的運行過程 298
    8.4.4 Shark和Spark SQL 299
    8.4.5 Spark SQL基本操作 303
    8.5 案例 305
    8.5.1 大數據倉庫設計案例 305
    8.5.2 YouTuBe項目實戰 307
    習題 318
    參考文獻 318
    第9章 流計算 319
    9.1 流計算簡介 319
    9.1.1 流計算的概念及特點 320
    9.1.2 流計算的適用範圍與應用場景 321
    9.2 Spark Streaming 321
    9.2.1 Spark Streaming 概述 321
    9.2.2 Spark Streaming基本原理 322
    9.2.3 Spark Streaming 運行架構 322
    9.2.4 實戰 323
    9.3 Storm 325
    9.3.1 Storm概述 326
    9.3.2 Storm基礎架構 326
    9.3.3 Storm運行流程 327
    9.3.4 實戰 328
    9.4 Flink 332
    9.4.1 Flink概述 333
    9.4.2 Flink運行架構 335
    9.4.3 實戰 336
    9.5 案例 341
    9.5.1 任務目標 341
    9.5.2 實驗環境 341
    9.5.3 數據準備 341
    9.5.4 業務(任務)實現 344
    9.5.5 結果展示 350
    習題 351
    參考文獻 351
    第10章 Pregel圖計算 352
    10.1 Pregel圖計算簡介 353
    10.1.1 圖結構數據 353
    10.1.2 傳統圖計算解決方案的不足 353
    10.1.3 圖計算通用軟件 353
    10.1.4 Pregel簡介 354
    10.2 Pregel圖計算模型 355
    10.2.1 有向圖和頂點 355
    10.2.2 頂點之間的消息傳遞 355
    10.2.3 Pregel計算過程 356
    10.3 Pregel工作原理 358
    10.3.1 Pregel的C API 358
    10.3.2 消息傳遞機制和Combiner 358
    10.3.3 Aggregator機制 359
    10.3.4 拓撲改變 360
    10.3.5 輸入和輸出 360
    10.4 Pregel體繫結構 360
    10.4.1 Pregel的執行過程 360
    10.4.2 容錯性 362
    10.4.3 Worker 363
    10.4.4 Master 363
    10.4.5 Aggregator 364
    10.5 Pregel應用實例 365
    10.5.1 單源短路徑 365
    10.5.2 PageRank算法實現及比較 367
    10.6 Hama 371
    10.6.1 Hama介紹 371
    10.6.2 Hama體繫結構 371
    10.6.3 Hama實現PageRank算法 372
    習題 374
    參考文獻 374
    第11章 大數據安全技術及應用 375
    11.1 大數據安全概述 376
    11.2 大數據安全威脅形式 376
    11.2.1 大數據基礎設施安全威脅 376
    11.2.2 大數據生命周期安全威脅 377
    11.2.3 大數據隱私安全威脅 379
    11.3 大數據安全關鍵路徑 380
    11.3.1 大數據性能安全保障 380
    11.3.2 大數據安全關鍵技術 387
    11.4 大數據安全管理及應用 391
    11.4.1 大數據安全管理 392
    11.4.2 大數據安全應用 394
    11.5 大數據安全案例分析 398
    11.5.1 安全性能案例——如何自行搭建大數據計算平臺 398
    11.5.2 生命周期安全分析案例——大數據內網的硬件漏洞安全分析 400
    習題 403
    參考文獻 403
    第12章 行業大數據采集與處理 404
    12.1 電商大數據采集與處理 404
    12.1.1 電商行業大數據概述 404
    12.1.2 大數據采集與處理 404
    12.1.3 某電商網站完整離線數據分析案例 410
    12.2 煤炭大數據采集與處理 423
    12.2.1 煤炭行業大數據概述 423
    12.2.2 煤炭行業大數據采集與處理 424
    12.2.3 煤炭行業大數據平臺案例 425
    12.3 教育大數據采集與處理 432
    12.3.1 總體技術架構 432
    12.3.2 Hadoop與Spark集成平臺 433
    12.3.3 數據采集方案設計 434
    12.3.4 數據清洗方案設計 435
    12.3.5 數據存儲方案設計 436
    12.3.6 學生學業預警繫統需求分析 437
    12.3.7 繫統體繫結構設計 438
    12.4 醫療大數據采集與處理 439
    12.4.1 醫療大數據概述 439
    12.4.2 醫療行業大數據采集與處理 441
    12.4.3 醫療大數據采1



     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部