[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 大數據:規劃、實施、運維
    該商品所屬分類:計算機/網絡 -> 數據庫
    【市場價】
    486-704
    【優惠價】
    304-440
    【作者】 謝朝陽 
    【所屬類別】 圖書  計算機/網絡  數據庫  數據庫理論 
    【出版社】電子工業出版社 
    【ISBN】9787121339523
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787121339523
    作者:謝朝陽

    出版社:電子工業出版社
    出版時間:2018年05月 

        
        
    "

    編輯推薦
    展現作者在國內外大數據*線的實戰經驗,面向不同行業的共性訴求來指導讀者大數據該怎麼做,並闡明大數據發展的誤區。本書對大數據,從經濟價值、商業模式、框架搭建、數據挖掘、網絡布置、安全防護、人員能力和後續運維管理多個維度,以及基礎設施、中間件、重點應用等多個層面進行繫統闡述。 
    內容簡介
    你是不是有這樣的困惑:“讀了不少關於大數據的書,發現這大數據既可以用於競選美國總統,又能夠預測禽流感,還能賣啤酒和尿不濕,又是圍棋高手……大數據好像什麼都能干耶!可是咋整呀?大數據多大為大呀?大數據能賺錢不?……唉,怎麼還是一頭霧水。”本書將為你答疑解惑。本書將展現作者在國內外大數據*線的實戰經驗,面向不同行業的共性訴求來指導讀者大數據該怎麼做,並闡明大數據發展的誤區。本書對大數據,從經濟價值、商業模式、框架搭建、數據挖掘、網絡布置、安全防護、人員能力和後續運維管理多個維度,以及基礎設施、中間件、重點應用等多個層面進行繫統闡述。幫助決策者將大數據概念落地,建立起理性的預期、合理的規劃,並*終收獲滿意的經濟效益。企業正面臨從傳統IT轉入大數據環境這一不可避免的範式變化,恰好為我國追趕發達國家信息化建設帶來了契機。本書以企業共同關注的客戶關繫管理(CRM)為實例談大數據落地,利用大數據采集、分析、決策以達到客戶維繫拓展、精準營銷和創新產品的目的,提出一整套從規劃到實施再到後續運維的技術路線和策略。並用一個已上線的實例將各部分內容串起來綜合展示,以解決大數據熱潮中的“老虎喫天,無處下爪”的窘境。這對於大數據的正確理解,企業信息繫統的建立,以及相應的商業模式改變都具有實際指導意義。
    作者簡介
    謝朝陽,美國弗吉尼亞理工學院暨州立大學博士,中組部“千人計劃”特聘專家。於美國硅谷工作20餘載,歷任Sun、Intel、Sony等公司研發和技術管理高級職務,履歷涵蓋了信息技術領域內的產品研發、工程實踐、市場推廣等多個環節。曾任中國數據中心聯盟雲計算專家委員會主任委員,運營專家委員會主任委員,大數據專家委員會副主任委員,領導組建了中國電信雲計算公司並擔任首任總經理。現任中國電子科技集團大數據首席專家,上海華東電腦CTO及上海華訊網絡繫統有限公司董事、高級副總裁,兼任國家數字化學習工程實驗室特聘教授。著有本書的姊妹篇《雲計算:規劃、實施、運維》。
    目錄
    第1篇 大數據導論1
    第1章 初識大數據5
    1.1 大數據概念談7
    1.1.1 大數據的定義7
    1.1.2 大數據發展現狀10
    1.1.3 大數據建設需求分析10
    1.1.4 大數據建設目標11
    1.1.5 機器學習與人工智能11
    1.2 大數據的科學性12
    1.3 客戶關繫管理18
    1.4 大數據的理解誤區21
    1.5 小結29
    第2章 大數據產業鏈初探30
    2.1 現金流與產業模式31第1篇 大數據導論1
    第1章 初識大數據5
    1.1 大數據概念談7
    1.1.1 大數據的定義7
    1.1.2 大數據發展現狀10
    1.1.3 大數據建設需求分析10
    1.1.4 大數據建設目標11
    1.1.5 機器學習與人工智能11
    1.2 大數據的科學性12
    1.3 客戶關繫管理18
    1.4 大數據的理解誤區21
    1.5 小結29
    第2章 大數據產業鏈初探30
    2.1 現金流與產業模式31
    2.2 國外IT企業33
    2.3 國內IT企業35
    2.4 開源軟件36
    2.5 小微企業39
    2.6 政策制定者41
    2.7 小結43
    第2篇 規劃篇44
    第3章 大數據體繫規劃47
    3.1 大數據技術體繫48
    3.1.1 大數據采集與預處理49
    3.1.2 大數據存儲52
    3.1.3 大數據計算56
    3.1.4 大數據分析58
    3.1.5 大數據治理64
    3.1.6 大數據安全保障68
    3.1.7 大數據應用支撐73
    3.2 大數據共性技術重點課題76
    3.2.1 開放域數據采集與共享76
    3.2.2 多源異構數據分析技術78
    3.2.3 異構計算模式集成技術82
    3.2.4 數據安全與隱私保護86
    3.3 大數據風險管控90
    3.3.1 企業大數據建設風險分析90
    3.3.2 大數據安全標準體繫框架90
    3.3.3 大數據安全標準規劃91
    3.4 小結94
    第4章 大數據技術要求95
    4.1 大數據總體架構98
    4.1.1 背景概述98
    4.1.2 現狀分析98
    4.1.3 總體目標99
    4.1.4 技術架構100
    4.1.5 實施指引102
    4.2 采集要求104
    4.2.1 功能架構104
    4.2.2 技術架構105
    4.2.3 處理技術106
    4.2.4 場景應用111
    4.2.5 接口協議113
    4.2.6 接口約定113
    4.2.7 性能指標116
    4.3 基礎能力要求117
    4.3.1 總體概述117
    4.3.2 基礎框架119
    4.3.3 能力開放135
    4.3.4 性能指標141
    4.4 核心處理能力要求142
    4.4.1 總體概述142
    4.4.2 數據模型149
    4.4.3 數據處理152
    4.4.4 數據質量155
    4.4.5 繫統性能158
    4.5 需求與項目管理160
    4.6 小結161
    第3篇 實施篇163
    第5章 大數據並行計算框架166
    5.1 並行計算技術167
    5.1.1 基本命題167
    5.1.2 設計模式分類170
    5.1.3 關鍵技術點173
    5.2 MapReduce計算技術177
    5.2.1 處理模型設計原則177
    5.2.2 主要功能與技術設計178
    5.3 Hadoop MapReduce設計與工作模式181
    5.3.1 程序執行模式181
    5.3.2 作業調度模式183
    5.3.3 執行框架及流程設計186
    5.4 Hadoop MapReduce組件接口187
    5.4.1 InputFormat187
    5.4.2 InputSplit188
    5.4.3 RecordReader189
    5.4.4 Mapper190
    5.4.5 Combiner192
    5.4.6 Partitioner193
    5.5 小結193
    第6章 大數據分布式處理繫統194
    6.1 Hadoop繫統平臺195
    6.1.1 分布式結構設計195
    6.1.2 Hadoop生態繫統196
    6.2 HDFS分布式文件繫統200
    6.2.1 繫統架構200
    6.2.2 可靠性設計203
    6.2.3 文件存儲組織205
    6.2.4 數據讀寫過程207
    6.2.5 文件繫統操作209
    6.3 HBase分布式數據庫211
    6.3.1 技術特點211
    6.3.2 繫統結構設計212
    6.3.3 數據存儲模型213
    6.3.4 查詢模式215
    6.3.5 數據表設計217
    6.3.6 RegionServer配置218
    6.4 小結222
    第7章 大數據存儲223
    7.1 磁盤陣列技術224
    7.2 數據存儲接口225
    7.2.1 對像存儲225
    7.2.2 裸設備存儲226
    7.2.3 塊存儲227
    7.3 存儲集群架構228
    7.3.1 共享與非共享型228
    7.3.2 對稱與非對稱式229
    7.3.3 自助式與服務式230
    7.3.4 SPI與SFI231
    7.3.5 串行方式與並行方式232
    7.4 數據存儲技術本質233
    7.4.1 三網統一理論234
    7.4.2 並行概念理解236
    7.4.3 集群分層架構238
    7.5 數據分級存儲探討238
    7.5.1 超融合238
    7.5.2 冷數據239
    7.5.3 平臺架構241
    7.5.4 應用場景248
    7.6 小結249
    第8章 機器學習與人工智能250
    8.1 數據挖掘251
    8.1.1 數據分類采集253
    8.1.2 模式類型設計258
    8.1.3 模式價值分析261
    8.1.4 繫統關鍵技術262
    8.2 機器學習264
    8.2.1 算法分類265
    8.2.2 合適算法選擇265
    8.2.3 程序開發設計266
    8.3 人工智能267
    8.3.1 模式定義268
    8.3.2 人工智能舉例269
    8.4 小結276
    第4篇 運維篇277
    第9章 大數據集群網絡架構280
    9.1 現有數據中心網絡架構281
    9.1.1 架構分析281
    9.1.2 存在弊端281
    9.2 大數據網絡設計要點283
    9.2.1 大數據業務分析283
    9.2.2 大數據網絡流量模型284
    9.2.3 大數據網絡新需求286
    9.3 新興網絡技術287
    9.3.1 SDN287
    9.3.2 NFV291
    9.3.3 VXLAN292
    9.3.4 InfiniBand295
    9.4 小結297
    第10章 大數據安全298
    10.1 大數據安全挑戰299
    10.2 基礎設施安全300
    10.2.1 存在威脅300
    10.2.2 虛擬化安全301
    10.3 數據安全302
    10.3.1 數據采集安全技術302
    10.3.2 數據存儲安全技術303
    10.3.3 數據挖掘安全技術307
    10.3.4 數據發布安全技術309
    10.4 大數據平臺Hadoop安全311
    10.4.1 Hadoop安全問題概述311
    10.4.2 Kerberos概述313
    10.4.3 Kerberos認證過程313
    10.4.4 Hadoop安全機制314
    10.4.5 Kerberos的優缺點316
    10.5 小結317
    第11章 大數據備份與恢復318
    11.1 數據備份與恢復319
    11.1.1 數據備份319
    11.1.2 數據恢復323
    11.2 分布式存儲繫統備份與恢復324
    11.2.1 概述324
    11.2.2 HDFS數據備份策略328
    11.3 小結330
    第12章 大數據環境的監管331
    12.1 概述332
    12.2 大數據集群配置管理333
    12.3 大數據集群監控337
    12.3.1 大數據監控特點337
    12.3.2 監控繫統338
    12.3.3 監控繫統建立途徑341
    12.3.4 商業監控軟件342
    12.3.5 開源監控軟件343
    12.3.6 傳統網絡管理軟件:NetEagle352
    12.3.7 統一管理平臺:UMP354
    12.4 大數據日志分析356
    12.5 小結359
    第13章 大數據的運維方法361
    13.1 運維服務362
    13.2 運維流程模型363
    13.2.1 故障排查363
    13.2.2 緊急事故管理366
    13.2.3 處理連鎖故障368
    13.3 運維人員371
    13.3.1 需要具備的能力371
    13.3.2 任務內容372
    13.4 自動化運維374
    13.4.1 自動化運維價值374
    13.4.2 自動化運維工具376
    13.5 小結379
    第5篇 實例篇380
    第14章 Oracle MoviePlex 大數據規劃383
    14.1 案例概述384
    14.1.1 案例背景386
    14.1.2 架構規劃387
    14.2 大數據組件介紹395
    14.2.1 Cloudera的CDH396
    14.2.2 Cloudera管理器397
    14.2.3 Oracle大數據連接器398
    14.2.4 Oracle大數據加載器398
    14.2.5 Oracle大數據整合器400
    14.2.6 Oracle R語言連接器400
    14.2.7 Oracle NoSQL數據庫401
    14.3 小結402
    第15章 Oracle MoviePlex大數據實施404
    15.1 環境準備405
    15.1.1 MoviePlex環境部署405
    15.1.2 MoviePlex環境初始化409
    15.2 案例演示413
    15.2.1 配置Oracle Big Data SQL413
    15.2.2 建立存放在HDFS日志表414
    15.2.3 HIVE訪問HDFS和NoSQL416
    15.2.4 Oracle Big Data SQL新功能418
    15.2.5 Oracle Big Data安全策略420
    15.2.6 Oracle分析SQL422
    15.2.7 Oracle SQL模式匹配423
    15.2.8 創建彙總數據集425
    15.2.9 Oracle 12c SQL解析特點426
    15.3 推薦繫統428
    15.3.1 大獎賽428
    15.3.2 技術細節429
    15.4 小結433
    第16章 Oracle MoviePlex大數據運維434
    16.1 集群436
    16.1.1 Hadoop436
    16.1.2 ZooKeeper439
    16.2 文件繫統和非關繫數據庫442
    16.2.1 HDFS443
    16.2.2 HBase444
    16.2.3 NoSQL446
    16.2.4 Kafka449
    16.3 中間件451
    16.3.1 WebLogic451
    16.3.2 HUE454
    16.3.3 Solr456
    16.4 數據轉換458
    16.4.1 Hive458
    16.4.2 Impala460
    16.4.3 Sqoop2462
    16.5 資源整合調度463
    16.5.1 Oozie463
    16.5.2 YARN464
    16.6 小結467
    第6篇 明天的大數據468
    第17章 大數據面臨的挑戰470
    17.1 可靠性挑戰472
    17.2 可擴展性挑戰473
    17.3 繫統安全挑戰473
    17.4 節能降耗475
    17.5 算法挑戰477
    17.6 測不準原理477
    17.7 小結478
    第18章 大數據應用479
    18.1 客戶關繫與供求管理480
    18.2 科學研究483
    18.3 教育大數據應用485
    18.4 區塊鏈與加密貨幣490
    18.5 小結493
    結束語494
    附錄A 安裝Cloudera Apache Hadoop502
    A.1 環境準備504
    A.1.1 Cloudera Manager架構504
    A.1.2 服務器環境準備504
    A.1.3 安裝介質下載505
    A.1.4 本地yum源搭建505
    A.2 安裝Cloudera Manager Server506
    A.3 部署Hadoop集群507
    A.4 安裝結果508
    附錄B 在Matlab中應用 MapReduce509
    B.1 datastore簡介510
    B.2 搜尋需要的項511
    B.3 MapReduce簡介512
    B.4 如何運用MapReduce進行運算512
    B.5 MapReduce中對於鍵的使用514
    B.6 使用mapreduce計算分組指標514
    B.7 輸出結果可視化516
    附錄C 從AlphaGo到 AlphaZero518
    參考文獻526
    前言
    你是不是有這樣的困惑:“讀了不少關於大數據的書,發現這大數據既可以用於競選美國總統,又能夠預測禽流感,還能賣啤酒和尿不濕,又是圍棋高手……大數據好像什麼都能干耶!可是咋整呀?大數據多大為大呀?大數據能賺錢不?……唉,怎麼還是一頭霧水。”
    當你拿到這本書就對了。大數據,大數據,多大算大呢?當所要處理的數據量超過了現有的計算環境的數據處理能力時,就是大數據了。它可以是ZB、EB、PB、TB級的,也可以是GB級的。當然,如果你的資金足夠充裕,可以買得起TB級的內存、上百個處理器插槽以及海量的存儲設備,那對別人來說是大數據,對你而言可能就隻是小數據了。
    大數據本身就是人類求知的過程,從數字,到數據,到信息,到知識,再到知識的運用,而後,優劣有別的運用結果又反饋到數據中,周而復始。其實,大數據所面臨的場景隻有兩種:已知和未知。在已知的場景下需要累積大量的樣本,或者,在有公認規則的前提下—如棋藝類,按照規則自己生成樣本,AlphaZero就屬於這一類。而未知的場景就隻能是做預測了。預測究竟能有多準?或許“Most likely”是保險的答案。大數據既沒有預測到美國總統特朗普的當選,也沒有準確預測到埃博拉,沃爾瑪也從未把啤酒和尿不濕放在一起。預測不準是常態,預測準是概率事件。你是不是有這樣的困惑:“讀了不少關於大數據的書,發現這大數據既可以用於競選美國總統,又能夠預測禽流感,還能賣啤酒和尿不濕,又是圍棋高手……大數據好像什麼都能干耶!可是咋整呀?大數據多大為大呀?大數據能賺錢不?……唉,怎麼還是一頭霧水。”
    當你拿到這本書就對了。大數據,大數據,多大算大呢?當所要處理的數據量超過了現有的計算環境的數據處理能力時,就是大數據了。它可以是ZB、EB、PB、TB級的,也可以是GB級的。當然,如果你的資金足夠充裕,可以買得起TB級的內存、上百個處理器插槽以及海量的存儲設備,那對別人來說是大數據,對你而言可能就隻是小數據了。
    大數據本身就是人類求知的過程,從數字,到數據,到信息,到知識,再到知識的運用,而後,優劣有別的運用結果又反饋到數據中,周而復始。其實,大數據所面臨的場景隻有兩種:已知和未知。在已知的場景下需要累積大量的樣本,或者,在有公認規則的前提下—如棋藝類,按照規則自己生成樣本,AlphaZero就屬於這一類。而未知的場景就隻能是做預測了。預測究竟能有多準?或許“Most likely”是保險的答案。大數據既沒有預測到美國總統特朗普的當選,也沒有準確預測到埃博拉,沃爾瑪也從未把啤酒和尿不濕放在一起。預測不準是常態,預測準是概率事件。
    國內的IT熱潮一波接著一波,儼然就像一場場運動。先是雲計算,接著又是大數據。各路玩家都想追一下這些時髦熱詞的風潮,生怕趕不上,紛紛試著尋找將大數據整合到自身IT繫統中的可能性。而原本的IT公司和從業者更是絞盡腦汁地想要在大數據業務中開拓新的市場。媒體對大數據產業未來幾年的發展更是持有過熱的描述,甚至對2020年的大數據產業規模給出了的驚人估值,充滿了Big Data = IT的味道。
    在此背景下,一大批冠以大數據標題的書籍上架。就當前每年出版的大數據書籍的性質與數量來看,多數都屬於通俗類、科普類以及吸引眼球的讀物範疇。有些大數據著作中充滿著“正確的廢話”,而在真正意義上具有實踐價值的內容少而又少。然而,其中並不乏受到熱捧的作品。
    這也在一定程度上反映出讀者的求知心理:希望隻需遵循一定的閱讀捷徑,就能消化掌握相關的技術,成為高手。然而,在閱讀完眾多所謂的技術類書籍後,讀者卻並不能收獲到預期的效果。要麼隻模模糊糊地“見森林見不到樹木”,要麼又好像“摸到了樹木見不到森林”,越來越迷茫。
    究其原因,這類書籍並未本著科學的理念來傳播可用於實踐的知識與技術,更多的是為了迎合熱點話題,以一種美化的甚至扭曲的形式來對新技術做介紹,缺乏嚴謹性和實用性,缺乏將技術以“科學知識”的高度進行傳授的態度,更少了如何將技術落地到實處的關鍵內容,甚至很多書是作者為了提升職稱和賺取稿酬等目的而拼湊的。當然,寫書也是一門營生,追逐熱潮沒有錯,可是過熱的“泡沫來,泡沫往”卻並不可取。對新技術的學習應該落到實處,切不可以訛傳訛,Be careful with what you read,就是這個意思。
    事實上,大數據的應用實情或許並不像許多例子中所描述的那樣可以用來當興奮劑。現階段對大數據,從概念到應用,連認識都不清晰,更談不上數據挖掘的深度。此時如果不對大數據有一個嚴謹客觀的傳授,可能會使讀者在理解上產生謬誤、從路線上走偏,甚至當前已經出現了不少對大數據認識的誤區。可以發現,眾多談大數據的書籍中反復引用著幾個所謂“經典”的例子,其實隻不過是作者們的想像,經不起推敲。甚至一些例子所談論的情況與大數據這個詞彙一點關繫都沒有,譬如廉價機票、啤酒和尿不濕等。
    今天再談大數據,應該先摒棄盲目樂觀以及炒作的成分。如果還是停留在反復談論具有吸引眼球效果的數字和示例(如谷歌預測流感、奧巴馬競選總統等)上,談論便失去了意義。
    大數據或大數據技術就是工具。要讓工具用得好,首先得用對地方,其次要會正確地使用。
    基於以上認識,身為一線的數據從業者,作者深感為大數據從業者提供繫統的正確的知識與觀念正當其時。本書即是在此背景下編寫的,旨在根據作者個人多年的從業經驗和心得,從科學知識的高度出發,一步步幫助讀者將大數據變成看得見摸得著的東西,使之有效實施,真正落地成為有用的工具。
    除技術層面的內容外,本書立足於大數據的實踐和商業價值,從規劃、實施到運維來進行闡述。本書在構想與撰寫時,遵循了以下原則。
    在對像方面,本書兼顧專業化與大眾化,且遵循著可以將本書作為研究生課程教材的撰寫原則,在知識的深度和廣度上,一方面與高校專業教育水準相符合,另一方面也進階到大數據專業從業者水準。此外,大數據作為當前的IT技術熱點,也是大眾非常想了解的領域。為適應大眾讀者的需要,也為了使大數據技術可以獲得更廣泛的推廣,本書力求要使普通讀者也能夠理解吸收。因此在取材與撰寫時,除在文字上深入淺出外,在用例方面也盡量運用合適的例子把事情說清說透。事實上,本書的大部分內容曾用在作者為華中師範大學和上海交通大學碩士、博士研究生開設的大數據科學應用課程中,收到了良好的反饋。
    在內容方面,本書采用將學術性與實用性相結合且更突出實用性的原則。大數據技術可以算作一種理論性的學科技術,需要重視對其所包含理論的探討。在大數據範疇內,涉及包括統計學、人工智能等在內的各類專業知識,就連大數據這個詞本身也是一個含義紛呈、範圍甚廣、概念抽像的名詞。而在大數據技術的另一個層面上,它又是與實踐緊密聯繫的,多數讀者希望通過學習大數據書籍來解決實際的大數據軟硬件平臺及應用的建設問題,而且大數據這一概念本身也是從實際的數據行業需求中產生出來的。因此,本書在內容上,力求結合理論與實際,既探討必要的理論知識,給予讀者正確的概念,又重視實踐的各個環節。
    在架構方面,本書采用專門性與普遍性均衡原則。就知識範圍而言,大數據技術是多種技術的組合,從單一的需求出發點可以分化到涉及大數據規劃、實施、運維全生命周期的各個不同的細分技術環節。本書內容注重大數據技術中的普通知識與深入的專業技術之間的均衡,以指引有志從事大數據行業的讀者,在普通知識之外,找到自己感興趣的方向。為達到這一目標,本書的編排涉及大數據的各個環節,並對每個環節的各細分方向都做了由淺入深的專題介紹。
    所謂God creates the numbers, men do the rest。自從有人類文明以來就有了數字,進而有了數據,甚至可以說就有了大數據。為什麼今天把大數據提到如此的高度呢?這和數據的產生量以及相應的處理能力(軟的、硬的)是分不開的。中國的智能手機用戶數量居全球,企業的數量也居全球,隨著IT業的推進和滲透,每時每刻都有海量的數據產生和被保存,這也正是大數據在中國發展的基礎。利用好大數據技術,了解數據、管理數據、共享數據、使用數據,可方便人們的日常生活,有助於企業打破信息孤島,有效地融合各方面的信息,從而為合作伙伴的選擇、供應鏈的管理、目標市場的鎖定等提供定量的決策依據。
    除論述大數據是什麼、能做什麼外,更側重的是怎麼做。本書以“用戶關繫管理(Customer Relationship Management,CRM)”這一企業級應用場景為例,這也是目前大數據應用為數不多的成功案例,深入、細致、完整地展示大數據的各個環節。緊扣如何利用大數據來實現以用戶行為來指導銷售推送以及生產決策的過程,也就是“推薦繫統”,力求使讀者能真正將大數據落地於實踐。
    本書立足於作者所處企業的案例和產品,結合流行的開源軟件(Hadoop、Spark等),實打實地談大數據,並給出了一手的市場情況以及真實的數據。全書從規劃到實施再到運維,繫統、全面地幫助讀者把握大數據落地的各個環節,了解大數據的全貌。大數據的實踐是與業務密切關聯的,本書以一個實際的大數據項目為專題,將書中講述的規劃、實施、運維穿針引線,Put it all together,向讀者完整展示大數據實踐過程,拉近讀者與大數據的距離,讓大數據理念切實與讀者的工作相結合。
    在市場環境下,任何技術都要圍繞商戰的“三匹老馬”(價格、質量、服務)以及經濟社會的三個主要環節(生產、流通、消費)來發展。對於各個企業的大數據活動而言,其目的是尋找一條利用大數據來提高自身業務運作效率、維繫現有客戶、擴大新客戶群的路線,從而達到以大數據促進產業鏈並實現精準客戶管理的效果,做到向數據要效益。直白地說,就是怎樣通過多渠道、多維度獲取有用的用戶消費行為數據,對其進行建模分析,從而做出決策來服務現有的用戶,通過給用戶推薦其感興趣的相關產品以達到精準營銷,挖掘已有客戶的價值。而大數據的高級階段則是—設計出新的產品。
    本書在撰寫中秉持以下觀點。
    1)大數據的定義應該是多層次的。狹義的大數據停留在技術處理的層面;而廣義的大數據則包含了大數據產業鏈的各個環節所提供的產品和服務;泛義的大數據擴展到每個細分的行業大數據中,成為“數據 ”;偽義大數據則以營銷為目的,雖不可避免地包含了一部分炒作的成分,但也確確實實起到了一定的推廣效用,是一股不可低估的市場力量。
    2)做好大數據和做成任何一件事情一樣,隻有三種方法:Work hard,Work smart,Getting help。Work hard體現在對性能的提升上,Work smart則是對算法的改進,Getting help是指借助多個以集群的思維來解決對超大規模數據集的處理。
    3)大數據的處理過程可形成一個持續提升的迭代閉環。由原始的數據開始,大數據先將其處理為信息,進而利用算法抽取出其中所蘊含的知識,知識的正確運用可以幫助決策,終知識的集成和梳理就可以晉升為智慧和文化。而在開展決策實踐的過程中,還會產生新的數據,即,數字—數據—信息—知識—應用—數據。因此,上述過程又會進入新的一輪,並不斷提升,也就是所謂的波浪式前進、螺旋式上升。
    4)大數據並非一次技術的跳躍式飛升。多數IT技術領域在相當長的一段時間內並未出現劃時代的本質變化,其技術增強點大都集中在計算能力(
    書摘插畫
    插圖


     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部