[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • Spark 3.x大數據分析實戰(視頻教學版)
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    440-638
    【優惠價】
    275-399
    【作者】 張偉洋 
    【所屬類別】 圖書  計算機/網絡  計算機理論 
    【出版社】清華大學出版社 
    【ISBN】9787302614500
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302614500
    作者:張偉洋

    出版社:清華大學出版社
    出版時間:2022年09月 

        
        
    "

    產品特色

    編輯推薦

    本書使用Spark 3.2.x撰寫,使用通俗易懂的語言描述,對於小白來說非常友好。
    知識全面,全書圍繞Spark大數據生態構建知識體繫,涵蓋Spark 3架構原理、集群搭建、計算框架、Shell 命令、API操作、內核源碼剖析、與Hive和Kafaka與HBase的整合操作等內容
    由行業大數據專家傾力打造,專業性毋庸置疑,全書運用十分通俗的語言和詳盡的代碼分析,幫助從未接觸過Spark的讀者無痛上手,如果你想學習Spark,本書是一個值得入手的選擇。
    拒絕紙上談兵,全書提供20個大小案例和項目,並使用手把手的教學方法,各章還提供動手練習題,讓讀者快速掌握實用大數據項目技能。
    配套豐富的資源,包括上機練習源碼、教學視頻、PPT課件,讀者還可以關注作者公眾號“奮鬥在IT”獲取更多大數據學習資源。

     
    內容簡介

    本書基於Spark 3.2.x版本,從Spark核心編程語言Scala講起,涵蓋了當前整個Spark生態繫統主流的大數據開發技術。全書共9章,第1章講解了Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解了Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行;第3~9章講解了離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,並通過多個實際案例講解各個框架的具體應用以及與Hadoop生態繫統框架Hive、HBase、Kafka的整合操作。 本書通俗易懂,案例豐富,注重實操,適合Spark新手和大數據開發人員閱讀,也可作為培訓機構和高校大數據及相關專業的教學用書。

    作者簡介

    張偉洋,大數據領域資深專家,擁有多年互聯網公司軟件研發經驗,曾在互聯網旅遊公司擔任軟件研發事業部經理。先後多次為中國海洋大學、曲阜師範大學、青島理工大學等高校舉行大數據專題講座,對Hadoop及周邊大數據框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究,公眾號“奮鬥在IT” 的創辦人。已出版《Hadoop大數據技術開發實戰》《Flink大數據分析實戰》等圖書。

    目錄
    第1章 Spark開發準備——Scala基礎 1
    1.1 什麼是Scala 1
    1.2 安裝Scala 1
    1.2.1 在Windows中安裝Scala 2
    1.2.2 在CentOS 7中安裝Scala 3
    1.3 Scala基礎 3
    1.3.1 變量聲明 4
    1.3.2 數據類型 5
    1.3.3 表達式 6
    1.3.4 循環 7
    1.3.5 方法與函數 9
    1.4 集合 12
    1.4.1 數組 12
    1.4.2 List 14

    第1章  Spark開發準備——Scala基礎 1
    1.1  什麼是Scala 1
    1.2  安裝Scala 1
    1.2.1  在Windows中安裝Scala 2
    1.2.2  在CentOS 7中安裝Scala 3
    1.3  Scala基礎 3
    1.3.1  變量聲明 4
    1.3.2  數據類型 5
    1.3.3  表達式 6
    1.3.4  循環 7
    1.3.5  方法與函數 9
    1.4  集合 12
    1.4.1  數組 12
    1.4.2  List 14
    1.4.3  Map映射 15
    1.4.4 &nb組 17
    1.4.5  Set 18
    1.5  類和對像 19
    1.5.1  類的定義 19
    1.5.2  單例對像 20
    1.5.3  伴生對像 20
    1.5.4  get和set方法 20
    1.5.5  構造器 23
    1.6  抽像類和特質 25
    1.6.1  抽像類 25
    1.6.2  特質 26
    1.7  使用Eclipse創建Scala項目 28
    1.7.1  安裝Scala for Eclipse IDE 28
    1.7.2  創建Scala項目 29
    1.8  使用IntelliJ IDEA創建Scala項目 29
    1.8.1  在IDEA中安裝Scala插件 30
    1.8.2  創建Scala項目 31
    1.9  動手練習 32
    第2章  初識Spark 33
    2.1  大數據開發的總體架構 33
    2.2  什麼是Spark 34
    2.3  Spark的主要組件 35
    2.4  Spark運行架構 37
    2.4.1  YARN集群架構 37
    2.4.2  Spark Standalone架構 40
    2.4.3  Spark On YARN架構 42
    2.5  Spark集群搭建與測試 44
    2.5.1  Spark Standalone模式的集群搭建 44
    2.5.2  Spark On YARN模式的集群搭建 46
    2.5.3  Spark HA的搭建 47
    2.6  Spark應用程序的提交 51
    2.7  Spark Shell的使用 53
    2.8  動手練習 55
    第3章  Spark RDD彈性分布式數據集 56
    3.1  什麼是RDD 56
    3.2  創建RDD 57
    3.2.1  從對像集合創建RDD 57
    3.2.2  從外部存儲創建RDD 57
    3.3  RDD的算子 58
    3.3.1  轉化算子 58
    3.3.2  行動算子 65
    3.4  RDD的分區 66
    3.4.1  分區數量 66
    3.4.2  自定義分區器 74
    3.5  RDD的依賴 79
    3.5.1  窄依賴 79
    3.5.2  寬依賴 79
    3.5.3  Stage劃分 80
    3.6  RDD的持久化 81
    3.6.1  存儲級別 82
    3.6.2  查看緩存 84
    3.7  RDD的檢查點 86
    3.8  共享變量 87
    3.8.1  廣播變量 87
    3.8.2  累加器 89
    3.9  案例分析:Spark RDD實現單詞計數 90
    3.9.1  新建Maven管理的Spark項目 90
    3.9.2  編寫WordCount程序 92
    3.9.3  提交程序到集群 94
    3.10  案例分析:Spark RDD實現分組求TopN 96
    3.11  案例分析:Spark RDD實現二次排序 100
    3.12  案例分析:Spark RDD計算成績平均分 103
    3.13  案例分析:Spark RDD倒排索引統計 每日新增用戶 105
    3.14  案例分析:Spark RDD讀寫HBase 109
    3.14.1  讀取HBase表數據 109
    3.14.2  寫入HBase表數據 111
    3.15  案例分析:Spark RDD數據傾斜問題的解決 119
    3.15.1  數據傾斜的常用解決方法 120
    3.15.2  使用隨機key進行雙重聚合 121
    3.15.3  WebUI查看Spark歷史作業 124
    3.16  動手練習 125
    第4章  Spark內核源碼分析 127
    4.1  Spark集群啟動原理分析 127
    4.2  Spark應用程序提交原理分析 136
    4.3  Spark作業工作原理分析 146
    4.3.1  MapReduce的工作原理 147
    4.3.2  Spark作業的工作原理 149
    4.4  Spark檢查點原理分析 160
    第5章  Spark SQL結構化數據處理引擎 164
    5.1  什麼是Spark SQL 164
    5.2  DataFrame和Dataset 165
    5.3  Spark SQL的基本使用 166
    5.4  Spark SQL數據源 168
    5.4.1  基本操作 168
    5.4.2  Parquet文件 172
    5.4.3  JSON數據集 175
    5.4.4  Hive表 176
    5.4.5  JDBC 178
    5.5  Spark SQL內置函數 179
    5.5.1  自定義函數 181
    5.5.2  自定義聚合函數 182
    5.5.3  開窗函數 184
    5.6  案例分析:使用Spark SQL實現單詞計數 186
    5.7  案例分析:Spark SQL與Hive的整合 191
    5.7.1  整合Hive的步驟 191
    5.7.2  操作Hive的幾種方式 193
    5.8  案例分析:Spark SQL讀寫MySQL 195
    5.9  案例分析:Spark SQL每日UV統計 199
    5.10  案例分析:Spark SQL熱點搜索詞統計 201
    5.11  綜合案例:Spark SQL智慧交通數據分析 204
    5.11.1  項目介紹 204
    5.11.2  數據準備 205
    5.11.3  統計正常卡口數量 208
    5.11.4  統計車流量排名前3的卡口號 208
    5.11.5  統計車輛高速通過的卡口Top5 209
    5.11.6  統計每個卡口通過速度快的前3輛車 212
    5.11.7  車輛軌跡分析 213
    5.12  動手練習 214
    第6章  Kafka分布式消息繫統 215
    6.1  什麼是Kafka 215
    6.2  Kafka架構 216
    6.3  主題與分區 217
    6.4  分區副本 218
    6.5  消費者組 220
    6.6  數據存儲機制 221
    6.7  集群環境搭建 223
    6.8  命令行操作 225
    6.8.1  創建主題 225
    6.8.2  查詢主題 225
    6.8.3  創建生產者 226
    6.8.4  創建消費者 227
    6.9  Java API操作 227
    6.9.1  創建Java工程 227
    6.9.2  創建生產者 228
    6.9.3  創建消費者 230
    6.9.4  運行程序 231
    6.10  案例分析:Kafka生產者攔截器 233
    6.11  動手練習 239
    第7章  Spark Streaming實時流處理引擎 240
    7.1  什麼是Spark Streaming 240
    7.2  Spark Streaming工作原理 241
    7.3  輸入DStream和Receiver 242
    7.4  個Spark Streaming程序 243
    7.5  Spark Streaming數據源 244
    7.5.1  基本數據源 244
    7.5.2  高級數據源 246
    7.5.3  自定義數據源 247
    7.6  DStream操作 250
    7.6.1  無狀態操作 251
    7.6.2  狀態操作 252
    7.6.3  窗口操作 253
    7.6.4  輸出操作 255
    7.6.5  緩存及持久化 256
    7.6.6  檢查點 257
    7.7  案例分析:Spark Streaming按批次累加單詞數量 259
    7.8  案例分析:Spark Streaming整合Kafka計算實時單詞數量 262
    7.9  案例分析:Spark Streaming實時用戶日志黑名單過濾 268
    7.10  綜合案例:微博用戶行為分析 271
    7.11  動手練習 273
    第8章  Structured Streaming結構化流處理引擎 274
    8.1  什麼是Structured Streaming 274
    8.2  Structured Streaming單詞計數 275
    8.3  Structured Streaming編程模型 277
    8.4  Structured Streaming查詢輸出 279
    8.5  Structured Streaming窗口操作 282
    8.5.1  事件時間 282
    8.5.2  窗口聚合單詞計數 283
    8.5.3  延遲數據和水印 286
    8.6  案例分析:Structured Streaming整合Kafka實現單詞計數 290
    8.7  動手練習 293
    第9章  GraphX圖計算引擎 294
    9.1  什麼是GraphX 294
    9.2  個GraphX程序 295
    9.3  GraphX數據結構 298
    9.4  GraphX圖操作 298
    9.4.1  基本操作 298
    9.4.2  屬性操作 301
    9.4.3  結構操作 302
    9.4.4  連接操作 304
    9.4.5  聚合操作 307
    9.5  案例分析:使用GraphX計算社交網絡中粉絲的平均年齡 308
    9.6  動手練習 310


     

    前言
    當今互聯網已進入大數據時代,大數據技術已廣泛應用於金融、醫療、教育、電信、政府等領域。各行各業每天都在產生大量的數據,數據計量單位已從Byte、KB、MB、GB、TB發展到PB、EB、ZB、YB甚至BB、NB、DB級。預計未來幾年,全球數據將呈爆炸式增長。谷歌、阿裡巴巴、百度、等互聯網公司都急需掌握大數據技術的人纔,大數據相關人纔出現了供不應求的局面。
    Spark作為下一代大數據處理引擎,現已成為當今大數據領域極為活躍和高效的大數據計算平臺,是大數據產業中的一股不可或缺的力量。Spark提供了Java、Scala、Python和R的高級API,支持一組豐富的高級工具,包括使用SQL進行結構化數據處理的Spark SQL、用於機器學習的MLlib、用於圖處理的GraphX,以及用於實時流處理的Spark Streaming。這些高級工具可以在同一個應用程序中無縫地組合,大大提高了開發效率,降低了開發難度。
    很多互聯網公司都使用Spark來實現公司的核心業務,例如阿裡的雲計算平臺、的推薦繫統等。隻要和海量數據相關的領域,都有Spark的身影。
    本書主要內容

    當今互聯網已進入大數據時代,大數據技術已廣泛應用於金融、醫療、教育、電信、政府等領域。各行各業每天都在產生大量的數據,數據計量單位已從Byte、KB、MB、GB、TB發展到PB、EB、ZB、YB甚至BB、NB、DB級。預計未來幾年,全球數據將呈爆炸式增長。谷歌、阿裡巴巴、百度、等互聯網公司都急需掌握大數據技術的人纔,大數據相關人纔出現了供不應求的局面。
    Spark作為下一代大數據處理引擎,現已成為當今大數據領域極為活躍和高效的大數據計算平臺,是大數據產業中的一股不可或缺的力量。Spark提供了Java、Scala、Python和R的高級API,支持一組豐富的高級工具,包括使用SQL進行結構化數據處理的Spark SQL、用於機器學習的MLlib、用於圖處理的GraphX,以及用於實時流處理的Spark Streaming。這些高級工具可以在同一個應用程序中無縫地組合,大大提高了開發效率,降低了開發難度。
    很多互聯網公司都使用Spark來實現公司的核心業務,例如阿裡的雲計算平臺、的推薦繫統等。隻要和海量數據相關的領域,都有Spark的身影。
    本書主要內容
    本書基於Spark 3.2.x版本,涵蓋了當前整個Spark生態繫統主流的大數據開發技術。全書共9章,第1章講解了Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解了Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行;第3~9章講解了離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,並通過多個實際案例講解各個框架的具體應用以及與Hadoop生態繫統框架Hive、HBase、Kafka的整合操作。
    本書以實操為主,理論為輔,大量案例均采用一步一步手把手的講解方式,易於理解,很適合讀者快速上手。通過對本書的學習,讀者能夠對Spark相關框架迅速理解並掌握,可以熟練使用Spark集成環境進行大數據項目的開發。
    如何學習本書
    本書推薦的閱讀方式是按照章節順序從頭到尾完成閱讀,因為後面的很多章節是以前面的章節為基礎,而且這種一步一個腳印、由淺入深的方式將使你更加順利地掌握Spark的開發技能。
    學習本書時,首先學習第1章的Scala語言基礎,在IDEA中編寫Scala程序;然後學習第2章,掌握Spark的集群架構並搭建好Spark集群環境;後依次學習第3~9章,學習每一章時先了解該章的基礎知識和框架的架構原理,然後再進行Shell命令、API操作等實操練習,這樣學習效果會更好。當書中的理論和實操知識都掌握後,可以進行舉一反三,自己開發一個Spark應用程序,


    或者將所學知識運用到自己的編程項目上,也可以到各種在線論壇與其他Spark愛好者進行交流,互幫互助。
    本書適合的讀者
    本書主要適合下述人員學習:
    Spark新手
    大數據開發和運維人員
    培訓機構和各類院校的學生
    配書資源
    為方便讀者掌握本書內容,本書提供了下述資源:
    教學視頻:本書提供了60多個教學視頻,讀者可以掃描本書提供的二維碼即時觀看。
    源代碼:免費提供本書所有案例的代碼,讀者可掃描下述二維碼下載。
    PPT課件:讀者可以掃描本書的二維碼下載PPT課件。
    如果下載有問題,請發送郵件到booksaga@126.com,郵件主題為“Spark 3.x大數據分析實戰(視頻教學版)”。
            
    雖然筆者已盡心竭力,但限於水平和時間原因,仍然難免存在謬誤,懇請廣大讀者和業界專家不吝指正。讀者若對書中講解的知識有任何疑問,可關注微信公眾號“奮鬥在IT”獲得解答。


     



    張偉洋    
    2022年6月2日

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部