●第1章Spark概述
1.1認識Spark
1.1.1Spark的產生背景
1.1.2Spark的優點
1.1.3Spark應用場景
1.1.4Spark生態繫統
1.2Spark運行機制
1.2.1Spark基本概念
1.2.2Spark運行架構
1.2.3Spark應用執行的基本流程
1.3Spark的安裝及配置
1.3.1Spark安裝的基礎環境
1.3.2下載安裝文件
1.3.3單機模式配置
1.3.4偽分布式模式配置
1.4SparkScala編程
1.4.1啟動SparkShell
1.4.2退出SparkSheU
1.5SparkPython編程
習題
第2章Scala基礎編程
2.1Scala特性
2.2Windows環境下的Scala安裝
2.2.1jdk安裝與環境變量配置
2.2.2Scala安裝
2.3聲明常量和變量
2.3.1聲明常量
2.3.2聲明變量
2.4字符串
2.4.1基本數據類型
2.4.2運算符
2.4.3字符串對像的常用方法
2.5Scala控制結構
2.5.1條件表達式
2.5.2ifelse選擇結構
2.5.3編寫Scala腳本
2.5.4循環
2.6Scala數組
2.6.1數組的分類
2.6.2遍歷數組
2.6.3數組轉換
2.6.4數組對像的常用方法
2.7列表
2.7.1不可變列表(List)創建
2.7.2不可變列表(List)操作
2.7.3可變列表ListBuffer
2.8集合
2.8.1不可變集合
2.8.2可變集合
2.9映射
2.9.1不可變映射
2.9.2可變映射
2組
2.1組常用操作
2.10.2拉鏈操作
2.11Scala函數
2.11.1函數定義
2.11.2匿名函數
2.11.3高階函數
2.12Scala模式匹配
2.13Scala類
2.13.1class類
2.13.2Object對像
2.14Scala讀寫文件
2.14.1讀取文件
2.14.2寫入文件
習題
……
第3章基於Scala的Spark編程
第4章Windows環境下的Spark綜合編程
第5章SparkSQL結構化數據處理
第6章SparkStreaming流計算
第7章SparkGraphX圖計算
第8章SparkMLlib機器學習
參考文獻
《Spark大數據分析技術(Scala版)》繫統介紹了Spark大數據技術的相關知識,內容包括Spark概述、Scala基礎編程、基於Scala的Spark編程、Windows環境下的Spark綜合編程、SparkSQL結構化數據處理、SparkStreaming流計算、SparkGraphX圖計算、SparkMLlib機器學習。《Spark大數據分析技術(Scala版)》還給出了Spark大數據相關技術的許多編程示例與詳細注解。
《Spark大數據分析技術(Scala版)》可作為高等院校計算機、軟件工程、數據科學與大數據技術、智能科學與技術、人工智能等專業的大數據課程教材,也可供相關技術人員參考。