作 者:林子雨 編
定 價:69
出 版 社:清華大學出版社
出版日期:2020年10月01日
頁 數:368
裝 幀:平裝
ISBN:9787302559771
"全國高校大數據教學知名教師以多年大數據教學經驗為基礎的傾心之作。全國眾多高校開課教材《大數據技術原理與應用》專享指定配套實驗指導書。教程官網提供全書實驗代碼、相關軟件、授課視頻等資源一站式免費下載。高校大數據課程公共服務平臺為本教程提供數字化教學資源全方位配套服務。"
●第1章 大數據技術概述
1.1 大數據時代
1.2 大數據關鍵技術
1.3 大數據軟件
1.3.1 Hadoop
1.3.2 Spark
1.3.3 NoSQL數據庫
1.4 內容安排
1.5 在線資源
1.6 本章小結
第2章 Linux繫統的安裝和使用
2.1 Linux繫統簡介
2.2 Linux繫統安裝
2.2.1 下載安裝文件
2.2.2 Linux繫統的安裝方式
2.2.3 安裝Linux虛擬機
2.2.4 生成Linux虛擬機鏡像文件
2.3 Linux繫統及相關軟件的基本使用方法
2.3.1 Shell
2.3.2 root用戶
2.3.3 創建普通用戶
2.3.4 sudo命令
2.3.5 常用的Linux繫統命令
2.3.6 文件解壓縮
2.3.7 常用的目錄
2.3.8 目錄的權限
2.3.9 更新APT
2.3.10 切換中英文輸入法
2.3.11 vim編輯器的使用方法
2.3.12 在Windows繫統中使用SSH方式登錄Linux繫統
2.3.13 在Linux繫統中安裝Eclipse
2.3.14 其他使用技巧
2.4 關於本書內容的一些約定
2.5 本章小結
第3章 Hadoop的安裝和使用
3.1 Hadoop簡介
3.2 安裝Hadoop前的準備工作
3.2.1 創建hadoop用戶
3.2.2 更新APT
3.2.3 安裝SSH
3.2.4 安裝Java環境
3.3 安裝Hadoop
3.3.1 下載安裝文件
3.3.2 單機模式配置
3.3.3 偽分布式模式配置
3.3.4 分布式模式配置
3.4 本章小結
第4章 HDFS操作方法和基礎編程
4.1 HDFS操作常用的Shell命令
4.1.1 查看命令的用法
4.1.2 HDFS操作
4.2 利用HDFS的Web管理界面
4.3 HDFS編程實踐
4.3.1 在Eclipse中創建項目
4.3.2 為項目添加需要用到的JAR包
4.3.3 編寫Java應用程序
4.3.4 編譯運行程序
4.3.5 應用程序的部署
4.4 本章小結
第5章 HBase的安裝和基礎編程
5.1 安裝HBase
5.1.1 下載安裝文件
5.1.2 配置環境變量
5.1.3 添加用戶權限
5.1.4 查看HBase版本信息
5.2 HBase的配置
5.2.1 單機模式配置
5.2.2 偽分布式模式配置
5.3 HBase常用的Shell命令
5.3.1 在HBase中創建表
5.3.2 添加數據
5.3.3 查看數據
5.3.4 刪除數據
5.3.5 刪除表
5.3.6 查詢歷史數據
5.3.7 退出HBase數據庫
5.4 HBase編程實踐
5.4.1 在Eclipse中創建項目
5.4.2 為項目添加需要用到的JAR包
5.4.3 編寫Java應用程序
5.4.4 編譯運行程序
5.5 本章小結
第6章 典型NoSQL數據庫的安裝和使用
6.1 Redis的安裝和使用
6.1.1 Redis簡介
6.1.2 安裝Redis
6.1.3 Redis實例演示
6.2 MongoDB的安裝和使用
6.2.1 MongDB簡介
6.2.2 安裝MongoDB
6.2.3 使用Shell命令操作MongoDB
6.2.4 Java API編程實例
6.3 本章小結
第7章 MapReduce基礎編程
7.1 詞頻統計任務要求
7.2 MapReduce程序編寫方法
7.2.1 編寫Map處理邏輯
7.2.2 編寫Reduce處理邏輯
7.2.3 編寫main方法
7.2.4 完整的詞頻統計程序
7.3 編譯打包程序
7.3.1 使用命令行編譯打包詞頻統計程序
7.3.2 使用Eclipse編譯打包詞頻統計程序
7.4 運行程序
7.5 本章小結
第8章 數據倉庫Hive的安裝和使用
8.1 Hive的安裝
8.1.1 下載安裝文件
8.1.2 配置環境變量
8.1.3 修改配置文件
8.1.4 安裝並配置MySQL
8.2 Hive的數據類型
8.3 Hive基本操作
8.3.1 創建數據庫、表、視圖
8.3.2 刪除數據庫、表、視圖
8.3.3 修改數據庫、表、視圖
8.3.4 查看數據庫、表、視圖
8.3.5 描述數據庫、表、視圖
8.3.6 向表中裝載數據
8.3.7 查詢表中數據
8.3.8 向表中插入數據或從表中導出數據
8.4 Hive應用實例:WordCount
8.5 Hive編程的優勢
8.6 本章小結
第9章 Spark的安裝和基礎編程
9.1 基礎環境
9.2 安裝Spark
9.2.1 下載安裝文件
9.2.2 配置相關文件
9.3 使用 Spark Shell編寫代碼
9.3.1 啟動Spark Shell
9.3.2 讀取文件
9.3.3 編寫詞頻統計程序
9.4 編寫Spark獨立應用程序
9.4.1 用Scala語言編寫Spark獨立應用程序
9.4.2 用Java語言編寫Spark獨立應用程序
9.5 本章小結
第10章 Flink的安裝和基礎編程
10.1 安裝Flink
10.2 編程實現WordCount程序
10.2.1 安裝Maven
10.2.2 編寫代碼
10.2.3 使用Maven打包Java程序
10.2.4 通過flink run命令運行程序
10.3 本章小結
第11章 典型可視化工具的使用方法
11.1 D3可視化庫的使用方法
11.1.1 D3可視化庫的安裝
11.1.2 基本操作
11.2 使用ECharts制作圖表
11.2.1 ECharts簡介
……
本書以大數據分析全流程為主線,介紹數據采集、數據存儲與管理、數據處理與分析、數據可視化等環節典型軟件的安裝、使用和基礎編程方法。內容涵蓋操作繫統(Linux和Windows)、開發工具(Eclipse),以及大數據相關技術、軟件(Kafka、Hadoop(HDFS、MapReduce)、HBasej、Hive、Spark、MySQL、MongoDB、Redis、R、D3、ECharts)等。同時,本書還提供了豐富的課程實驗和綜合案例,以及大量免費的在線教學資源,可以較好地滿足高等院校大數據教學實際需求。本書是《大數據技術原理與應用》(第3版)的“姊妹篇”,可以作為高等院校大數據、計算機、信息管理等相關專業的大數據課程輔助教材,用於指導大數據編程實踐,也可供相關技術人員參考。
林子雨 編
林子雨(1978-),男,博士,廈門大學計算機科學繫助理教授,廈門大學雲計算與大數據研究中心創始成員,廈門大學數據庫實驗室負責人,中國計算機學會數據庫專委會委員,中國計算機學會信息繫統專委會委員。於2001年獲得福州大學水利水電專業學士學位,2005年獲得廈門大學計算機專業碩士學位,2009年獲得北京大學計算機專業博士學位。