●本書編委會
前言
第1章 緒論
1.1 大數據的基本概念
1.2 數據庫管理繫統
1.2.1 數據庫管理繫統的基本概念
1.2.2 數據庫管理繫統的發展歷史
1.2.3 數據庫管理繫統的要素
1.3 大數據對數據庫管理繫統的需求和挑戰
1.4 本書結構
第2章 關繫型數據庫管理繫統
2.1 關繫數據庫概述
2.1.1 關繫模型
2.1.2 關繫數據的存儲
2.1.3 關繫數據庫的索引
2.1.4 關繫數據庫中的查詢處理算法
2.1.5 並發控制
2.1.6 數據庫恢復
2.2 關繫數據庫MySQL概述
2.3 MySQL應用
2.3.1 SQL概述
2.3.2 數據定義語句
2.3.3 數據處理語句
2.3.4 事務和鎖定聲明
2.3.5 其他
2.4 存儲過程
2.4.1 概述
2.4.2 建立存儲過程
2.4.3 調用存儲過程
2.4.4 查詢存儲過程
2.4.5 刪除存儲過程
2.5 視圖
2.6 分區
2.7 復制
2.8 MySQL的Java客戶端JDBC
2.8.1 JDBC概述
2.8.2 JDBCAPI
2.8.3 Java通過JDBCAPI操作MySQL
第3章 數據倉庫Hive
3.1 數據倉庫概述
3.1.1 數據倉庫的概念和特征
3.1.2 數據倉庫的體繫結構
3.1.3 數據倉庫的模型
3.1.4 數據倉庫關鍵技術
3.1.5 數據倉庫與大數據
3.2 Hive概述
3.2.1 Hive存儲結構
3.2.2 Hive體繫結構
3.2.3 Hive的任務執行流程
3.3 Hive的特征
3.3.1 一致性
3.3.2 可擴展性
3.3.3 事務
3.4 Hive的基本概念
3.4.1 基本數據類型
3.4.2 數據類型轉換
3.4.3 復雜數據類型
3.4.4 文本文件數據編碼
3.4.5 數據讀取模式
3.4.6 文件格式與壓縮
3.4.7 Hive壓縮
3.4.8 Hive關鍵字
3.5 Hive的使用
3.5.1 Hive命令
3.5.2 HiveDDL
3.5.3 HiveDML
3.5.4 HiveQL基本查詢
3.5.5 Hive函數
3.5.6 HiveQL高級查詢
3.6 面向大數據的優化策略
3.6.1 分桶
3.6.2 視圖和索引
3.6.3 模式設計
3.7 Hive的調優
3.7.1 使用EXPLAIN查看執行計劃
3.7.2 Hive配置管理
3.7.3 調整
3.7.4 JOIN優化
3.7.5 本地模式
3.7.6 並行執行
3.7.7 嚴格模式
3.7.8 調整Mapper和Reducer個數
3.7.9 JVM重用
3.7.10 動態分區調整
3.7.11 推測執行
3.7.12 單個MapReduce中的多個GROUPBY
3.7.13 虛擬列
3.8 Java通過JDBC操作Hive
……
第4章 NoSQL概述
第5章 鍵值數據庫
第6章 列族數據庫
第7章 非關繫型文檔數據庫
第8章 非關繫型圖數據庫
《大數據管理繫統原理與技術》介紹了多種數據庫管理繫統的基本概念以及代表性數據庫管理繫統的使用和優化方法,覆蓋了傳統的關繫數據庫、數據倉庫,以及列族、鍵值、文檔、圖等NoSQL數據庫繫統。
通過閱讀《大數據管理繫統原理與技術》,讀者可以較全面地了解支撐大數據應用所需的數據庫管理繫統的概念、特征和相關技術,並且可以學習代表性關繫數據庫繫統的使用方法,將理論和實際相結合。
《大數據管理繫統原理與技術》可作為大數據相關專業本科生和研究生教材,也可供從事大數據相關工作的工程技術人員參考使用。
要進行有效的大數據處理和計算,選擇適當的數據庫管理繫統並對其進行配置、編程和調優是非常關鍵的環節。在大數據場景下,單一的數據庫管理繫統無法滿足所有類型數據管理的需要,因此大數據相關專業的學生和從業者需要了解不同類型的數據庫管理繫統,以解決不同場景下的實際問題。
《等