●章基礎知識
1.1Hadoop和MapReduce綜述
1.2Hadoop生態繫統中的Hive
1.2.1Pig
1.2.2HBase
1.2.3Cascading、Crunch及其他
1.3Java和Hive:詞頻統計算法
1.4後續事情
第2章基礎操作
2.1安裝預先配置好的虛擬機
2.2安裝詳細步驟
2.2.1裝Java
2.2.2安裝Hadoop
2.2.3本地模式、偽分布式模式和分布式模式
2.2.4測試Hadoop
2.2.5安裝Hive
2.3Hive內部是什麼
2.4啟動Hive
2.5配置Hadoop環境
2.5.1本地模式配置
2.5.2分布式模式和偽分布式模式配置
2.5.3使用JDB數據
2.6Hive命令
2.7命令行界面
2.7.1CLI選項
2.7.2變量和屬性
2.7.3Hive中“一次使用”命令
2.7.4從文件中執行Hive查詢
2.7.5hiverc文件
2.7.6使用HiveCLI的更多介紹
2.7.7查看操作命令歷史
2.7.8執行shell命令
2.7.9在Hive內使用Hadoop的dfs命令
2.7.10Hive腳本中如何進行注釋
2.7.11顯示字段名稱
第3章數據類型和文件格式
3.1基本數據類型
3.2集合數據類型
3.3文本文件數據編碼
3.4讀時模式
第4章HiveQL:數據定義
4.1Hive中的數據庫
4.2修改數據庫
4.3創建表
4.3.1管理表
4.3.2外部表
4.4分區表、管理表
4.4.1外部分區表
4.4.2自定義表的存儲格式
4.5刪除表
4.6修改表
4.6.1表重命名
4.6.2增加、修改和刪除表分區
4.6.3修改列信息
4.6.4增加列
4.6.5刪除或者替換列
4.6.6修改表屬性
4.6.7修改存儲屬性
4.6.8眾多的修改表語句
第5章HiveQL:數據操作
5.1向管理表中裝載數據
5.2通過查詢語句向表中插入數據
5.3單個查詢語句中創建表並加載數據
5.4導出數據
第6章HiveQL:查詢
6.1SELECT…FROM語句
6.1.1使用正則表達式來指定列
6.1.2使用列值進行計算
6.1.3算術運算符
6.1.4使用函數
6.1.5LIMIT語句
6.1.6列別名
6.1.7嵌套SELECT語句
6.1.8CASE…WHEN…THEN句式
6.1.9什麼情況下Hive可以避免進行MapReduce
6.2WHERE語句
6.2.1謂詞操作符
6.2.2關於浮點數比較
6.2.3LIKE和RLIKE
6.3GROUPBY語句
6.4JOIN語句
6.4.1INNERJOIN
6.4.2JOIN優化
6.4.3LEFTOUTERJOIN
6.4.4OUTERJOIN
6.4.5RIGHTOUTERJOIN
6.4.6FULLOUTERJOIN
6.4.7LEFTSEMI—JOIN
6.4.8笛卡爾積JOIN
6.4.9map—sideJOIN
6.5ORDERBY和SORTBY
6.6含有SORTBY的DISTRIBUTEBY
6.7CLUSTERBY
6.8類型轉換
6.9抽樣查詢
6.9.1數據塊抽樣
6.9.2分桶表的輸入裁剪
6.10UNIONALL
第7章HiveQL:視圖
7.1使用視圖來降低查詢復雜度
7.2使用視圖來基於條件過濾的數據
7.3動態分區中的視圖和map類型
7.4視圖零零碎碎相關的事情
第8章HiveQL:索引
8.1創建索引
8.2重建索引
8.3顯示索引
8.4刪除索引
8.5實現一個定制化的索引處理器
第9章模式設計
9.1按天劃分的表
9.2關於分區
9.3專享鍵和標準化
9.4同一份數據多種處理
9.5對於每個表的分區
9.6分桶表數據存儲
9.7為表增加列
9.8使用列存儲表
9.8.1重復數據
9.8.2多列
9.9(幾乎)總是使用壓縮
0章調優
10.1使用EXPLAIN
10.2EXPLAINEXTENDED
10.3調整
10.4JOIN優化
10.5本地模式
10.6並行執行
10.7嚴格模式
10.8調整mapper和reducer個數
10.9JVM重用
10.10索引
10.11動態分區調整
10.12推測執行
10.13單個MapReduce中多個GROUPBY
10.14虛擬列
1章其他文件格式和壓縮方法
11.1確定安裝編解碼器
11.2選擇一種壓縮編/解碼器
11.3開啟中間壓縮
11.4最終輸出結果壓縮
11.5sequencefile存儲格式
11.6使用壓縮實踐
11.7存檔分區
11.8壓縮:包扎
……
2章開發
3章函數
4章Streaming
5章自定義Hive文件和記錄格式
6章Hive的Thrift服務
7章存儲處理程序和NoSQL
8章安全
9章鎖
第20章Hive和Oozie整合
第21章Hive和亞馬遜網絡服務繫統(AWS)
第22章HCatalog
第23章案例研究
術語詞彙表