●緒論001
●章走進Hive003
●1.1Hive簡介003
●1.1.1Hive發展史003
●1.1.2體繫結構004
●1.2Hive的安裝部署005
●1.2.1安裝配置Hive005
●1.2.2啟動Hive008
●1.3Hive命令009
●1.3.1Hive命令行選項009
●1.3.2CLI命令行界面010
●1.3.3Hive中CLI命令的快速編輯011
●1.3.4Hive中的腳本011
●1.3.5dfs命令的執行013
●1.4數據類型和文件格式014
●1.4.1基本數據類型014
●1.4.2集合數據類型015
●1.4.3文本文件數據編碼016
●本章小結018
●習題018......
內容簡介
本書基於開源Hadoop大數據生態圈的主流離線分析工具Hive和Pig,通過技術講解和案例實戰相結合的方式,介紹了海量數據離線分析的技術方法。本書內容主要包括Hive數據庫表、基於HiveQL的常規操作、視圖、索引和Pig等數據處理分析和基礎工具知識,Hive函數、Pig Latin編程、ETL工具Sqoop和工作流引擎Oozie等相關不錯技術,以及實際項目案例。
本書既可供學習大數據離線分析技術的本科和高職高專學生作為教材,也可供從事數據分析相關工作的技術人員作為參考資料。