作 者:葛維春 著
定 價:79
出 版 社:清華大學出版社
出版日期:2018年10月01日
頁 數:397
裝 幀:平裝
ISBN:9787302517207
《大數據處理與存儲技術》歸納和總結了主流數據庫軟件和常用數據處理工具的常見問題與應用技巧,為大數據技術與傳統數據存儲和轉換技術相結合提供了技術參考,為促進大數據技術的發展,為數據庫和ETL開發人員、運維人員提供了技術支撐。
●第一篇 數據庫軟件篇第1章 Oracle數據庫應用 2 1.1 Oracle簡介 ·31.1.1 產品歷史 31.1.2 支撐的平臺 41.1.3 數據庫特點 4 1.2 安裝配置 51.2.1 安裝環境 51.2.2 繫統配置 51.2.3 Oracle安裝 ·8 1.3 數據庫函數 201.3.1 常用函數 201.3.2 數字函數 211.3.3 預定義函數 221.3.4 字符函數 231.3.5 日期函數 26 1.4 常用查詢命令 29 1.5 常見問題參考 471.5.1 事務處理 471.5.2 索引 491.5.3 觸發器 53大數據處理與存儲技術1.5.4 存儲過程 531.5.5 參數設置 551.5.6 消息號 821.5.7 表級操作 861.5.8 鎖操作 921.5.9 歸檔的開啟與關閉 931.5.10 數據的導入與導出 941.5.11 其他 94第2章 MySQL數據庫應用102 2.1 MySQL簡介 ·1032.1.1 產品歷史 1032.1.2 應用環境 1042.1.3 數據庫特點 105 2.2 安裝配置 106 2.3 數據庫函數 1072.3.1 數學函數 1072.3.2 字符串函數 1102.3.3 日期函數 1142.3.4 條件判斷函數 1182.3.5 繫統信息函數 1192.3.6 加密函數 1202.3.7 其他函數 121 2.4 常見問題參考 1222.4.1 數據庫創建 1222.4.2 數據庫刪除 1232.4.3 數據庫連接 1232.4.4 數據表操作 1252.4.5 索引操作 1272.4.6 其他 127目 錄VII第二篇 ETL工具篇第3章 Informatica PowerCenter工具應用 132 3.1 Informatica簡介 ·133 3.2 安裝配置 1333.2.1 準備安裝環境 1333.2.2 Informatica軟件安裝 ·137 3.3 常見問題參考 1443.3.1 軟件安裝 1443.3.2 軟件啟動 1443.3.3 目標庫表 1453.3.4 數據庫連接 1473.3.5 組件應用 1483.3.6 其他 149第4章 Kettle工具應用 150 4.1 Kettle簡介 151 4.2 安裝配置 151 4.3 常見問題 1524.3.1 連接資源庫報錯 1524.3.2 日志級別設置 ·1534.3.3 時間格式問題 1534.3.4 打開資源庫後頁面空白 1534.3.5 Kettle連接Oracle報錯 ·153第三篇 高級調優篇第5章 數據庫調優與ETL工具應用技巧 156 5.1 Oracle調優 1575.1.1 優選限度使用索引 157大數據處理與存儲技術5.1.2 SQL優化 1625.1.3 hint用法 ·170 5.2 MySQL調優 ·1755.2.1 優選限度使用索引 1755.2.2 優化提升 179 5.3 Informatica應用技巧 1945.3數據解析 1945.3.2 資料庫操作 209附錄A Oracle錯誤信息表 ·213附錄B MySQL錯誤信息表 ·287附錄C PowerCenter錯誤信息表 ·310
本書歸納和總結了主流數據庫軟件和常用數據處理工具的常見問題與應用技巧,為大數據技術與傳統數據存儲和轉換技術相結合提供了技術參考,為促進大數據技術的發展,為數據庫和ETL開發人員、運維人員提供了技術支撐。本書分為3篇,共5章,主要內容包括Oracle數據庫應用、MySQL數據庫應用、Informatica PowerCenter工具應用、Kettle工具應用、數據庫調優與ETL工具應用技巧。本書分別從數據存儲軟件、數據抽取與清洗軟件等方面,向讀者展示了Oracle、MySQL、Informatica和Kettle的常見問題、優化與提升的技巧。本書所涉及的內容均為生產實踐中必要的過程和階段,講解由淺入深、通俗易懂,適合從事數據庫開發、維護、管理、優化任務和高可用設計的工程技術人員及從事ETL開發、優化的工程技術人員使用或參考。
第3章Informatica PowerCenter工具應用本章從Informatica PowerCenter簡介、安裝配置、常見問題參考等方面,介紹Informatica PowerCenter的產品特點、常見問題及解決技巧。 ●Informatica PowerCenter簡介 ●安裝配置 ●常見問題參考 3.1 Informatica簡介 Informatica PowerCenter是Informatica公司開發的重量的企業數據集成平臺,也是業界領先的ETL工具。Informatica PowerCenter使用戶能夠方便地從異構的已有繫統和數據源中抽取數據,用來建立、部署、管理企業的數據倉庫,從而幫助企業做出快速、正確的決策。此產品為滿足企業級要求而設計,可以提供企業部門的數據和電子商務數據源之間的集成,如XML、網站日志、關繫等
關於本書“大數據”是當前最熱門的話題之一,雖然其實現技術多種多樣,但是其應用和實踐依然是基於大量實際業務數據的。本書從數據存儲和數據清洗與轉換的角度出發,針對當前主流數據庫軟件(Oracle、MySQL)和主流ETL工具(Informatica PowerCenter、Kettle)的常見問題、應用技巧進行歸納和總結,為大數據技術與傳統數據存儲技術和數據轉換技術相結合提供技術參考,促進大數據技術的發展,為數據庫和ETL開發人員、運維人員提供技術支撐。本書內容主要來源於項目實踐,如有不當之處,懇請讀者批評指正,部分支撐材料來源於網絡,如涉及版權問題請相關作者及時聯繫溝通,聯繫方式:838743142@qq.com。本書的讀者群體本書的目標讀者是從事數據庫開發、維護、管理、優化任務和高可用設計的工程技術人員和從事ETL開發、優化的工程技術人員。從技術角度看,本書涉及的內容均為生產實踐中必要的過等