![內容虛線](http://img.alicdn.com/imgextra/i4/101450072/TB2uhKJhB0kpuFjSsppXXcGTXXa-101450072.png)
內容簡介
![size="789x11"](http://img.alicdn.com/imgextra/i2/101450072/TB2LvCmhxXkpuFjy0FiXXbUfFXa-101450072.png)
MADlib是一套SQL中的大數據機器學習庫。通常SQL查詢能發現數據很明顯的模式和趨勢,但要想獲取數據中很為有用的信息,需要的則是一套牢固扎根於數學和應用數學的技能,這就是機器學習。如果將SQL的簡單易用與MADlib機器學習的復雜算法結合起來,就能實現簡單的機器學習功能。 本書分為11章,從MADlib的基本概念、MADlib的架構、支持的模型類型與功能入手,詳細解析MADlib各種模型的具體用法,包括數據類型、矩陣分解、數據轉換、數據探索、主成分分析、回歸、時間序列分析、分類、聚類、關聯規則、圖算法、模型評估等。每種模型將從背景知識、函數語法、應用示例三方面進行 說明。 本書適合MADlib機器學習的初學者、想學習MADlib機器學習的DBA以及從事數據分析與挖掘的不錯技術人員閱讀,也適合高等院校與培訓學校相關專業的師生教學參考。