●第1章 MADlib基礎
● 1.1 基本概念
● 1.1.1 MADlib是什麼
● 1.1.2 MADlib的設計思想
● 1.1.3 MADlib的工作原理
● 1.1.4 MADlib的執行流程
● 1.1.5 MADlib架構
● 1.2 MADlib的功能
● 1.2.1 MADlib支持的模型類型
● 1.2.2 MADlib的主要功能模塊
● 1.3 MADlib的安裝與卸載
● 1.3.1 確定安裝平臺
● 1.3.2 下載MADlib二進制壓縮包
● 1.3.3 安裝MADlib
● 1.3.4 卸載MADlib
● 1.4 小結
●第2章 數據類型
● 2.1 向量
● 2.1.1 MADlib中的向量操作函數
● 2.1.2 稀疏向量
●部分目錄
MADlib是一套SQL中的大數據機器學習庫。通常SQL查詢能發現數據最明顯的模式和趨勢,但要想獲取數據中最為有用的信息,需要的則是一套牢固扎根於數學和應用數學的技能,這就是機器學習。如果將SQL的簡單易用與MADlib機器學習的復雜算法結合起來,就能實現簡單的機器學習功能。本書分為11章,從MADlib的基本概念、MADlib的架構、支持的模型類型與功能入手,詳細解析MADlib各種模型的具體用法,包括數據類型、矩陣分解、數據轉換、數據探索、主成分分析、回歸、時間序列分析、分類、聚類、關聯規則、圖算法、模型評估等。每種模型將從背景知識、函數語法、應用示例三方面進行 說明。本書適合MADlib機器學習的初學者、想學習MADlib機器學習的DBA以及從事數據分析與挖掘的高級技術人員閱讀,也適合高等院校與培訓學校相關專業的師生教學參考。