作 者:潘風文、潘啟儒 著 著
定 價:89
出 版 社:化學工業出版社
出版日期:2019年08月01日
頁 數:296
裝 幀:簡裝
ISBN:9787122342584
一本書搞懂PMML-----可預測模型標記語言,輕松構建數據挖掘模型
●1 XML基礎11.1 XML的發展、技術體繫及應用21.1.1 標記語言和SGML21.1.2 XML的特點和應用41.1.3 XML技術體繫51.1.4 基於XML的應用標準簡介151.2 XML文檔結構241.2.1 XML文檔頭部251.2.2 XML文檔正文301.3 XML Schema351.3.1 XML Schema文檔結構361.3.2 XML Schema數據類型401.3.3 &nb素內容571.3.4 屬性組611.3.5 定義和使用實體641.3.6 注釋651.3.7 構建內容模型661.4 命名空間691.4.1 目標命名空間和非限定本地聲明701.4.2 限定本地聲明731.4.3 全局和局部聲明761.4.4 未聲明的目標命名空間771.5 XML文檔驗證781.6 XML Schema使用案例791.6.1 XML處理庫lxml的安裝801.6.2 使用lxml創建XML文檔801.6.3 使用lxml解析XML文檔851.6.4 使用lxml驗證XML文檔88本章小結912 數據挖掘與PMML932.1 數據挖掘簡介942.2 數據挖掘流程標準952.3 數據挖掘繫統992.4 PMML的出現101本章小結1033 PMML基礎知識1043.1 PMML概述1053.2 PMML文檔結構1073.2.1 頭部Header1103.2.2 挖掘任務MiningBuildTask1123.2.3 數據字典DataDictionary1133.2.4 轉換字典TransformationDictionary1273.2.5 MODEL-ELEMENT序列1763.2.6 擴展Extension1783.3 PMML規範中的命名規則1803.4 PMML規範中的數據類型1803.4.1 基本數據類型1803.4.2 簡單數組類型1823.4.3 稀疏數組類型1843.4.4 矩陣類型1863.5 變量的作用範圍1893.6 非評分模型193本章小結1944 模型的輸入和輸出1954.1 &nb素MiningSchema1964.2 模型目標變量集合2014.2.1 目標素Targets2024.2.2 目素Target2034.2.3 目標素Targetvalue2044.2.4 實例介紹2054.3 模型輸出變量集合2064.3.1 結素Output2074.3.2 輸素OutputField2114.3.3 素Decisions2144.3.4 模型輸出結果表2144.3.5 實例介紹216本章小結2195 模型的統計信息2205.1 &nb素UnivariateStats2215.1.1  素Counts2225.1.2 數素NumericInfo2235.1.3 離散變素DiscrStats2255.1.4 連續變素ContStats2265.1.5 實例介紹2275.2 單因素方素Anova2285.2.1 單因素方素Anova的定義2295.2.2 方差分析2305.2.3 實例介紹2325.3 &nb素 ltivariateStats2345.4  素Partition237本章小結2416 模型驗證2426.1 模素ModelVerification2436.2 模型驗證規則2456.3 實例介紹249本章小結2557 模型解釋2567.1 單變素UnivariateStats2587.2  素Partition2587.3 預測模型質素PredictiveModelQuality2587.4 聚類模型質素ClusteringModelQuality2627.5 混淆矩陣2637.5.1 混淆矩陣基本知識2637.5.2 混素ConfusionMatrix2657.6 接收者操作特征曲線ROC2677.6.1 ROC基本知識2677.6.2 RO素ROC2697.7 增益/提升圖2717.7.1 增益2727.7.2 提升度2727.7.3 素ModelLiftGraph2747.8 字段(變量)相關性指標282本章小結2858 PMML實際案例2878.1 構建PMML實例文檔2898.2 使用PMML實例文檔294
本書結合實際案例介紹了PMML語言的各素,包括數據字典、挖掘模式/架構、數據轉換、模型定義、輸出、目標、模型解釋、模型素,並介紹了表述數據挖掘模型的PMML實例文檔創建流程;同時也對各種P素中涉及的一些統計知識做了必要介紹。通過學習,讀者可以完整地了解和掌握PMML語言,將其應用於數據挖掘建模。本書可供從事數據挖掘(機器學習)、人工智能繫統開發的軟件開發者和愛好者學習使用,也可以作為高等院校大數據等相關專業的教材。
潘風文、潘啟儒 著 著
無