了得網研究生_數據挖掘：方法與應用（數據分析繫列教材）

商品搜索

类别：

关键字：

商品分类

數據挖掘：方法與應用（數據分析繫列教材）
該商品所屬分類：研究生 -> 工學
【市場價】	254-368元
【優惠價】	159-230元
【作者】	呂曉玲，謝邦昌　編著
【所屬類別】	圖書教材研究生/本科/專科教材工學
【出版社】	中國人民大學出版社有限公司
【ISBN】	9787300099705
【折扣說明】	一次購物滿999元台幣免運費+贈品一次購物滿2000元台幣95折+免運費+贈品一次購物滿3000元台幣92折+免運費+贈品一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】	①優質無紡布環保袋，做工棒！②品牌簽字筆 ③品牌手帕紙巾

版本	正版全新電子版PDF檔
您已选择：	正版全新
溫馨提示：如果有多種選項，請先選擇再點擊加入購物車。 . 電子圖書價格是0.69折，例如了得網價格是100元，電子書pdf的價格則是69元。 . 購買電子書不支持貨到付款，購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意，可以聯絡我們退款。謝謝。

內容介紹

開本：16開

紙張：膠版紙

包裝：平裝

是否套裝：否

國際標準書號ISBN：9787300099705

叢書名：數據分析繫列教材

作者：呂曉玲，謝邦昌編著

出版社：中國人民大學出版社有限公司

出版時間：2009年01月

內容簡介

隨著信息技術的飛速發展，數據的產生和存儲達到了空前繁榮的階段。如何從海量的數據中提取潛在的有用信息，給傳統的數據處理技術提出了嚴峻的考驗，數據挖掘方法應運而生。數據挖掘是一個多學科的交叉研究領域，不僅大學裡的學術人員在研究它，商業公司的專家和技術人員也在密切地關注它和使用它；它不僅涉及人工智能領域以及統計學的應用，而且涉及數據庫的管理和使用。從技術上來講，數據挖掘是從大量的、不完全的、有噪聲的、模糊的、*的實際應用數據中，提取隱含在其中的、人們事先不知道的，但又潛在有用的信息和知識的過程。從商業應用來講，數據挖掘是一種新的商業信息處理技術，其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模式化的處理，從中提取輔助商業決策的關鍵性數據。
本書第1章對數據挖掘進行了概述，包括數據挖掘的定義、重要性、功能、步驟和常用方法等。第2章和第3章介紹了兩種數據挖掘中常用的指導的學習算法、關聯規則和聚類分析，它們處理的數據的特點是沒有獨立的需要預測或分類的變量，而隻是試圖從數據中發現一些固有的模式。關聯規則就是要發現兩個或多個事物之間的聯繫；聚類分析就是要把數據中具有相似性質的放在一類，而不同類之間盡量做到有較大的不同。第4章和第5章介紹了兩種數據挖掘中常用的指導的學習算法、決策樹和神經網絡。它們處理的數據含有獨立的需要預測或隨著信息技術的飛速發展，數據的產生和存儲達到了空前繁榮的階段。如何從海量的數據中提取潛在的有用信息，給傳統的數據處理技術提出了嚴峻的考驗，數據挖掘方法應運而生。數據挖掘是一個多學科的交叉研究領域，不僅大學裡的學術人員在研究它，商業公司的專家和技術人員也在密切地關注它和使用它；它不僅涉及人工智能領域以及統計學的應用，而且涉及數據庫的管理和使用。從技術上來講，數據挖掘是從大量的、不完全的、有噪聲的、模糊的、*的實際應用數據中，提取隱含在其中的、人們事先不知道的，但又潛在有用的信息和知識的過程。從商業應用來講，數據挖掘是一種新的商業信息處理技術，其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模式化的處理，從中提取輔助商業決策的關鍵性數據。
本書第1章對數據挖掘進行了概述，包括數據挖掘的定義、重要性、功能、步驟和常用方法等。第2章和第3章介紹了兩種數據挖掘中常用的指導的學習算法、關聯規則和聚類分析，它們處理的數據的特點是沒有獨立的需要預測或分類的變量，而隻是試圖從數據中發現一些固有的模式。關聯規則就是要發現兩個或多個事物之間的聯繫；聚類分析就是要把數據中具有相似性質的放在一類，而不同類之間盡量做到有較大的不同。第4章和第5章介紹了兩種數據挖掘中常用的指導的學習算法、決策樹和神經網絡。它們處理的數據含有獨立的需要預測或
分類的變量，它們的目的就是尋找一些自變量的函數或算法對數據進行準確的預測或分類。決策樹方法在對數據處理的過程中，將數據按照樹狀結構分成若干分枝形成決策規則；神經網絡在一定程度上模仿了人腦神經繫統處理信息，存儲以及檢索的功能，它是一個非線性的映射繫統。第6章和第7章介紹了兩種數據挖掘中常用的傳統統計的方法，回歸分析和時間序列。回歸分析是尋找自變量和因變量之間關繫的預測模型，包括線性回歸和Logistic回歸；時間序列分析，顧名思義，是處理以時間為序的觀測數據的方法。本書的一個特點是不僅對上述方法作了理論的闡述，還結合案例分析講述了如何應用STATISTICA軟件實現上述方法對數據的分析，是一本理論和實踐相結合的理論性和應用性都很強的書。

第1章數據挖掘概述
1.1 數據挖掘定義
1.1.1 數據挖掘的技術定義
1.1.2 數據挖掘的商業定義
1.2 數據挖掘的重要性及意義
1.3 數據挖掘功能
1.4 數據挖掘步驟和標準
1.4.1 數據挖掘步驟
1.4.2 數據挖掘需要的人員
1.5 數據挖掘常用方法
1.5.1 數據挖掘的對像
1.5.2 數據挖掘的常用方法
練習題
第2章關聯規則第1章數據挖掘概述
1.1 數據挖掘定義
1.1.1 數據挖掘的技術定義
1.1.2 數據挖掘的商業定義
1.2 數據挖掘的重要性及意義
1.3 數據挖掘功能
1.4 數據挖掘步驟和標準
1.4.1 數據挖掘步驟
1.4.2 數據挖掘需要的人員
1.5 數據挖掘常用方法
1.5.1 數據挖掘的對像
1.5.2 數據挖掘的常用方法
練習題
第2章關聯規則
2.1 關聯規則介紹
2.2關聯規則種類
2.2.1 一般意義上的關聯規則
2.2.2 帶有時間性的序列關聯分析
2.3 關聯規則算法
2.3.1 普通的關聯規則算法
2.3.2 序列關聯規則算法
2.4 S7ATISTICA中的關聯規則
2.5 案例分析
練習題
第3章聚類分析
3.1 聚類分析介紹
3.2 距離定義
3.2.1 點之間的距離
3.2.2 類之間的距離
3.3 聚類分析算法
3.3.1 層次聚類
3.3.2 基於劃分的聚類
3.3.3 EM聚類
3.4 STATISTICA中的聚類分析
3.5 案例分析
練習題
第4章決策樹建模
4.1 決策樹介紹
4.1.1 決策樹的基本知識
4.1.2 決策樹的應用和發展趨勢
4.2 樹的建模過程
4.2.1 數據要求
4.2.2 樹的生長
4.2.3 有效性和風險性
4.2.4 屬性選擇
4.3 S7ATISTICA中的決策樹
4.4 案例分析
練習題
第5章神經網絡建模
5.1 神經網絡介紹
5.2 神經網絡的基本概念和原理
5.2.1 基本
5.2.2 神經網絡的訓練過程
5.2.3 基本的神經網絡模型
5.3 STATISTICA中的神經網絡模型
5.4 案例分析
練習題
第6章回歸分析
6.1 回歸分析介紹
6.2 線性回歸模型
6.2.1 模型的建立及未知參數的估計
6.2.2 回歸方程與回歸參數的檢驗及變量的選擇問題
6.2.3 回歸診斷和決定繫數
6.3 1ogistic回歸模型
6.3.1 1ogistic回歸模型的建立
6.3.2 1ogistic回歸模型的參數估計
6.3.3 1ogistic回歸模型的檢驗及診斷
6.3.4 1ogistic回歸模型結果的解釋
6.3.5 1ogistic回歸模型的擴展
6.4 STATISTICA中的回歸
6.5 案例分析
練習題
第7章時間序列
7.1 時間序列介紹
7.2 時間序列算法
7.2.1 傳統時間序列分析
7.2.2 ARIMA模型
7.3 STATISTICA中的時間序列
7.4 案例分析
練習題
參考文獻

在線試讀

第1章數據挖掘概述
1.1數據挖掘定義
數據挖掘是一個多學科交叉研究領域，不僅大學裡的專門研究人員在使用它，商業公司的專家和技術人員也在密切地關注它；它不僅涉及人工智能領域以及統計學的應用，而且也涉及數據庫的使用。不同領域的人從不同的研究背景出發研究不同行業的數據，也就給了數據挖掘不同的內容和定義。這裡我們就數據挖掘的技術定義以及商業定義展開討論。
1.1數據挖掘的技術定義
數據挖掘（data mining，DM）就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中．提取隱含在其中的、人們事先不知道的，但又是潛在有用的信息和知識的過程。與數據挖掘相近的同義詞有數據融合、數據分析和決策支持等。
這個定義包括以下幾層含義：
（1）數據源必須是真實的、大量的、含噪聲的；
（2）發現的是用戶感興趣的知識；
（3）發現的知識要可接受、可理解、可運用；
……

網友評論我們期待著您對此商品發表評論

相關商品

商品搜索

商品分类

【醫學】

【各大出版社】