●目 錄 章 SPSS軟件概述11.1 SPSS簡介11.2 SPSS操作入門21.2.1 軟件安裝、啟動及退出31.2.2 操作環境41.2.3 繫統參數的設置71.3 SPSS的幫助繫統15第2章 SPSS數據挖掘繫統172.1 數據挖掘概述172.1.1 數據挖掘的含義172.1.2 數據挖掘與OLAP182.1.3 數據挖掘和統計學182.1.4 數據挖掘的目的192.1.5 數據挖掘應用192.1.6 數據挖掘流程192.2 成功的數據挖掘202.2.1 CRISP-DM方法論212.2.2 選擇數據挖掘工具252.2.3 SPSS數據挖掘262.3 SPSS數據挖掘的過程292.3.1 商業理解292.3.2 數據理解292.3.3 數據準備292.3.4 數據模型302.3.5 評估302.3.6 部署31第3章 數據文件、變量與函數333.1 SPSS的變量類型333.1.1 數據的輸入343.1.2 變量的編輯353.2 數據文件的打開和保存363.2.1 打開SPSS數據文件373.2.2 打開其他格式的數據文件373.2.3 數據文件保存383.3 SPSS函數383.3.1 算術函數393.3.2 統計函數393.3.3 邏輯函數403.3.4 日期和時間函數403.3.5 隨機變量函數423.3.6 反分布函數433.3.7 累計分布函數443.3.8 缺失值函數463.3.9 字符串函數47第4章 數據預處理494.1 數據文件的整理494.1.1 個案排序(Sort Case)過程504.1.2 轉置(Transpose)過程504.1.3 合並文件(Merge File)過程514.1.4 彙總(Aggregate)過程534.1.5 拆分文件(Split File)過程554.1.6 選擇個案(Select Cases)過程554.1.7 個案加權(Weight Cases)過程564.2 數據變量的變換和計算564.2.1 計算變量(Compute Variables)過程574.2.2 計數(Count)過程594.2.3 重新編碼(Recode)過程604.2.4 個案排秩(Rank Cases)過程614.2.5 自動重新編碼(Automatic Recode)過程63第5章 基本統計分析655.1 基本概念655.1.1 基本的統計概念655.1.2 描述性統計分析675.2 頻率分析685.2.1 頻率分析過程的操作界面685.2.2 實例分析705.3 描述性統計分析過程725.3.1 描述性統計分析過程參數設置725.3.2 實例分析725.4 數據探索性分析過程745.4.1 數據探索性分析過程參數設置745.4.2 實例分析755.5 交叉表分析過程785.5.1 交叉表過程的參數設置785.5.2 實例分析81第6章 參數檢驗846.1 參數估計和假設檢驗概述846.1.1 參數估計846.1.2 假設檢驗876.2 平均值(Means)過程926.2.1 SPSS的平均值過程參數的設置926.2.2 平均值過程實例936.3 單樣本t檢驗946.3.1 單樣本t檢驗過程的參數設置946.3.2 實例分析956.4 獨立樣本t檢驗976.4.1 獨立樣本t檢驗過程的參數設置976.4.2 實例分析986.5 成對樣本t檢驗1006.5.1 成對樣本t檢驗過程的參數設置1006.5.2 實例分析100第7章 基本圖形的繪制1037.1 統計圖概述1037.2 條形圖1047.3 折線圖1087.4 面積圖1107.5 餅圖1117.5.1 餅圖參數設置1117.5.2 實例分析1127.6 高低圖1137.7 質量控制圖1147.8 箱圖1197.8.1 箱圖參數設置1197.8.2 實例分析1207.9 散點圖1217.9.1 散點圖參數設置1227.9.2 實例分析1227.10 直方圖1247.11 P-P圖和Q-Q圖1247.12 時間序列圖1267.12.1 時間序列圖參數設置1267.12.2 實例分析130第8章 非參數檢驗1338.1 非參數檢驗概述1338.2 檢驗1348.2.1 檢驗的參數設置1358.2.2 檢驗實例分析1378.3 二項分布檢驗1398.3.1 二項分布檢驗的參數設置1398.3.2 實例分析1398.4 遊程檢驗1418.4.1 遊程檢驗的參數設置1428.4.2 實例分析1428.5 單樣本K-S檢驗1448.5.1 單樣本K-S檢驗的參數設置1448.5.2 實例分析1458.6 兩獨立樣本分布位置檢驗1478.6.1 兩獨立樣本分布位置檢驗的參數設置1488.6.2 實例分析1488.7 多個獨立樣本分布位置檢驗1508.7.1 多個獨立樣本分布位置檢驗的參數設置1508.7.2 實例分析1518.8 兩個相關樣本分布位置檢驗1538.8.1 兩個相關樣本分布位置檢驗的參數設置1538.8.2 實例分析1548.9 多個相關樣本分布位置檢驗1558.9.1 多個相關樣本分布位置檢驗的參數設置1568.9.2 實例分析156第9章 方差分析1599.1 方差分析的基本原理1599.1.1 自由度與平方和分解1609.1.2 F檢驗1629.1.3 多重比較1639.2 單因素ANOVA檢驗1649.2.1 單因素ANOVA檢驗步驟1659.2.2 判斷與結論1669.2.3 單因素 ANOVA檢驗過程的參數設置1679.2.4 實例分析1699.3 多因素方差分析1709.3.1 隻考慮主效應的多因素方差分析1719.3.2 存在交互效應的多因素方差分析1739.3.3 單變量過程參數設置1759.3.4 實例分析1799.4 協方差分析1839.4.1 協方差分析概述1839.4.2 實例分析1840章 回歸分析18710.1 線性回歸18710.1.1 線性回歸模型18810.1.2 最小二乘估計18810.1.3 回歸方程的顯著性檢驗18910.1.4 預測問題19110.1.5 SPSS線性回歸分析設置19210.1.6 回歸分析模型的實例分析19610.2 非線性回歸19910.2.1 非線性回歸分析的基本原理 20010.2.2 非線性回歸參數設置20010.2.3 實例分析20310.3 Logistic回歸20510.3.1 Logistic回歸模型概述20610.3.2 Logistic回歸模型參數 設置20710.3.3 實例分析2101章 相關分析21511.1 相關分析概述21511.1.1 相關關繫21511.1.2 相關圖形和相關繫數21611.1.3 SPSS的相關分析功能簡介 21811.2 雙變量(Bivariate)過程21811.2.1 雙變量相關分析簡介21811.2.2 雙變量過程的參數設置22011.2.3 實例分析22211.3 偏相關(Partial)過程22411.3.1 偏相關過程的參數設置22411.3.2 實例分析22511.4 Distances(距離)過程22711.4.1 Distances過程的距離分析 參數設置22711.4.2 實例分析2302章 聚類分析23212.1 聚類分析的原理23212.1.1 一般原理23312.1.2 聚類分析步驟23612.1.3 繫統聚類方法23712.2 快速樣本聚類過程24012.2.1 快速聚類簡介24012.2.2 SPSS快速聚類的設置24012.2.3 實例分析24212.3 繫統聚類過程24612.3.1 繫統聚類簡介24612.3.2 SPSS繫統聚類設置24612.3.3 實例分析24912.4 二階聚類分析25212.4.1 二階聚類簡介25212.4.2 SPSS二階聚類的設置25312.4.3 實例分析2543章 判別分析25713.1 判別分析的基本原理25713.1.1 判別分析簡介25713.1.2 判別分析的數學模型與判別 方法25813.2 一般判別分析26513.2.1 一般判別分析的參數設置 26513.2.2 實例分析26713.3 逐步判別分析27213.3.1 逐步判別的參數設置27213.3.2 實例分析2734章 因子分析27914.1 因子分析簡介27914.1.1 因子分析的基本原理28014.1.2 因子分析的基本步驟和過程 28214.2 SPSS因子分析28314.2.1 SPSS因子分析的參數設置 28314.2.2 實例分析2865章 對應分析29115.1 對應分析的基本原理29115.2 對應分析29315.2.1 對應分析過程的參數設置 29315.2.2 實例分析29615.3 很優標度過程29915.3.1 很優標度過程的參數設置 29915.3.2 實例分析3066章 可靠性和多維標度分析31016.1 可靠性分析31016.1.1 可靠性分析的基本原理31016.1.2 可靠性分析的參數設置31216.1.3 實例分析31416.2 多維標度分析31616.2.1 多維標度分析簡介31616.2.2 多維標度過程的參數設置 31716.2.3 實例分析3207章 生存分析32317.1 生存分析簡介32317.1.1 生存分析的基本概念32317.1.2 生存資料的特點32517.1.3 生存分析方法32617.1.4 SPSS中的生存分析過程 32617.2 壽命表(Life Tables)過程32717.2.1 壽命表分析過程的參數設置 32717.2.2 實例分析32817.3 Kaplan-Meier分析33217.3.1 Kaplan-Meier分析過程的參數 設置33217.3.2 實例分析33417.4 Cox模型回歸分析33717.4.1 Cox回歸模型33717.4.2 Cox模型分析過程的參數設置 33917.4.3 實例分析3438章 對數線性模型34818.1 對數線性模型概述34818.2 常規模型(General)過程34918.2.1 常規模型分析過程的參數 設置34918.2.2 實例分析35118.3 分對數(Logit)過程35418.3.1 分對數分析過程的參數設置 35418.3.2 實例分析35718.4 選擇模型(Model Selection)過程36018.4.1 選擇模型分析過程的參數 設置36018.4.2 實例分析3629章 時間序列分析36519.1 時間序列概述36519.1.1 時間序列的組成部分36519.1.2 時間序列的數學模型36619.1.3 時間序列的分析步驟36819.1.4 SPSS時間序列分析功能 36819.2 時間序列數據的預處理37519.2.1 缺失值替換37519.2.2 定義時間變量37619.2.3 時間序列預測的平穩化37619.3 指數平滑模型過程37719.3.1 指數平滑的基本原理37719.3.2 指數平滑模型分析過程的 參數設置38019.3.3 實例分析38119.4 ARIMA模型38619.4.1 ARIMA模型的基本原理 38619.4.2 ARIMA模型分析過程的參數 設置38919.4.3 實例分析39019.5 季節性分解模型39419.5.1 季節性分解模型分析過程的 參數設置39419.5.2 實例分析395第20章 缺失值分析39920.1 缺失值理論概述39920.1.1 數據缺失方式40020.1.2 缺失值處理方法40020.2 SPSS缺失值分析40420.2.1 缺失值分析過程的參數設置40420.2.2 實例分析408第21章 決策樹模型41421.1 決策樹模型概述41421.1.1 CHAID算法41621.1.2 Exhaustive CHAID算法 41721.1.3 CRT算法41721.1.4 QUEST算法41821.2 決策樹的參數設置41821.2.1 變量設置41821.2.2 類別(Categories)設置 41921.2.3 輸出(Output)設置42021.2.4 驗證(Validation)設置42221.2.5 保存(Save)設置42321.2.6 條件(Criteria)設置42421.2.7 CHAID算法設置42521.2.8 CRT算法設置42521.2.9 QUEST算法設置42621.2.10 修剪(Pruning)設置42621.2.11 替代變量(Surrogates)設置 42721.2.12 選項(Options)設置42721.2.13 錯誤分類成本設置42821.2.14 利潤(Profits)設置42821.2.15 先驗概率(Prior Probabilities)設置42921.2.16 實例分析43021.2.17 模型建立43021.2.18 模型評估432第22章 神經網絡43922.1 神經網絡概述43922.1.1 歷史及現狀44022.1.2 神經網絡特點44122.1.3 模型44222.1.4 神經網絡模型44322.1.5 神經網絡的學習規則44322.1.6 SPSS神經網絡模型44422.2 SPSS神經網絡模型的設置44722.2.1 多層感知器(MLP)分析 過程的參數設置44722.2.2 徑向基函數(RBF)分析過程 的參數設置45422.3 實例分析45622.3.1 參數設置45722.3.2 結果分析459第23章 信用風險分析46423.1 信用風險概述46423.1.1 信用風險基本概念46423.1.2 信用風險度量方法46523.1.3 SPSS中信用風險分析模塊 46823.2 實例分析46823.2.1Logistic分析過程46823.2.2 決策樹分析過程47423.2.3 判別式分析過程479第24章 SPSS在社會經濟 綜合評價中 的應用48424.1 沿海省市經濟綜合指標的主成分 分析48424.2 中國內地城鎮居民消費結構的聚類 分析48824.3 我國內地可支配收入和消費性支出 之間的回歸分析492
本書基於SPSS 24.0編寫,在修正並完善第2版的基礎上完成的;每章均有大量分析案例,結合案例對SPSS各模塊的統計分析功能和圖形功能進行詳細講解。本書具體內容為SPSS簡介、SPSS數據挖掘繫統介紹、數據文件管理、數據預處理、基本統計分析、多重反應分析、均值的比較與檢驗、統計圖制作、參數檢驗、回歸分析、方差分析、相關分析、聚類分析、判別分析、因子分析、對應分析、信度分析、生存分析、對數線性模型、時間序列分析、缺失值分析,以及SPSS在財務智能、數據預測、股市分析、社會經濟分析、金融數據分析等方面的數據挖掘應用。 本書優選特點是拋棄了其他同類書籍中隻介紹理論用法、缺乏案例分析的弊端,全書給出大量數據挖掘分析案例,並配有視頻講解,為讀者展示SPSS在數據分析、信用風險管理、直銷分析、社會經濟分析等實際項目中的應用。