●目?錄第1章?R的基本介紹11.1?強大的R11.2?R語言在大數據中的應用21.2.1?R語言用戶行為分析21.2.2?R語言處理金融大數據31.2.3?R語言天氣數據可視化41.2.4?R語言醫療大數據分析41.3?R的安裝與啟動51.3.1?安裝並啟動R61.3.2?安裝並啟動一個IDE71.4?R的向量、矩陣和數組81.4.1?向量的操作方法和固有屬性81.4.2?矩陣的操作和運算101.4.3?數組中的維度函數131.5?R的列表和數據框141.5.1?列表的特性和編輯方法141.5.2?數據框的創建和基本操作171.6?R數據文件的載入和載出191.6.1?結構化純文本文件的讀取和輸出191.6.2?其他文件的讀取和輸出221.7?向R中安裝包23第2章?原始數據的探索與預處理262.1?度量數據集的集中程度262.2?度量數據集的分散程度272.2.1?極值、方差和標準差272.2.2?標準誤和偏度繫數、峰度繫數292.3?創建一個數值摘要表302.4?異常值的觀測與說明322.4.1?利用箱線圖觀測異常值並處理322.4.2?異常值檢測的其他情況和說明342.5?缺失值的填補與處理352.5.1?刪除缺失值或對其進行簡單填補362.5.2?按照相關性對空缺值進行填補38第3章?R的數據可視化403.1?plot()函數和常用的圖形參數403.1.1?設置plot()函數中的參數403.1.2?修改散點圖的坐標並加入標注433.2?經典的基礎圖形及用途453.2.1?線圖453.2.2?直方圖493.2.3?箱線圖和莖葉圖523.3?將圖形組合起來553.4?更多的高水平作圖函數573.5?更多的常用作圖命令59第4章?R中參數的估計和檢驗624.1?使用R進行點估計和區間估計624.1.1?簡單的點估計和區間估計624.1.2?估計單側置信區間654.2?與正態總體有關的參數檢驗684.3?列聯表與獨立性檢驗714.4?幾種檢驗數據分布的函數724.5?對非正態總體的區間估計和檢驗754.5.1?非正態總體的區間估計754.5.2?非參數檢驗中的符號檢驗764.5.3?非參數檢驗中的秩檢驗78第5章?R中的方差分析805.1?方差分析模型的建立805.2?單因素方差分析815.2.1?單因素方差分析的數學思想與模型815.2.2?檢驗樣本是否滿足方差分析的假設條件825.2.3?構建單因素方差分析模型845.3?多因素方差分析875.3.1?多因素方差分析的數學思想與模型875.3.2?不考慮交互作用的雙因素方差分析885.3.3?考慮交互作用的雙因素方差分析895.4?秩檢驗和協方差分析915.4.1?對控制變量應用秩檢驗方法915.4.2?協方差分析的假設與應用92第6章?R中的相關分析和回歸分析946.1?多種相關繫數的度量和分析946.1.1?簡單相關繫數的計算和檢驗946.1.2?散布矩陣圖和偏相關繫數966.1.3?典型相關分析986.2?線性回歸分析及其常規參數996.2.1?對數據進行預處理1006.2.2?構建第一個回歸模型1016.2.3?修正方程並檢驗殘差1026.3?使用逐步回歸篩選自變量1046.3.1?逐步回歸的思想與分類1046.3.2?構建逐步回歸模型1056.4?啞變量和邏輯回歸1076.4.1?啞變量和邏輯回歸的思想1076.4.2?向線性回歸模型中納入啞變量108第7章?更高級的數據可視化1107.1?基礎圖形的拓展與延伸1107.1.1?繪制分類散點圖並添加圖標1107.1.2?繪制含多種類別的密度分布圖1127.1.3?復合條形圖和堆棧條形圖1147.2?分布函數的特殊圖形1177.2.1?星圖和臉譜圖1177.2.2?輪廓圖1207.2.3?調和曲線圖1227.3?建立最簡單的3D圖形1237.4?如何讓圖形更美觀1257.5?更多的繪圖包和繫統128第8章?R中的聚類分析和判別分析1298.1?幾種聚類分析的異同1298.2?使用R實現KNN聚類1308.2.1?KNN算法的思想和模型1308.2.2?使用R實現KNN聚類1318.3?使用R實現繫統聚類1338.3.1?繫統聚類的思想和模型1338.3.2?使用R實現繫統聚類1348.4?使用R實現快速聚類1368.4.1?快速聚類的思想和模型1368.4.2?使用R實現快速聚類1378.5?幾種判別分析模型綜述1408.5.1?距離判別模型1408.5.2?Fisher判別模型142第9章?R中的主成分分析和因子分析1459.1?主成分分析的實現與應用1459.1.1?主成分分析的模型假設和數據處理1459.1.2?構造一個主成分分析模型1479.1.3?計算主成分的綜合得分1499.2?因子分析的初次構建與完善1509.2.1?構造一個簡單的因子分析模型1509.2.2?計算因子得分並分析1529.3?對因子分析模型進行修正1539.3.1?修改因子分析模型中的因子個數1539.3.2?基於主成分法和主軸因子法進行因子分析1559.4?在降維分析的基礎上進行回歸分析和聚類分析1579.4.1?在降維分析的基礎上進行回歸分析1579.4.2?在降維分析的基礎上進行聚類分析160第10章?R中的廣義線性回歸模型16210.1?一般的廣義線性回歸模型16210.1.1?使用二次函數擬合線性回歸模型16210.1.2?擬合更多的廣義線性模型16410.1.3?比較線性模型的優劣16610.2?Logistic線性回歸模型16810.2.1?Logistic模型的原理與構建方法16810.2.2?Logistic模型的顯著性檢驗和優勢比17010.2.3?修正被警告的Logistic模型17110.3?泊松回歸分析模型17310.3.1?擬合第一個泊松回歸模型17410.3.2?泊松回歸模型的過散布檢驗17610.4?廣義線性模型的交叉驗證178第11章?R中的時間序列模型18011.1?將數據轉換為時間序列格式18011.1.1?使用ts()函數轉換數據格式並繪制時間序列曲線18011.1.2?使用zoo()函數轉換數據格式並繪制時間序列曲線18211.2?分解時間序列並檢驗時間序列的自相關性18511.2.1?使用經典方法分解時間序列18511.2.2?使用STL方法分解時間序列18611.3?探究時間序列的自相關性18811.3.1?使用月圖和季度圖探究自相關性18811.3.2?使用散點圖探究自相關性18911.4?構建時間序列並預測19111.4.1?均值預測、單純預測和漂移19211.4.2?不考慮長期趨勢和季節波動的簡單指數平滑19511.4.3?在指數平滑中加入長期趨勢和季節波動19611.4.4?自回歸移動平均模型198第12章?R中的很優化問題20112.1?很優化問題簡述20112.2?黃金分割法20212.2.1?黃金分割法和局部很優解20212.2.2?使用R實現黃金分割法20312.3?牛頓很優化方法20512.3.1?牛頓法的算法原理20612.3.2?在一維情形下實現牛頓迭代法20712.3.3?在多維情形下實現牛頓迭代法20912.4?最快上升法21012.4.1?利用梯度求解上升最快的相鄰點21012.4.2?構建最快上升法函數並檢驗21212.5?R中的很優化函數213第13章?使用R繪制地理信息圖形21613.1?繪制世界、國家、省市地圖21613.1.1?使用map()函數繪制地圖21613.1.2?另一種繪制地圖的方法21813.1.3?分省市繪制地圖22013.2?向地圖中添加顏色22213.2.1?向地圖中添加顏色前的準備工作22213.2.2?在地圖上添加顏色22413.3?向地圖中添加標簽和線條22613.3.1?向地圖中添加標簽前的準備工作22613.3.2?在地圖上添加標簽22813.3.3?在地圖上添加線條23013.4?使用其他格式的文件優化地圖232第14章?使用R構建支持向量機23614.1?構建一個簡單的支持向量機23614.1.1?支持向量機的算法原理23614.1.2?構建一個簡單的支持向量機23814.1.3?使用其他核函數構建支持向量機24114.2?優化支持向量機的參數24314.2.1?優化參數degree24414.2.2?優化參數cost24714.2.3?優化參數gamma24914.3?比較支持向量機與Logistic回歸的優劣25214.4?比較支持向量機和KNN聚類算法的優劣255第15章?實現更高效的流程控制和高級循環25715.1?R中的流程控制25715.1.1?if語句的多種實現方法25715.1.2?ifelse語句與花括號的結合25815.1.3?適合多分支情況的switch語句26015.2?R中的for循環、while循環和repeat循環26215.2.1?R中的for循環和while循環26215.2.2?R中的repeat循環26415.3?apply家族中的循環函數26615.3.1?R中的apply()函數26615.3.2?R中的lapply()函數和sapply()函數26915.3.3?R中的tapply()函數27115.3.4?R中的mapply()函數27415.4?更多的高級循環函數27615.4.1?R中的replicate()函數和sweep()函數27615.4.2?R中的aggregate()函數279第16章?R代碼的調試與優化28216.1?R代碼的常見信息與警告28216.1.1?R代碼的正常信息與警告28216.1.2?R代碼中的警告處理方法28416.2?R代碼中的錯誤與錯誤處理方法28516.2.1?使用try()函數處理錯誤信息28516.2.2?將try()函數與循環相結合28716.3?調試R代碼28816.3.1?查看調用棧或暫停代碼28816.3.2?修改error選項29016.4?向量化編程方法29116.4.1?向量化編程思想29116.4.2?比較循環和向量的運行速度292第17章?構建電影評分預測模型29517.1?獲取數據並探索29517.2?利用recommenderlab包處理數據29717.3?建立模型並評估29917.3.1?模型的選擇與建立29917.3.2?模型之間的比較和評估301第18章?貝葉斯垃圾郵件過濾器模型30318.1?貝葉斯模型中的條件概率30318.2?復雜的數據預處理過程30418.2.1?利用for循環讀入多封郵件正文30418.2.2?利用tm包進一步轉換數據格式30618.2.3?將TDM轉換成真正有用的數據框30718.3?利用occurrece值構造分類器30918.3.1?完成理論準備並處理測試郵件和普通郵件30918.3.2?創建一個函數用於比較概率