出版社:機械工業出版社 ISBN:9787111547952 商品編碼:11007473228 品牌:文軒 出版時間:2016-10-01 代碼:69 作者:蓋爾蓋伊·道羅齊(GergelyDarocz
" 作 者:(美)蓋爾蓋伊·道羅齊(Gergely Daroczi) 著;潘怡 譯 定 價:69 出 版 社:機械工業出版社 出版日期:2016年10月01日 頁 數:279 裝 幀:平裝 ISBN:9787111547952 ●譯者序 ●前言 ●第1章你好,數據!1 ●1.1導入一個大小合適的文本文件2 ●1.2文本文件編譯測試平臺5 ●1.3導入文本文件的子集6 ●1.4從數據庫中導入數據8 ●1.4.1搭建測試環境9 ●1.4.2MySQL和MariaDB11 ●1.4.3 tgreSQL15 ●1.4.4Oracle數據庫17 ●1.4.5訪問ODBC數據庫22 ●1.4.6使用圖形化用戶面連接數據庫23 ●1.4.7其他數據庫後臺24 ●1.5從其他統計繫統導入數據25 ●1.6導入Excel電子表格26 ●1.7小結26 ●第2章從Web獲取數據28 ●2.1從Internet導入數據集29 ●2.2其他流行的在線數據格式32 ●部分目錄 本書共分為14章,重點探討了數據預處理的方法,包括數據獲取、篩選、重構、建模、平滑以及降維,本書還介紹了分類和聚類等幾種主要的數據分析方法,很後探討了網絡數據、時序數據、空間數據及社交媒體數據等一些特殊類型數據的分析處理。 (美)蓋爾蓋伊·道羅齊(Gergely Daroczi) 著;潘怡 譯 蓋爾蓋伊·道羅齊(GergelyDar6czi),統計學副教授,社會學專業博士。他是一位狂熱的R包開發者,也rapporter.net網站的創始人及CTO,該網站為人們提供基於R的報表和Web應用程序。他現在就職於洛杉磯網站,擔任首席R語言開發及研究的數據專家。 Preface?前 言自20多年前發源於學術界以來,R語言已經成為統計分析的通用語言,活躍於眾多產業領域。目前,越來越多的商業項目開始使用R,兼之R用戶開發了數以千計易於上手的開發包,都使得R成為數據分析工程師及科學家最常用的工具。 本書將幫助讀者熟悉R語言這一開源生態繫統,並介紹一些基本的統計背景知識,以及一小部分相關的數學知識。我們將著重探討使用R語言解決實際的問題。 由於數據科學家在數據的采集、清洗及重構上將耗費大量時間,因此本書首先將通過第一手實例來重點探討從文件、數據庫以及在線資源中導入數據的方法,然後再介紹數據的重構和清洗——不包含實際的數據分析,最後幾章將對一些特殊的數據類型以及經典的統計模型和部分機器學習算法進行說明。等
" |