[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 機器學習與R語言(原書第3版)
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    489-710
    【優惠價】
    306-444
    【作者】 美布雷特·蘭茨Brett 
    【所屬類別】 圖書  計算機/網絡  人工智能  機器學習 
    【出版社】機械工業出版社 
    【ISBN】9787111684572
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111684572
    叢書名:數據科學與工程技術叢書

    作者:[美]布雷特·蘭茨(Brett
    出版社:機械工業出版社
    出版時間:2021年06月 


        
        
    "

    產品特色

    編輯推薦

    機器學習的核心是將數據轉換為可操作的知識。R提供了一組強大的機器學習方法,可以幫助你快速輕松地發現數據背後隱藏的信息。本書通過清晰和實用的案例來探索機器學習在現實世界中的應用。無論你是經驗豐富的R用戶還是R初學者,都會從本書中學到如何發現關鍵信息、做出新的預測並進行可視化。本書的第3版包含更新和更好的庫、有關機器學習中的道德和偏差問題的建議,以及深度學習的簡介。通過閱讀本書,你將學到:• 通過示例發現機器學習的起源以及計算機的學習方式。• 使用R語言為機器學習準備數據。• 使用近鄰和貝葉斯方法對重要結果進行分類。• 使用決策樹、關聯規則和支持向量機預測未來事件。• 使用回歸方法預測數值型數據和估計金融數據。• 使用人工神經網絡為復雜過程建模——深度學習的基礎。• 避免機器學習模型中的偏差。• 評估模型並改善其性能。• 將R連接到SQL數據庫和新興的大數據技術,例如Spark、H2O和TensorFlow。

     
    內容簡介

    本書共12章:第1章介紹機器學習的基本概念和理論,並介紹用於機器學習的R軟件環境的準備;第2章介紹如何應用R來管理數據,進行數據的探索分析和數據可視化;第3~9章介紹典型的機器學習算法,包括k近鄰分類算法、樸素貝葉斯算法、決策樹和規則樹、回歸預測、黑盒算法——神經網絡和支持向量機、關聯分析、k均值聚類,並給出大量的實際案例和詳細的分析步驟,例如乳腺癌的判斷、垃圾短信的過濾、貸款違約的預測、毒蘑菇的判別、醫療費用的預測、建築用混凝土強度的預測、光學字符的識別、超市購物籃關聯分析以及市場細分等;第10章介紹模型性能評價的原理和方法;第11章給出提高模型性能的幾種常用方法;第12章討論用R進行機器學習時可能遇到的一些高級專題,如特殊形式的數據、大數據集的處理、並行計算和GPU計算等技術。

    作者簡介

    布雷特·蘭茨(Brett Lantz)


    在應用創新的數據方法來理解人類的行為方面有十餘年經驗。他是一位DataCamp講師,經常在世界各地的機器學習會議和研討會上進行演講。他致力於研究數據科學在體育、自動駕駛汽車、外語學習和時尚等領域的應用,並維護dataspelunking.com這個網站,該網站致力於分享有關探尋數據中所蘊含的洞察的知識。


     


    譯者簡介:


    許金煒 


    2016年上海大學統計學碩士畢業,參與翻譯《機器學習與R語言》第1版和第2版、《R語言數據挖掘》及《高級R語言編程指南》第2版,曾於各類數學建模競賽中斬獲佳績。目前主要於金融行業從事風控領域及量化方面的工作。

    目錄
    譯者序
    前言
    第1章機器學習簡介 1
    1.1機器學習的起源 1
    1.2機器學習的使用與濫用 2
    1.2.1機器學習的成功應用 3
    1.2.2機器學習的限制 4
    1.2.3機器學習的倫理方面 5
    1.3機器如何學習 7
    1.3.1數據存儲 8
    1.3.2抽像化 8
    1.3.3一般化 10
    1.3.4評估 11
    1.4實踐中的機器學習 12

    譯者序
    前言
    第1章機器學習簡介 1
    1.1機器學習的起源 1
    1.2機器學習的使用與濫用 2
    1.2.1機器學習的成功應用 3
    1.2.2機器學習的限制 4
    1.2.3機器學習的倫理方面 5
    1.3機器如何學習 7
    1.3.1數據存儲 8
    1.3.2抽像化 8
    1.3.3一般化 10
    1.3.4評估 11
    1.4實踐中的機器學習 12
    1.4.1輸入數據的類型 13
    1.4.2機器學習算法的類型 14
    1.4.3為輸入數據匹配算法 15
    1.5使用R進行機器學習 16
    1.5.1安裝R添加包 17
    1.5.2載入和卸載R添加包 18
    1.5.3安裝RStudio 18
    1.6總結 19
    第2章管理和理解數據 20
    2.1R數據結構 20
    2.1.1向量 20
    2.1.2因子 22
    2.1.3列表 23
    2.1.4數據框 25
    2.1.5矩陣和數組 27
    2.2用R管理數據 28
    2.2.1保存、載入和移除R數據結構 29
    2.2.2從CSV文件導入數據和將數據保存為CSV文件 29
    2.3探索和理解數據 31
    2.3.1探索數據的結構 31
    2.3.2探索數值變量 32
    2.3.3探索分類變量 40
    2.3.4探索變量之間的關繫 41
    2.4總結 44
    第3章懶惰學習——使用近鄰分類 46
    3.1理解近鄰分類 46
    3.1.1k近鄰算法 47
    3.1.2為什麼k-NN算法是懶惰的 52
    3.2例子—用k-NN算法診斷乳腺癌 53
    3.2.1第1步—收集數據 53
    3.2.2第2步—探索和準備數據 54
    3.2.3第3步—基於數據訓練模型 57
    3.2.4第4步—評估模型的性能 58
    3.2.5第5步—提高模型的性能 59
    3.3總結 61
    第4章概率學習——樸素貝葉斯分類 62
    4.1理解樸素貝葉斯 62
    4.1.1貝葉斯方法的基本概念 63
    4.1.2樸素貝葉斯算法 67
    4.2例子—基於貝葉斯算法的手機垃圾短信過濾 72
    4.2.1第1步—收集數據 72
    4.2.2第2步—探索和準備數據 73
    4.2.3第3步—基於數據訓練模型 84
    4.2.4第4步—評估模型的性能 85
    4.2.5第5步—提高模型的性能 86
    4.3總結 87
    第5章分而治之——應用決策樹和規則進行分類 88
    5.1理解決策樹 88
    5.1.1分而治之 89
    5.1.2C5.0決策樹算法 92
    5.2例子—使用C5.0決策樹識別高風險銀行貸款 95
    5.2.1第1步—收集數據 95
    5.2.2第2步—探索和準備數據 95
    5.2.3第3步—基於數據訓練模型 98
    5.2.4第4步—評估模型的性能 100
    5.2.5第5步—提高模型的性能 100
    5.3理解分類規則 104
    5.3.1獨立而治之 104
    5.3.21R算法 106
    5.3.3RIPPER算法 108
    5.3.4來自決策樹的規則 109
    5.3.5什麼使決策樹和規則貪婪 110
    5.4例子—應用規則學習算法識別有毒的蘑菇 111
    5.4.1第1步—收集數據 111
    5.4.2第2步—探索和準備數據 112
    5.4.3第3步—基於數據訓練模型 112
    5.4.4第4步—評估模型的性能 114
    5.4.5第5步—提高模型的性能 115
    5.5總結 117
    第6章預測數值型數據——回歸方法 118
    6.1理解回歸 118
    6.1.1簡單線性回歸 120
    6.1.2普通小二乘估計 122
    6.1.3相關性 123
    6.1.線性回歸 124
    6.2例子—應用線性回歸預測醫療費用 127
    6.2.1第1步—收集數據 128
    6.2.2第2步—探索和準備數據 128
    6.2.3第3步—基於數據訓練模型 132
    6.2.4第4步—評估模型的性能 134
    6.2.5第5步—提高模型的性能 135
    6.2.6第6步—用回歸模型進行預測 138
    6.3理解回歸樹和模型樹 140
    6.4例子—用回歸樹和模型樹估計葡萄酒的質量 142
    6.4.1第1步—收集數據 142
    6.4.2第2步—探索和準備數據 143
    6.4.3第3步—基於數據訓練模型 144
    6.4.4第4步—評估模型的性能 147
    6.4.5第5步—提高模型的性能 149
    6.5總結 151
    第7章黑箱方法—神經網絡和支持向量機 152
    7.1理解神經網絡 152
    7.1.1從生到人 153
    7.1.2激活函數 154
    7.1.3網絡拓撲 156
    7.1.4用後向傳播訓練神經網絡 159
    7.2例子—用人工神經網絡對混凝土的強度進行建模 160
    7.2.1第1步—收集數據 161
    7.2.2第2步—探索和準備數據 161
    7.2.3第3步—基於數據訓練模型 162
    7.2.4第4步—評估模型的性能 164
    7.2.5第5步—提高模型的性能 165
    7.3理解支持向量機 169
    7.3.1用超平面分類 169
    7.3.2對非線性空間使用核函數 173
    7.4例子—用支持向量機進行光學字符識別 175
    7.4.1第1步—收集數據 175
    7.4.2第2步—探索和準備數據 176
    7.4.3第3步—基於數據訓練模型 177
    7.4.4第4步—評估模型的性能 179
    7.4.5第5步—提高模型的性能 180
    7.5總結 182
    第8章探尋模式——基於關聯規則的購物籃分析 183
    8.1理解關聯規則 183
    8.1.1用於關聯規則學習的Apriori算法 184
    8.1.2度量規則興趣度—支持度和置信度 185
    8.1.3用Apriori原則建立規則 186
    8.2例子—用關聯規則確定經常一起購買的食品雜貨 187
    8.2.1第1步—收集數據 187
    8.2.2第2步—探索和準備數據 188
    8.2.3第3步—基於數據訓練模型 193
    8.2.4第4步—評估模型的性能 195
    8.2.5第5步—提高模型的性能 197
    8.3總結 200
    第9章尋找數據的分組——k均值聚類 201
    9.1理解聚類 201
    9.1.1聚類—一種機器學習任務 202
    9.1.2k均值聚類算法 203
    9.2例子—用k均值聚類探尋青少年市場細分 209
    9.2.1第1步—收集數據 209
    9.2.2第2步—探索和準備數據 210
    9.2.3第3步—基於數據訓練模型 213
    9.2.4第4步—評估模型的性能 215
    9.2.5第5步—提高模型的性能 217
    9.3總結 219
    第10章模型性能的評估 220
    10.1度量分類方法的性能 220
    10.1.1理解分類器的預測 221
    10.1.2深入探討混淆矩陣 224
    10.1.3使用混淆矩陣度量性能 225
    10.1.4準確率之外的其他性能度量指標 226
    10.1.5使用ROC曲線可視化性能權衡 233
    10.2評估未來的性能 237
    10.3總結 242
    第11章提高模型的性能 243
    11.1調整多個模型來提高性能 243
    11.2學習來提高模型的性能 251
    11.2.1理解集成學習 251
    11.2.2bagging 253
    11.2.3boosting 254
    11.2.4隨機森林 256
    11.3總結 261
    第12章其他機器學習主題 262
    12.1管理和準備真實數據 262
    12.1.1使用tidyverse添加包使數據變得“整潔” 263
    12.1.2讀取和寫入外部數據文件 265
    12.1.3查詢SQL數據庫中的數據 266
    12.2處理在線數據和服務 270
    12.2.1下載網頁的所有文本 270
    12.2.2解析網頁中的數據 271
    12.3處理特定領域的數據 277
    12.3.1分析生物信息學數據 277
    12.3.2分析和可視化網絡數據 277
    12.4提高R語言的性能 280
    12.4.1處理非常大的數據集 281
    12.4.2使用並行計算來加快學習過程 283
    12.4.3部署優化的學習算法 290
    12.4.4GPU計算 292
    12.5總結 294

    前言

    譯者序
    隨著大數據的概念變得越來越流行,對數據的探索、分析和預測逐漸成為大數據分析領域的基本技能。作為探索和分析數據的基本理論和工具,機器學習和數據挖掘成為時下熱門的技術。R作為功能強大且免費的數據分析工具,在數據分析領域獲得了越來越多用戶的青睞。本書介紹了如何使用R來進行現實世界中的機器學習,如何從數據中獲取可以付諸行動的見解。
    本書的作者Brett Lantz在機器學習領域擁有十餘年的實踐經驗,他在本書中介紹了多種機器學習算法。在給出相應的機器學習算法的核心理論之後,都會給出一個實際的案例,從對案例數據的探索、整理,到模型的建立和評估,每一步都給出了詳盡的步驟和R代碼。


    譯者序
    隨著大數據的概念變得越來越流行,對數據的探索、分析和預測逐漸成為大數據分析領域的基本技能。作為探索和分析數據的基本理論和工具,機器學習和數據挖掘成為時下熱門的技術。R作為功能強大且免費的數據分析工具,在數據分析領域獲得了越來越多用戶的青睞。本書介紹了如何使用R來進行現實世界中的機器學習,如何從數據中獲取可以付諸行動的見解。
    本書的作者Brett Lantz在機器學習領域擁有十餘年的實踐經驗,他在本書中介紹了多種機器學習算法。在給出相應的機器學習算法的核心理論之後,都會給出一個實際的案例,從對案例數據的探索、整理,到模型的建立和評估,每一步都給出了詳盡的步驟和R代碼。
    本書共分12章。第1章介紹了機器學習的基本概念和理論,並介紹了用於機器學習的R軟件環境的準備。第2章介紹了如何應用R來管理數據,進行數據的探索分析和可視化。第3~9章介紹了典型的機器學習算法和案例,它們分別是:k近鄰分類算法、樸素貝葉斯算法、決策樹和規則樹、回歸預測、黑盒算法—神經網絡和支持向量機、關聯分析、k均值聚類。伴隨著對這些算法的介紹,書中給出了大量的實際案例,並給出了詳細的分析步驟,案例包括乳腺癌的判斷、垃圾短信的過濾、貸款違約的預測、毒蘑菇的判別、醫療費用的預測、建築用混凝土強度的預測、光學字符的識別、購物籃關聯分析以及市場細分等。第10章介紹了模型性能評估的原理和方法。第11章給出了提高模型性能的幾種常用方法。第12章討論了用R進行機器學習時可能遇到的一些高級主題,例如特殊形式的數據、大數據集的處理、並行計算和GPU計算等技術。
    R本身是一款十分優秀的數據分析和可視化軟件,現在R中有大量用於機器學習的添加包。本書以機器學習算法為主線,通過案例學習的形式來組織內容,脈絡清晰,並且各章自成體繫。讀者可以從頭開始逐章學習,也可以找到自己所需要的內容來學習。讀者隻需要具有R的一些基本知識即可,不需要具備機器學習的深厚基礎。不管是R初學者,還是熟練的R用戶,都能從書中找到對自己有用的內容。
    譯者曾經應用本書的部分內容進行教學,學生都反映這些內容具有極強的實用價值,許多內容直接或者略加修改就可以應用到他們的實際工作中。我們有幸受機械工業出版社委托將本書譯成中文,希望中文版的出版能夠給國內讀者學習R與機器學習帶來方便。
    本書的翻譯工作由李洪成、許金煒和潘文捷共同完成,全書由李洪成統一定稿。由於時間和水平所限,書中難免會有不當之處,希望同行和讀者多加指正。


    李洪成
    2020年12月

    在線試讀
    前言
    機器學習的核心是將信息轉化為具有可行性知識的算法。這一事實使得機器學習非常適用於當今的大數據時代。如果沒有機器學習,要跟上海量的信息數據流幾乎是不可能的。
    鋻於R的地位不斷提高(R是一個跨平臺、零成本的統計編程環境),現在是開始使用機器學習的好時機。R提供了一套功能強大且易於學習的工具,這些工具可以幫助我們發現數據背後隱藏的信息。
    通過把實踐案例研究與基本理論(你需要理解這些理論在後臺是如何運行的)相結合,本書提供了在工作中使用機器學習所需要的全部知識。
    本書讀者對像
    本書適用於任何希望使用數據來采取行動的人。或許你已經對機器學習有些了解但從來沒有使用過R,或許你已經對R有些了解,但機器學習對你來說是全新的。無論是哪種情況,本書都將讓你快速上手。稍微熟悉一些基本的數學和編程概念將會有幫助,但並不需要先前有經驗,你隻需要有好奇心就行。
    本書涵蓋的內容
    第1章介紹用來定義和區分機器學習算法的術語和概念,並給出將學習任務與適當算法相匹配的方法。
    第2章提供一個在R中自己實際動手操作數據的機會,並討論基本的數據結構以及用於載入、探索和理解數據的程序。
    第3章教你如何將一個簡單且功能強大的機器學習算法應用於你的個學習任務:識別癌癥的惡性樣本。
    第4章揭示用於先進的垃圾郵件過濾繫統的基本概率知識。在建立你自己的垃圾郵件過濾器的過程中,你將學習文本挖掘的基本知識。
    第5章探索兩種學習算法,它們的預測結果不僅精確而且容易解釋。我們將把這兩種算法應用於對透明度要求很高的任務中。
    第6章介紹用於數值預測的機器學習算法。由於這些技術在很大程度上來源於統計領域,所以你還將通過學習必要的基本指標來理解數值之間的關繫。
    第7章包括兩個極其復雜但功能強大的機器學習算法。盡管數學可能會讓人望而生畏,但是我們將以簡單的術語結合實際例子來說明它們內部的運作原理。
    第8章揭示許多零售商使用的推薦繫統的算法。如果你想知道零售商是如何比你自己更了解你的購物習慣的,本章將揭示他們的秘密。
    第9章介紹k均值聚類。該算法用來查找相關個體的聚類。我們將使用該算法來確定一個網絡社區內的分布。
    第10章提供一些信息來度量機器學習項目是否成功,並得到學習器針對未來數據的性能的可靠估計。

    前言
    機器學習的核心是將信息轉化為具有可行性知識的算法。這一事實使得機器學習非常適用於當今的大數據時代。如果沒有機器學習,要跟上海量的信息數據流幾乎是不可能的。
    鋻於R的地位不斷提高(R是一個跨平臺、零成本的統計編程環境),現在是開始使用機器學習的好時機。R提供了一套功能強大且易於學習的工具,這些工具可以幫助我們發現數據背後隱藏的信息。
    通過把實踐案例研究與基本理論(你需要理解這些理論在後臺是如何運行的)相結合,本書提供了在工作中使用機器學習所需要的全部知識。
    本書讀者對像
    本書適用於任何希望使用數據來采取行動的人。或許你已經對機器學習有些了解但從來沒有使用過R,或許你已經對R有些了解,但機器學習對你來說是全新的。無論是哪種情況,本書都將讓你快速上手。稍微熟悉一些基本的數學和編程概念將會有幫助,但並不需要先前有經驗,你隻需要有好奇心就行。
    本書涵蓋的內容
    第1章介紹用來定義和區分機器學習算法的術語和概念,並給出將學習任務與適當算法相匹配的方法。
    第2章提供一個在R中自己實際動手操作數據的機會,並討論基本的數據結構以及用於載入、探索和理解數據的程序。
    第3章教你如何將一個簡單且功能強大的機器學習算法應用於你的個學習任務:識別癌癥的惡性樣本。
    第4章揭示用於先進的垃圾郵件過濾繫統的基本概率知識。在建立你自己的垃圾郵件過濾器的過程中,你將學習文本挖掘的基本知識。
    第5章探索兩種學習算法,它們的預測結果不僅精確而且容易解釋。我們將把這兩種算法應用於對透明度要求很高的任務中。
    第6章介紹用於數值預測的機器學習算法。由於這些技術在很大程度上來源於統計領域,所以你還將通過學習必要的基本指標來理解數值之間的關繫。
    第7章包括兩個極其復雜但功能強大的機器學習算法。盡管數學可能會讓人望而生畏,但是我們將以簡單的術語結合實際例子來說明它們內部的運作原理。
    第8章揭示許多零售商使用的推薦繫統的算法。如果你想知道零售商是如何比你自己更了解你的購物習慣的,本章將揭示他們的秘密。
    第9章介紹k均值聚類。該算法用來查找相關個體的聚類。我們將使用該算法來確定一個網絡社區內的分布。
    第10章提供一些信息來度量機器學習項目是否成功,並得到學習器針對未來數據的性能的可靠估計。
    第11章揭示在機器學習競賽中排名靠前的團隊所采用的方法。如果你具有競爭意識,或者僅僅想獲取數據中盡可能多的信息,那麼你需要學習這些技術。
    第12章探討機器學習的前沿主題。從使用大數據到使R的運行速度更快,涉及的這些主題將幫助你拓展使用R進行數據挖掘的界限。
    學習本書的知識準備
    本書中的例子是基於Microsoft Windows和Mac OS X繫統的R 3.5.2版本進行編寫與測試的,當然,對於任意的R版本,這些例子都能運行。
    下載示例代碼文件及彩色圖像
    本書的示例代碼文件及使用的截圖或圖表的彩色圖像,可以從Packtpub(http://www.packtpub.com)通過個人賬號下載,也可以訪問華章圖書官網http://www.hzbook.com,通過注冊並登錄個人賬號下載。
    本書的代碼包也放在GitHub的https://github.com/PacktPublishing/Machine-Learning-with-R-Third-Edition和https://github.com/dataspelunking/MLwR/上。
    本書排版約定
    在本書中,你將發現一些用於區分不同類型信息的文本樣式。下面是這些樣式的一些例子,以及它們的含義。
    書中的代碼、函數名、文件名、文件擴展名、用戶輸入和R添加包名字,如下所示: “class包中的knn()函數提供了k-NN算法的標準經典實現”
    R用戶的輸入和輸出如下所示:


    新的術語和重要概念以黑體顯示。你在屏幕上看到的單詞,例如,在菜單或對話框中看到的單詞,像這樣顯示在書中:“CRAN頁面左邊的任務視圖鏈接提供了添加包的長列表。”
    警告或者重要注釋。
    提示和技巧。
    致謝
    如果沒有家人和朋友的支持,編寫本書是根本不可能的。特別是,非常感謝我的妻子Jessica在過去一年中對我的耐心與鼓勵。我的兒子Will和Cal分別出生於本書第1版和第2版的寫作期間,在我撰寫本版時他們分散了我較多的精力。我把本書獻給我的孩子們,希望有一天他們能從中受到啟發,應對重大的挑戰,並跟隨他們的好奇心,無論他們的好奇心會通向哪裡。
    我還要感謝支持本書的很多人。本書的很多想法來源於我與密歇根大學、聖母大學以及中佛羅裡達大學的教育工作者、同事以及合作者的交流。此外,如果沒有各位研究人員以公開出版物、課程和源代碼的形式分享他們的專業知識,本書可能根本就不會存在。後,我要感謝R和RStudio團隊以及所有那些貢獻R添加包的人員的努力,是他們終為大家普及了機器學習。真心希望我的這本書能對機器學習領域做出一點貢獻。
    關於作者
    布雷特·蘭茨(Brett Lantz,@DataSpelunking)在應用創新的數據方法來理解人類的行為方面有10餘年經驗。他初是一名社會學家,在研究一個包含青少年社交網絡資料的大型數據庫時,他就開始沉醉於機器學習。Brett是一位DataCamp講師,經常在世界各地的機器學習會議和研討會上進行演講。他致力於研究數據科學在體育、自動駕駛汽車、外語學習和時尚等領域的應用,並希望有一天在dataspelunking.com上發布有關這些主題的博客,該網站致力於分享探尋數據中所蘊含的深刻知識。
    關於審稿人
    拉格哈夫·巴利(Raghav Bali)是全球的醫療保健組織之一的高級數據科學家。他的工作包括針對醫療保健和保險相關的用例研究和開發基於機器學習、深度學習和自然語言處理的企業級解決方案。他曾在英特爾任職,參與了使用自然語言處理、深度學習和傳統統計方法來實施主動式數據驅動的IT計劃。他還曾在美國運通公司從事金融領域的工作,解決數字參與和客戶維持的用例。
    拉格哈夫還與一些主流的出版商合作出版了多本書,其中一本是關於遷移學習的研究進展的。
    拉格哈夫擁有班加羅爾國際信息技術研究所的信息技術碩士學位(全優畢業生)。當拉格哈夫不忙於解決問題時,他喜歡讀書,並且是一個攝影愛好者。







     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部