[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • Scala機器學習
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    292-424
    【優惠價】
    183-265
    【作者】 (美)亞歷克斯·科茲洛夫 
    【所屬類別】 圖書  計算機/網絡  人工智能  機器學習 
    【出版社】機械工業出版社 
    【ISBN】9787111572152
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111572152
    叢書名:大數據技術叢書

    作者:(美)亞歷克斯·科茲洛夫
    出版社:機械工業出版社
    出版時間:2017年07月 


        
        
    "

    內容簡介
    Copyright ?2016 Packt Publishing. First published in the English language under the title “Mastering Scala Machine Learning”.All rights reserved.Chinese simplified language edition published by China Machine Press.Copyright ?2017 by China Machine Press.本書中文簡體字版由Packt Publishing授權機械工業出版社獨家出版。未經出版者書面許可,不得以任何方式復制或抄襲本書內容。
    目錄
    目錄 Contents
    譯者序
    前言
    第1章探索數據分析1
    1.1Scala入門2
    1.2去除分類字段的重復值2
    1.3數值字段概述4
    1.4基本抽樣、分層抽樣和一致抽樣5
    1.5使用Scala和Spark的Note-book工作8
    1.6相關性的基礎12
    1.7總結14
    第2章數據管道和建模15
    2.1影響圖16
    2.2序貫試驗和風險處理17目錄 Contents
    譯者序
    前言
    第1章探索數據分析1
    1.1Scala入門2
    1.2去除分類字段的重復值2
    1.3數值字段概述4
    1.4基本抽樣、分層抽樣和一致抽樣5
    1.5使用Scala和Spark的Note-book工作8
    1.6相關性的基礎12
    1.7總結14
    第2章數據管道和建模15
    2.1影響圖16
    2.2序貫試驗和風險處理17
    2.3探索與利用問題21
    2.4不知之不知23
    2.5數據驅動繫統的基本組件23
    2.5.1數據收集24
    2.5.2數據轉換層25
    2.5.3數據分析與機器學習26
    2.5.4UI組件26
    2.5.5動作引擎28
    2.5.6關聯引擎28
    2.5.7監控28
    2.6優化和交互28
    2.7總結29
    第3章使用Spark和MLlib30
    3.1安裝Spark31
    3.2理解Spark的架構32
    3.2.1任務調度32
    3.2.2Spark的組件35
    3.2.3MQTT、ZeroMQ、Flume和Kafka36
    3.2.4HDFS、Cassandra、S3和Tachyon37
    3.2.5Mesos、YARN和Standa-lone38
    3.3應用38
    3.3.1單詞計數38
    3.3.2基於流的單詞計數41
    3.3.3Spark SQL和數據框45
    3.4機器學習庫46
    3.4.1SparkR47
    3.4.2圖算法:Graphx和Graph-Frames48
    3.5Spark的性能調整48
    3.6運行Hadoop的HDFS49
    3.7總結54
    第4章監督學習和無監督學習55
    4.1記錄和監督學習55
    4.1.1Iirs數據集56
    4.1.2類標簽點57
    4.1.3SVMWithSGD58
    4.1.4logistic回歸60
    4.1.5決策樹62
    4.1.6bagging和boosting:集成學習方法66
    4.2無監督學習66
    4.3數據維度71
    4.4總結73
    第5章回歸和分類74
    5.1回歸是什麼74
    5.2連續空間和度量75
    5.3線性回歸77
    5.4logistic回歸81
    5.5正則化83
    5.回歸84
    5.7異方差84
    5.8回歸樹85
    5.9分類的度量87
    5.10多分類問題87
    5.11感知機87
    5.12泛化誤差和過擬合90
    5.13總結90
    第6章使用非結構化數據91
    6.1嵌套數據92
    6.2其他序列化格式100
    6.3Hive和Impala102
    6.4會話化104
    6.5使用特質109
    6.6使用模式匹配110
    6.7非結構化數據的其他用途113
    6.8概率結構113
    6.9投影113
    6.10總結113
    第7章使用圖算法115
    7.1圖簡介115
    7.2SBT116
    7.3Scala的圖項目119
    7.3.1增加節點和邊121
    7.3.2圖約束123
    7.3.3JSON124
    7.4GraphX126
    7.4.1誰收到電子郵件130
    7.4.2連通分量131
    7.4.3三角形計數132
    7.4.4強連通分量132
    7.4.5PageRank133
    7.4.6SVD 134
    7.5總結138
    第8章Scala與R和Python的集成139
    8.1R的集成140
    8.1.1R和SparkR的相關配置140
    8.1.2數據框144
    8.1.3線性模型150
    8.1.4廣義線性模型152
    8.1.5在SparkR中讀取JSON文件156
    8.1.6在SparkR中寫入Parquet文件157
    8.1.7從R調用Scala158
    8.2Python的集成161
    8.2.1安裝Python161
    8.2.2PySpark162
    8.2.3從Java/Scala調用Python163
    8.3總結167
    第9章Scala中的NLP169
    9.1文本分析流程170
    9.2Spark的MLlib庫177
    9.2.1TF-IDF177
    9.2.2LDA178
    9.3分詞、標注和分塊185
    9.4POS標記186
    9.5使用word2vec尋找詞關繫189
    9.6總結192
    第10章高級模型監控193
    10.1繫統監控194
    10.2進程監控195
    10.3模型監控201
    10.3.1隨時間變化的性能202
    10.3.2模型停用標準202
    10.3.3A/B測試202
    10.4總結202
    前言
    Preface 前言這是一本關於機器學習的書,它以Scala為重點,介紹了函數式編程方法以及如何在Spark上處理大數據。九個月前,當我受邀寫作本書時,我的反應是:Scala、大數據、機器學習,每一個主題我都曾徹底調研過,也參加了很多的討論,結合任何兩個話題來寫都具有挑戰性,更不用說在一本書中結合這三個主題。這個挑戰激發了我的興趣,於是就有了這本書。並不是每一章的內容都像我所希望的那樣圓滿,但技術每天都在快速發展。我有一份具體的工作,寫作隻是表達我想法的一種方式。
    下面先介紹機器學習。機器學習經歷了翻天覆地的變換;它是由人工智能和統計學發展起來的,於20世紀90年代興起。後來在2010年或稍晚些時候誕生了數據科學。數據科學家有許多定義,但Josh Wills的定義可能通俗,我有幸在Cloudera工作時和他共事過。這個定義在圖1中有具體的描述。雖然細節內容可能會有爭議,但數據科學確實是幾個學科的交叉,數據科學家不一定是任何一個領域的專家。據Jeff Hammerbacher(Cloudera的創始人,Facebook的早期員工)介紹,位數據科學家工作於Facebook。Facebook需要跨學科的技能,以便從當時大量的社交數據中提取有價值的信息。雖然我自稱是一個大數據科學家,但我已經關注這個交叉領域很久了,以至於有太多知識出現混淆。寫這本書就是想使用機器學習的術語來保持對這些領域的關注度。Preface 前言這是一本關於機器學習的書,它以Scala為重點,介紹了函數式編程方法以及如何在Spark上處理大數據。九個月前,當我受邀寫作本書時,我的反應是:Scala、大數據、機器學習,每一個主題我都曾徹底調研過,也參加了很多的討論,結合任何兩個話題來寫都具有挑戰性,更不用說在一本書中結合這三個主題。這個挑戰激發了我的興趣,於是就有了這本書。並不是每一章的內容都像我所希望的那樣圓滿,但技術每天都在快速發展。我有一份具體的工作,寫作隻是表達我想法的一種方式。
    下面先介紹機器學習。機器學習經歷了翻天覆地的變換;它是由人工智能和統計學發展起來的,於20世紀90年代興起。後來在2010年或稍晚些時候誕生了數據科學。數據科學家有許多定義,但Josh Wills的定義可能通俗,我有幸在Cloudera工作時和他共事過。這個定義在圖1中有具體的描述。雖然細節內容可能會有爭議,但數據科學確實是幾個學科的交叉,數據科學家不一定是任何一個領域的專家。據Jeff Hammerbacher(Cloudera的創始人,Facebook的早期員工)介紹,位數據科學家工作於Facebook。Facebook需要跨學科的技能,以便從當時大量的社交數據中提取有價值的信息。雖然我自稱是一個大數據科學家,但我已經關注這個交叉領域很久了,以至於有太多知識出現混淆。寫這本書就是想使用機器學習的術語來保持對這些領域的關注度。
    圖1數據科學家的一種可能定義近,在機器學習領域出現了另一個被廣泛討論的話題,即數據量擊敗模型的復雜度。在本書中可以看到一些Spark MLlib實現的例子,特別是NLP的word2vec。機器學習模型可以更快地遷移到新環境,也經常擊敗需要數小時纔能構建的更復雜的模型。因此,機器學習和大數據能夠很好地結合在一起。
    後也很重要的一點是微服務的出現。作者在本書中花了大量的篇幅介紹機器和應用程序通信,所以會很自然地提及Scala與Akka actor模型。
    對於大多數程序員而言,函數式編程更多是關於編程風格的變化,而不是編程語言本身。雖然Java 8開始有來自函數式編程的lambda表達式和流,但是人們仍然可以在沒有這些機制的情況下編寫函數式代碼,甚至可以用Scala編寫Java風格的代碼。使得Scala在大數據世界中名聲鵲起的兩個重要思想是惰性求值和不可變性,其中惰性求值可大大簡化多線程或分布式領域中的數據處理。Scala有一個可變集合庫和一個不可變集合庫。雖然從用戶的角度來看它們的區別很小,但從編譯器的角度來看,不變性大大增加了靈活性,並且惰性求值能更好地與大數據相結合,因為REPL將大多數信息推遲到管道的後期處理,從而增加了交互性。
    大數據一直備受關注,其主要原因是機器產生的數據量大大超越了人類在沒有使用計算機以前的數量。Facebook、Google、Twitter等社交網絡公司已經證明專門用於處理大數據的工具(如Hadoop、MapReduce和Spark)可以從這些數據塊中提取豐富的信息。
    本書後面將介紹關於Hadoop的內容。初它能在廉價硬件上處理大量的信息,因為當時傳統的關繫數據庫不能處理這樣的信息(或能處理,但是代價過高)。大數據這個話題太大了,而Spark纔是本書的重點,它是Hadoop MapReduce的另一個實現,Spark提高了磁盤上持久化保存數據的效率。通常認為使用Spark有點貴,因為它消耗更多的內存,要求硬件必須更可靠,但它也更具交互性。此外,Spark使用Scala工作(也可以使用Java和Python等),但Scala是主要的API語言。因此Spark用Scala在數據管道的表達方面有一定的協同性。
    本書主要內容第1章介紹數據分析師如何開始數據分析。除了允許用戶使用新工具查看更大的數據集以外,該章並沒有什麼新東西。這些數據集可能分布在多臺計算機上,但查看它們就像在本地機器上一樣簡單。當然,不會阻止用戶在單個機器上順序執行程序。但即使如此,作者寫作的這個筆記本電腦也有四個核,可同時運行1377個線程。Spark和Scala(並行集合)允許用戶透明地使用整個設備,有時並沒有顯式指定需要並行運行。現代服務器可對OS服務使用多達128個超線程。該章將展示如何使用新工具來進行數據分析,並用它來研究以前的數據集。
    第2章介紹在Scala/Spark之前一直存在的數據驅動過程,也會介紹完全數據驅動的企業,這類企業通過多臺數據生成機器的反饋來優化業務。大數據需要新的技術和架構來適應新的決策過程。該章借鋻了一些學術資料來闡述數據驅動型業務的通用架構。在這種架構下,大多數工人的任務是監控和調整數據管道。
    第3章重點介紹Spark的體繫結構,它是前面提及的Hadoop MapReduce的替代者(或補充)。該章還將特別介紹MLlib所支持的幾個算法。雖然這是一個嶄新的話題,但許多算法都對應著各種實現。該章將給出一些例子,比如怎樣運行org.apache.spark.mllib包中標準的機器學習算法。後介紹Spark的運行模式及性能調整。
    第4章介紹機器學習的原理,雖然Spark MLlib的內容可能會不斷變化,但這些原理是不會變的。監督學習和無監


     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部