[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • Spark數據分析:基於Python語言
    該商品所屬分類:研究生 -> 工學
    【市場價】
    342-496
    【優惠價】
    214-310
    【作者】 澳傑夫瑞·艾文(Jeffrey 
    【所屬類別】 圖書  教材  研究生/本科/專科教材  工學 
    【出版社】機械工業出版社 
    【ISBN】9787111622727
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111622727
    作者:[澳]傑夫瑞·艾文(Jeffrey

    出版社:機械工業出版社
    出版時間:2019年04月 

        
        
    "
    內容簡介
    本書重點關注Spark項目的基本知識,從Spark核心開始,然後拓展到各種Spark擴展、Spark相關項目、Spark子項目,以及Spark所處的豐富的生態繫統裡各種別的開源技術,比如Hadoop、Kafka、Cassandra等。
    目錄
    譯者序
    前言
    引言
    部分Spark基礎
    第1章大數據、Hadoop、Spark介紹 2
    1.1大數據、分布式計算、Hadoop簡介 2
    1.1.1大數據與Hadoop簡史 2
    1.1.2Hadoop簡介 3
    1.2Spark簡介 8
    1.2.1Spark背景 9
    1.2.2Spark的用途 9
    1.2.3Spark編程接口 9
    1.2.4Spark程序的提交類型 10
    1.2.5Spark應用程序的輸入/輸出類型 11譯者序
    前言
    引言
    部分Spark基礎
    第1章大數據、Hadoop、Spark介紹 2
    1.1大數據、分布式計算、Hadoop簡介 2
    1.1.1大數據與Hadoop簡史 2
    1.1.2Hadoop簡介 3
    1.2Spark簡介 8
    1.2.1Spark背景 9
    1.2.2Spark的用途 9
    1.2.3Spark編程接口 9
    1.2.4Spark程序的提交類型 10
    1.2.5Spark應用程序的輸入/輸出類型 11
    1.2.6Spark中的RDD 11
    1.2.7Spark與Hadoop 11
    1.3Python函數式編程 12
    1.3.1Python函數式編程中的數據結構 12
    1.3.2Python對像序列化 15
    1.3.3Python函數式編程基礎 17
    1.4本章小結 19
    第2章部署Spark 20
    2.1Spark部署模式 20
    2.1.1本地模式 21
    2.1.2Spark獨立集群 21
    2.1.3基於YARN運行Spark 22
    2.1.4基於Mesos運行Spark 22
    2.2準備安裝Spark 23
    2.3獲取Spark 23
    2.4在Linux或Mac OS X上安裝Spark 25
    2.5在Windows上安裝Spark 26
    2.6探索Spark安裝目錄 28
    2.7部署多節點的Spark獨立集群 29
    2.8在雲上部署Spark 30
    2.8.1AWS 30
    2.8.2GCP 32
    2.8.3Databricks 32
    2.9本章小結 34
    第3章理解Spark集群架構 35
    3.1Spark應用中的術語 35
    3.1.1Spark驅動器 36
    3.1.2Spark工作節點與執行器 38
    3.1.3Spark主進程與集群管理器 40
    3.2使用獨立集群的Spark應用 41
    3.3在YARN上運行Spark應用 42
    3.3.1ResourceManager作為集群管理器 42
    3.3.2ApplicationMaster作為Spark主進程 42
    3.4在YARN上運行Spark應用的部署模式 42
    3.4.1客戶端模式 42
    3.4.2集群模式 43
    3.4.3回顧本地模式 45
    3.5本章小結 45
    第4章Spark編程基礎 46
    4.1RDD簡介 46
    4.2加載數據到RDD 48
    4.2.1從文件創建RDD 48
    4.2.2從文本文件創建RDD 49
    4.2.3從對像文件創建RDD 52
    4.2.4從數據源創建RDD 52
    4.2.5從JSON文件創建RDD 54
    4.2.6通過編程創建RDD 56
    4.3RDD操作 57
    4.3.1RDD核心概念 57
    4.3.2基本的RDD轉化操作 61
    4.3.3基本的RDD行動操作 65
    4.3.4鍵值對RDD的轉化操作 69
    4.3.5MapReduce與單詞計數練習 75
    4.3.6連接操作 78
    4.3.7在Spark中連接數據集 82
    4.3.8集合操作 85
    4.3.9數值型RDD的操作 87
    4.4本章小結 89
    第二部分基礎拓展
    第5章Spark核心API高級編程 92
    5.1Spark中的共享變量 92
    5.1.1廣播變量 92
    5.1.2累加器 96
    5.1.3練習:使用廣播變量和累加器 99
    5.2Spark中的數據分區 100
    5.2.1分區概述 100
    5.2.2掌控分區 101
    5.2.3重分區函數 102
    5.2.4針對分區的API方法 104
    5.3RDD的存儲選項 106
    5.3.1回顧RDD譜繫 106
    5.3.2RDD存儲選項 107
    5.3.3RDD緩存 109
    5.3.4持久化RDD 109
    5.3.5選擇何時持久化或緩存RDD 112
    5.3.6保存RDD檢查點 112
    5.3.7練習:保存RDD檢查點 114
    5.4使用外部程序處理RDD 115
    5.5使用Spark進行數據采樣 117
    5.6理解Spark應用與集群配置 118
    5.6.1Spark環境變量 118
    5.6.2Spark配置屬性 121
    5.7Spark優化 124
    5.7.1早過濾,勤過濾 124
    5.7.2優化滿足結合律的操作 124
    5.7.3理解函數和閉包的影響 126
    5.7.4收集數據的注意事項 127
    5.7.5使用配置參數調節和優化應用 127
    5.7.6避免低效的分區 128
    5.7.7應用性能問題診斷 130
    5.8本章小結 133
    第6章使用Spark進行SQL與NoSQL編程 134
    6.1Spark SQL簡介 134
    6.1.1Hive簡介 134
    6.1.2Spark SQL架構 138
    6.1.3DataFrame入門 141
    6.1.4使用DataFrame 150
    6.1.5DataFrame緩存、持久化與重新分區 157
    6.1.6保存DataFrame輸出 158
    6.1.7訪問Spark SQL 161
    6.1.8練習:使用Spark SQL 163
    6.2在Spark中使用NoSQL繫統 165
    6.2.1NoSQL簡介 165
    6.2.2在Spark中使用HBase 166
    6.2.3練習:在Spark中使用HBase 169
    6.2.4在Spark中使用Cassandra 170
    6.2.5在Spark中使用DynamoDB 172
    6.2.6其他NoSQL平臺 174
    6.3本章小結 174
    第7章使用Spark處理流數據與消息 175
    7.1Spark Streaming簡介 175
    7.1.1Spark Streaming架構 176
    7.1.2DStream簡介 177
    7.1.3練習:Spark Streaming入門 183
    7.1.4狀態操作 184
    7.1.5滑動窗口操作 185
    7.2結構化流處理 188
    7.2.1結構化流處理數據源 188
    7.2.2結構化流處理的數據輸出池 189
    7.2.3輸出模式 190
    7.2.4結構化流處理操作 190
    7.3在Spark中使用消息繫統 192
    7.3.1Apache Kafka 192
    7.3.2KafkaUtils 195
    7.3.3練習:在Spark中使用Kafka 196
    7.3.4亞馬遜Kinesis 199
    7.4本章小結 203
    第8章Spark數據科學與機器學習簡介 204
    8.1Spark與R語言 204
    8.1.1R語言簡介 204
    8.1.2通過R語言使用Spark 210
    8.1.3練習:在RStudio中使用SparkR 215
    8.
    前言
    Spark在這場由大數據與開源軟件掀起的顛覆性革命中處於核心位置。不論是嘗試Spark的意向還是實際用例的數量都在以幾何級數增長,而且毫無衰退的跡像。本書將手把手引導你在大數據分析領域中收獲事業上的成功。
    本書重點
    本書重點關注Spark項目的基本知識,從Spark核心技術開始,然後拓展到各種Spark擴展技術、Spark相關項目及子項目,以及Spark所處的豐富的生態繫統裡各種別的開源技術,比如Hadoop、Kafka、Cassandra等。
    本書所介紹的Spark基本概念(包括運行環境、集群架構、應用架構等)與編程語言無關且非常基礎,而大多數示例程序和練習是用Python實現的。Spark的Python API(PySpark)為數據分析師、數據工程師、數據科學家等提供了易用的編程環境,讓開發者能在獲得Python語言的靈活性和可擴展性的同時,獲得Spark的分布式處理能力和伸縮性。
    本書所涉及的範圍非常廣泛,涵蓋了從基本的Spark核心編程到Spark SQL、Spark Streaming、機器學習等方方面面的內容。本書對於每個主題都給出了良好的介紹和概覽,足以讓你以Spark項目為基礎構建出針對任何特定領域或學科的平臺。Spark在這場由大數據與開源軟件掀起的顛覆性革命中處於核心位置。不論是嘗試Spark的意向還是實際用例的數量都在以幾何級數增長,而且毫無衰退的跡像。本書將手把手引導你在大數據分析領域中收獲事業上的成功。
    本書重點
    本書重點關注Spark項目的基本知識,從Spark核心技術開始,然後拓展到各種Spark擴展技術、Spark相關項目及子項目,以及Spark所處的豐富的生態繫統裡各種別的開源技術,比如Hadoop、Kafka、Cassandra等。
    本書所介紹的Spark基本概念(包括運行環境、集群架構、應用架構等)與編程語言無關且非常基礎,而大多數示例程序和練習是用Python實現的。Spark的Python API(PySpark)為數據分析師、數據工程師、數據科學家等提供了易用的編程環境,讓開發者能在獲得Python語言的靈活性和可擴展性的同時,獲得Spark的分布式處理能力和伸縮性。
    本書所涉及的範圍非常廣泛,涵蓋了從基本的Spark核心編程到Spark SQL、Spark Streaming、機器學習等方方面面的內容。本書對於每個主題都給出了良好的介紹和概覽,足以讓你以Spark項目為基礎構建出針對任何特定領域或學科的平臺。
    目標讀者
    本書是為有志進入大數據領域或已經入門想要進一步鞏固大數據領域知識的數據分析師和工程師而寫的。當前市場非常需要具備大數據技能、懂得大數據領域優秀處理框架Spark的工程師。本書的目標是針對這一不斷增長的市場需求培訓讀者,使得讀者獲得雇主急需的技能。
    對於閱讀本書來說,有Python使用經驗是有幫助的,沒有的話也沒關繫,畢竟Python對於任何有編程經驗的人來說都非常直觀易懂。讀者好對數據分析和數據處理有一定了解。這本書尤其適合有興趣進入大數據領域的數據倉庫技術人員閱讀。
    如何使用本書
    本書分為兩大部分共8章。部分“Spark基礎”包括4章,會使讀者深刻理解Spark是什麼,如何部署Spark,如何使用Spark進行基本的數據處理操作。
    第1章概要介紹大數據生態圈,包括Spark項目的起源和演進過程。討論Spark項目的關鍵屬性,包括Spark是什麼,用起來如何,以及Spark與Hadoop項目之間的關繫。
    第2章展示如何部署一個Spark集群,包括Spark集群的各種部署模式,以及調用Spark的各種方法。
    第3章討論Spark集群和應用是如何運作的,讓讀者深刻理解Spark是如何工作的。
    第4章介紹使用彈性分布式數據集(RDD)進行Spark初級編程的基礎知識。
    第二部分“基礎拓展”包括後4章的內容,擴展到Spark的core模塊以外,包括SQL和NoSQL繫統、流處理應用、數據科學與機器學習中Spark的使用。
    第5章講解用來擴展、加速和優化常規Spark例程件,包括各種共享變量和RDD存儲,以及分區的概念及其實現。
    第6章討論Spark與SQL的整合,還有Spark與非關繫型數據庫的整合。
    第7章介紹Spark的Streaming子項目,以及Streaming中基本的DStream對像。該章還涵蓋Spark對於Apache Kafka這樣的常用消息繫統的使用。
    第8章介紹通過R語言使用Spark建立預測模型,以及Spark中用來實現機器學習的子項目MLlib。
    本書代碼
    本書中各個練習的示例數據和源代碼可以從http://sparkusingpython.com下載。也可以從https://github.com/sparktraining/spark_using_python查看或者下載。


     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部