[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • Spark 計算機與互聯網 陳歡 林世飛 人民郵電出版社 978711542228
    該商品所屬分類:圖書 -> ε
    【市場價】
    396-576
    【優惠價】
    248-360
    【出版社】人民郵電出版社 
    【ISBN】9787115422286
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:人民郵電出版社
    ISBN:9787115422286
    商品編碼:39648189488

    開本:小16開
    出版時間:2016-05-01
    頁數:210

    字數:339000
    代碼:49

        
        
    "
      商品基本信息,請以下列介紹為準
    商品名稱:Spark 計算機與互聯網 書籍
    作者:陳歡 林世飛
    代碼:49.0
    出版社:人民郵電
    出版日期:2016-05-01
    ISBN:9787115422286
    印次:
    版次:1
    裝幀:平裝
    開本:小16開

      內容簡介
    本書是Spark實戰指南,全書共分8章。前4章介紹Spark的部署、工作機制和內核,後4章分別通過實戰項目介紹Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模塊。此外,本書詳細介紹了常見的實戰問題,比如大數據環境下的配置設置、程序調優等。本書附帶的一鍵安裝腳本,更能為初學者提供很大幫助。

      目錄

    第1章 Spark與大數據1
    1.1 大數據的發展及現狀1
    1.1.1 大數據時代所面臨的問題1
    1.1.2 谷歌的大數據解決方案2
    1.1.3 Hadoop生態繫統3
    1.2 Spark應時而生4
    1.2.1 Spark的起源4
    1.2.2 Spark的特點5
    1.2.3 Spark的未來發展6
    第2章 Spark基礎8
    2.1 Spark本地單機模式體驗8
    2.1.1 安裝虛擬機8
    2.1.2 安裝JDK19
    2.1.3 下載Spark預編譯包21
    2.1.4 本地體驗Spark22
    2.2 高可用Spark分布式集群部署25
    2.2.1 集群總覽26
    2.2.2 集群機器的型號選擇28
    2.2.3 初始化集群機器環境29
    2.2.4 部署ZooKeeper集群33
    2.2.5 編譯Spark35
    2.2.6 部署Spark Standalone集群37
    2.2.7 高可用Hadoop集群40
    2.2.8 讓Spark運行在YARN上40
    2.2.9 一鍵部署高可用Hadoop Spark集群42
    2.3 Spark編程指南43
    2.3.1 交互式編程43
    2.3.2 RDD創建44
    2.3.3 RDD作47
    2.3.4 使用其他語言開發Spark程序54
    2.4 打包和提交54
    2.4.1 編譯、鏈接、打包54
    2.4.2 提交56
    第3章 Spark工作機制58
    3.1 調度管理58
    3.1.1 集群概述及名詞解釋58
    3.1.2 Spark程序之間的調度60
    3.1.3 Spark程序內部的調度63
    3.2 內存管理65
    3.2.1 RDD持久化65
    3.2.2 共享變量66
    3.3 容錯機制67
    3.3.1 容錯體繫概述67
    3.3.2 Master節點失效68
    3.3.3 Slave節點失效69
    3.4 監控管理69
    3.4.1 Web界面69
    3.4.2 REST API72
    3.4.3 Metrics指標體繫73
    3.4.4 其他監控工具73
    3.5 Spark程序配置管理73
    3.5.1 Spark程序配置加載過程74
    3.5.2 環境變量配置74
    3.5.3 Spark屬性項配置74
    3.5.4 查看當前的配置76
    3.5.5 配置Spark日志76
    第4章 Spark內核講解77
    4.1 Spark核心數據結構RDD77
    4.1.1 RDD的定義78
    4.1.2 RDD的Transformation80
    4.1.3 RDD的Action82
    4.1.4 Shuffle83
    4.2 SparkContext84
    4.2.1 SparkConf配置84
    4.2.2 初始化過程85
    4.2.3 其他功能接口87
    4.3 DAG調度87
    4.3.1 DAGScheduler87
    4.3.2 TaskScheduler90
    第5章 Spark SQL與數據倉庫92
    5.1 Spark SQL基礎93
    5.1.1 分布式SQL引擎93
    5.1.2 支持的SQL語法97
    5.1.3 支持的數據類型98
    5.1.4 DataFrame99
    5.1.5 DataFrame數據源103
    5.1.6 性能調優104
    5.2 Spark SQL原理和運行機制104
    5.2.1 Spark SQL整體架構105
    5.2.2 Catalyst執行優化器105
    5.3 應用場景:基於數據建立電商數據倉庫110
    5.3.1 電商數據倉庫場景111
    5.3.2 數據準備和表設計111
    5.3.3 用Spark SQL來完成日常運營數據分析115
    5.3.4 Spark SQL在大規模數據下的性能表現120
    第6章 Spark流式計算122
    6.1 Spark Streaming基礎知識123
    6.1.1 入門簡單示例123
    6.1.2 基本概念124
    6.1.3 作129
    6.2 深入理解Spark Streaming132
    6.2.1 DStream的兩類

      編輯

    季昕華、徐羽作序,連城/胡熠/武澤勝/肖磊/靳志輝聯袂

     

    騰訊專家次分享Spark*實踐

     

    基於真實數據,用案例分析全面解讀大數據應用設計
     

      媒體評論

    “相較於其他大數據解決方案,Spark的一大特點便是擅長在單一框架內搭建一體化大數據流水線。本書以Spark 1.4為藍本,既帶讀者概覽Spark的各個組件,又從實際出發,給出了各種典型案例的解決思路,尤其適合初學者快速把握Spark的全貌和各組件的基本特點,從而結合實際,有針對性地發揮Spark一體的優勢。”——Apache Spark committer,Databricks 軟件工程師 連城
    ?
    “Spark作為一個專門處理分布式大數據的有力工具,與“機器學習”踫撞出了火花。本書拿出一章介紹了計算廣告中一個核心模型——點擊率(CTR)預估的邏輯回歸——在MLlib中的完整實現,為“Spark 機器學習”提供了很好的範例。相信這本全面介紹Spark的實用寶典,會為讀者提供很大幫助。”——*B2B搜索聯盟算法負責人? 胡熠
    ?
    “以Hadoop為核心的技術,了過去十多年大數據技術的發展,我在小米經歷了小米大數據團隊的從無到有,見證了從剛開始Hadoop支持所有業務,到後來大量的業務開始使用Spark的過程,深刻體會到Spark作為後起之秀,在近幾年的發展突飛猛進,大有取代Hadoop之勢。一本好的技術書,既要能講清楚技術背後的原理,又要能說明白其應用場景,《Spark*實踐》這兩方面都做到了,是學習Spark技術不可多得的好書。”——棒米科技聯合創始人&CTO 武澤勝
    ?
    “數據已經成為工業的重要原材料,我們無法想像一個沒有數據存在的“真空”環境。可以說,我們及我們周邊的事物都隻是數據繁衍的一個載體;如何利用好這個原材料,加工好這個原材料,挖掘好這個原材料,理解好這個原材料,已經成為一個核心競爭力。
    作為Hadoop繫的重要補充,Spark更是為大數據處理虎上添翼,尤其是在更加復雜的數據迭代技術方面。作者結合多年實踐著就本書,可以幫你快速進入這一“聖殿”,少走彎路,更加快速地決勝千裡。”——騰訊數據平臺部 精準中心 總監 肖磊
    ?
    “面對諸多的大數據技術,如何能夠快速學習?本書的作者們試著給Spark初學者設計了一條路徑:在深入講解理論的同時,引導讀者利用實際可運行的數據案例低成本地在實踐中學習。“紙上得來終覺淺,絕知此事要躬行”,學習Spark技術的有效方式就是在實際的Spark環境中‘玩’數據。”——騰訊 社交與效果廣告部 質量研發中心? 總監 靳志輝




    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部