作 者:陳歡 林世飛 著作
定 價:49
出 版 社:人民郵電出版社
出版日期:2016年05月01日
頁 數:210
裝 幀:簡裝
ISBN:9787115422286
1. UCloud季昕華、Databricks連城,阿裡胡熠,棒米科技武澤勝,騰訊肖磊\\靳志輝\\徐羽等聯袂推薦!
2. 騰訊專家搶先發售分享Spark實踐,作者均為騰訊一線員工,擁有豐富的實戰經驗
3. 基於真實數據,用案例分析全面解讀大數據應用設計
4. 騰訊傑出研發者的Spark實踐,揭秘廣告和推薦繫統核心技術
●目錄
●
●第1 章 Spark 與大數據 1
●1.1 大數據的發展及現狀 1
●1.1.1 大數據時代所面臨的問題 1
●1.1.2 谷歌的大數據解決方案 2
●1.1.3 Hadoop 生態繫統 3
●1.2 Spark 應時而生 4
●1.2.1 Spark 的起源 4
●1.2.2 Spark 的特點 5
●1.2.3 Spark 的未來發展 6
●第2 章 Spark 基礎 8
●2.1 Spark 本地單機模式體驗 8
●2.1.1 安裝虛擬機 8
●2.1.2 安裝JDK 19
●2.1.3 下載Spark 預編譯包 21
●2.1.4 本地體驗Spark 22
●2.2 高可用Spark 分布式集群部署 25
●2.2.1 集群總覽 26
●2.2.2 集群機器的型號選擇 28
●部分目錄
本書是Spark實戰指南,全書共分8章。前4章介紹Spark的部署、工作機制和內核,後4章分別通過實戰項目介紹Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模塊。此外,本書詳細介紹了常見的實戰問題,比如大數據環境下的配置設置、程序調優等。本書附帶的一鍵安裝腳本,更能為初學者提供很大幫助。
陳歡 林世飛 著作
陳歡,騰訊傑出程序員,15年編碼經驗,曾任職網絡安全、互聯網金融等部門,親手從零建設了財付通業務的Spark集群,並使之同時支持SQL、實時計算、機器學習等多種數據計算場景。他目前就職於騰訊社交與效果廣告部,從事大數據分析工作。
林世飛,騰訊傑出研究員,2005年加入騰訊,先後在無線產品、安全中心、搜索平臺、開放平臺、社交與效果廣告部等部門從事開發和團隊管理工作。他對網絡安全、搜索引擎、數據挖掘、機器學習有一定了解,熱衷知識傳播和分享,曾獲騰訊學院2009年年度傑出講師。目前,他就職於社交與效果廣告部,負責廣告繫統相關的研發工作。