[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  • 新类目

     管理
     投资理财
     经济
     社会科学
  • 深入理解Flink核心設計與實踐原理(博文視點出品)
    該商品所屬分類:圖書 -> 電子工業出版社
    【市場價】
    1523-2208
    【優惠價】
    952-1380
    【作者】 劉洋 
    【所屬類別】 電子工業出版社 
    【出版社】電子工業出版社 
    【ISBN】9787121399114
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    出版社:電子工業出版社
    ISBN:9787121399114
    版次:1

    商品編碼:12765369
    品牌:電子工業出版社
    包裝:平裝

    開本:16開
    出版時間:2020-11-01
    用紙:膠版紙

    頁數:488
    字數:683200
    正文語種:中文

    作者:劉洋

        
        
    "

    產品特色

    編輯推薦

    適讀人群 :本書適合初級和中級軟件工程師閱讀,未接觸過流計算領域的Java開發者也可以從本書中獲益。針對初學者,本書提供Windows環境搭建的演示,使不具備Linux繫統操作經驗的讀者也可以快速學習Apache Flink。

    講解Flink的多種部署方式——單機部署、Standalone模式部署、YARN模式部署及相應的高可用設置。

    分析Flink分布式開發的基礎概念、Flink的流處理開發的基本功能,包括讀取數據和輸出數據,以及對數據流進行各種轉換操作等,同時還講解如何對開發的Flink應用程序進行本地測試。

    講解Flink在流處理開發中對有狀態計算的支持,包括檢查點機制、保存點機制、各種狀態後端等。

    講解Flink在流處理開發中的高級功能,如窗口操作、時間處理、連接操作、側端輸出操作,以及自定義數據源和自定義數據接收器,同時講解Apache Kafka連接器對數據源和數據接收器的支持。

    介紹Flink在批處理開發中的基本操作,包括讀取數據和輸出數據,以及對數據集進行的各種轉換操作等。

    介紹Flink的Table API和SQL如何統一流處理和批處理,以及Table API和SQL在流處理中的一些特別情況,包括動態表、時間屬性和時態表等。

    介紹Flink中部署程序的基本操作,包括配置程序的執行參數、程序的並行度、程序的重啟策略、發布程序的方式等。

    內容簡介

    本書從Apache Flink的緣起開始,由淺入深,理論結合實踐,全方位地介紹Apache Flink這一處理海量數據集的高性能工具。本書圍繞部署、流處理、批處理、Table API和SQL四大模塊進行講解,並詳細說明Apache Flink的每個特性的實際業務背景,使讀者不僅能編寫可運行的Apache Flink程序代碼,還能深刻理解並正確地將其運用到合適的生產業務環境中。雖然本書是以Apache Flink技術框架來講解流計算技術的,但是流計算領域開發所面臨的各種問題同樣是Java後端開發者在進行服務端開發時所要面臨的,如有狀態計算、Exactly Once語義等。因此,Apache Flink框架為解決這些問題而設計的方案同樣值得Java後端開發者借鋻。本書適合初級和中級軟件工程師閱讀,未接觸過流計算領域的Java開發者也可以從本書中獲益。針對初學者,本書提供Windows環境搭建的演示,使不具備Linux繫統操作經驗的讀者也可以快速學習Apache Flink。

    作者簡介

    國家認證軟件設計師,獲得Apache Kylin管理員認證。現任某上市咨詢公司高級咨詢顧問,有多年大數據、流式計算方面的開發經驗,對Hadoop、Strom、Flink等大數據計算引擎有著非常深入的理解,積累了豐富的項目實踐經驗。先後利用相關技術為銀行、保險、能源等領域的頭部企業解決業務痛點。個人技術博客:www.cnblogs.com/intsmaze個人Github項目:github.com/intsmaze

    內頁插圖

    目錄

    目錄



    第1章Apache Flink介紹
    1.1Apache Flink簡介
    1.1.1Apache Flink是什麼
    1.1.2Apache Flink應用場景
    1.2Apache Flink組件
    1.2.1分層API
    1.2.2作業管理器、任務管理器、客戶端
    第2章Apache Flink的安裝與部署
    2.1本地模式
    2.1.1安裝JDK
    2.1.2下載並安裝Flink
    2.1.3本地模式集群
    2.1.4Windows繫統部署
    2.2Standalone模式
    2.2.1配置集群免密登錄
    2.2.2部署Standalone模式的集群
    2.3YARN模式
    2.3.1在YARN集群中啟動一個長期運行的Flink集群
    2.3.2在YARN集群中運行Flink作業
    2.3.3Flink和YARN的交互方式
    2.3.4問題彙總
    2.4Flink集群高可用
    2.4.1Standalone模式下JobManager的高可用
    2.4.2YARN模式下JobManager的高可用
    第3章Apache Flink的基礎概念和通用API
    3.1基礎概念
    3.1.1數據集和數據流
    3.1.2Flink程序的組成
    3.1.3延遲計算
    3.1.4指定分組數據集合的鍵
    3.1.5指定轉換函數
    3.1.6支持的數據類型
    3.2Flink程序模型
    3.2.1程序和數據流
    3.2.2並行數據流
    3.2.3窗口
    3.2.4時間
    3.2.5有狀態計算
    3.2.6容錯檢查點
    3.2.7狀態後端
    3.2.8保存點
    3.3Flink程序的分布式執行模型
    3.3.1任務和任務鏈
    3.3.2任務槽和資源
    3.4Java的Lambda表達式
    3.4.1類型擦除
    3.4.2類型提示
    第4章流處理基礎操作
    4.1DataStream的基本概念
    4.1.1流處理示例程序
    4.1.2數據源
    4.1.3數據流的轉換操作
    4.1.4數據接收器
    4.2數據流基本操作
    4.2.1Map
    4.2.2FlatMap
    4.2.3Filter
    4.2.4KeyBy
    4.2.5Reduce
    4.2.6Aggregations
    4.2.7Split和Select
    4.2.8Project
    4.2.9Union
    4.2.10Connect和CoMap、CoFlatMap
    4.2.11Iterate
    4.3富函數
    4.3.1基本概念
    4.3.2代碼演示
    4.4任務鏈和資源組
    4.4.1默認鏈接
    4.4.2開啟新鏈接
    4.4.3禁用鏈接
    4.4.4設置任務槽共享組
    4.5物理分區
    4.5.1自定義分區策略
    4.5.2shuffle分區策略
    4.5.3broadcast分區策略
    4.5.4rebalance分區策略
    4.5.5rescale分區策略
    4.5.6forward分區策略
    4.5.7global分區策略
    4.6流處理的本地測試
    4.6.1本地執行環境
    4.6.2集合支持的數據源和數據接收器
    4.6.測試
    4.6.4集成測試
    4.7分布式緩存
    4.7.1注冊分布式緩存文件
    4.7.2訪問分布式緩存文件
    4.7.3BLOB服務的配置參數
    4.7.4部署到集群中運行
    4.8將參數傳遞給函數
    4.8.1通過構造函數傳遞參數
    4.8.2使用ExecutionConfig傳遞參數
    4.8.3將命令行參數傳遞給函數
    第5章流處理中的狀態和容錯
    5.1有狀態計算
    5.1.1Operator狀態和Keyed狀態
    5.1.2托管的Keyed狀態
    5.1.3托管的Operator狀態
    5.2檢查點機制
    5.2.1先決條件
    5.2.2啟用和配置檢查點機制
    5.2.3目錄結構
    5.2.4其他相關的配置選項
    5.3狀態後端
    5.3.1MemoryStateBackend
    5.3.2FsStateBackend
    5.3.3RocksDBStateBackend
    5.3.4配置狀態後端
    5.4保存點機制
    5.4.1分配操作符id
    5.4.2保存點映射
    5.4.3保存點操作
    5.4.4保存點配置
    5.5廣播狀態
    5.5.1前置條件
    5.5.2廣播函數
    5.5.3代碼實現
    5.6調優檢查點和大狀態
    5.6.1監視狀態和檢查點
    5.6.2調優檢查點
    5.6.3使用異步檢查點操作
    5.6.4調優RocksDB
    5.6.5容量規劃
    5.6.6壓縮
    第6章流處理高級操作
    6.1窗口
    6.1.1窗口的基本概念
    6.1.2窗口分配器
    6.1.3窗口函數
    6.1.4窗口觸發器
    6.1.5窗口剔除器
    6.1.6允許數據延遲
    6.1.7窗口的快速實現方法
    6.1.8查看窗口使用組件
    6.2時間
    6.2.1時間語義
    6.2.2事件時間與水印
    6.2.3設置時間特性
    6.3數據流的連接操作
    6.3.1窗口Join
    6.3.2窗口CoGroup
    6.3.3間隔Join
    6.4側端輸出
    6.4.1基於復制數據流的方案
    6.4.2基於Split和Select的方案
    6.4.3基於側端輸出的方案
    6.5ProcessFunction
    6.5.1基本概念
    6.5.2計時器
    6.6自定義數據源函數
    6.6.1SourceFunction接口
    6.6.2ParallelSourceFunction接口
    6.6.3RichParallelSourceFunction抽像類
    6.6.4具備檢查點特性的數據源函數
    6.7自定義數據接收器函數
    6.7.1SinkFunction接口
    6.7.2RichSinkFunction抽像類
    6.8數據流連接器
    6.8.1內置連接器
    6.8.2數據源和數據接收器的容錯保證
    6.8.3Kafka連接器
    6.8.4安裝Kafka的注意事項
    6.8.5Kafka 1.0.0+ 連接器
    6.8.6Kafka消費者
    6.8.7Kafka生產者
    6.8.8Kafka連接器指標
    第7章批處理基礎操作
    7.1DataSet的基本概念
    7.1.1批處理示例程序
    7.1.2數據源
    7.1.3數據接收器
    7.2數據集的基本操作
    7.2.1Map
    7.2.2FlatMap
    7.2.3MapPartition
    7.2.4Filter
    7.2.5Project
    7.2.6Union
    7.2.7Distinct
    7.2.8GroupBy
    7.2.9Reduce
    7.2.10ReduceGroup
    7.2.11Aggregate
    7.2.12Join
    7.2.13OuterJoin
    7.2.14Cross
    7.2.15CoGroup
    7.3將參數傳遞給函數
    7.4廣播變量
    7.4.1注冊廣播變量
    7.4.2訪問廣播變量
    7.4.3代碼實現
    7.5物理分區
    7.5.1Rebalance
    7.5.2PartitionByHash
    7.5.3PartitionByRange
    7.5.4SortPartition
    7.6批處理的本地測試
    7.6.1本地執行環境
    7.6.2集合支持的數據源和數據接收器
    第8章Table API和SQL
    8.1基礎概念和通用API
    8.1.1添加依賴
    8.1.2第一個Hello World表程序
    8.1.3表程序的公共結構
    8.1.4創建一個TableEnvironment
    8.1.5在目錄中注冊表
    8.1.6查詢一個表
    8.1.7DataStream和DataSet API的集成
    8.1.8數據類型到表模式的映射
    8.1.9查詢優化
    8.2SQL
    8.2.1指定一個查詢
    8.2.2SQL支持的語法
    8.2.3SQL操作
    8.2.4數據類型
    8.2.5保留關鍵字
    8.3Table API
    8.4自定義函數
    8.4.1標量函數
    8.4.2表函數
    8.4.3聚合函數
    8.4.4自定義函數與運行環境集成
    8.5SQL客戶端
    8.5.1啟動SQL客戶端
    8.5.2配置參數
    8.5.3分離的SQL查詢
    8.5.4SQL客戶端中的視圖
    8.5.5SQL客戶端中的時態表
    第9章流處理中的Table API和SQL
    9.1動態表
    9.1.1動態表和連續查詢
    9.1.2在數據流中定義動態表
    9.1.3動態表到數據流的轉換
    9.2時間屬性
    9.2.1基本概念
    9.2.2組窗口
    9.2.3處理時間
    9.2.4事件時間
    9.3動態表的Join
    9.3.1常規Join
    9.3.2時間窗口Join
    9.4時態表
    9.4.1需求背景
    9.4.2時態表函數
    9.5查詢配置
    9.5.1查詢配置對像
    9.5.2空閑狀態保留時間
    9.6連接外部繫統
    9.6.1概述
    9.6.2表模式
    9.6.3更新模式
    9.6.4表格式
    9.6.5表連接器
    9.6.6未統一的TableSources和TableSinks
    第10章執行管理
    10.1執行參數
    10.1.1在ExecutionEnvironment中設置參數
    10.1.2在ExecutionConfig中設置參數
    10.2並行執行
    10.2.1操作符級別
    10.2.2執行環境級別
    10.2.3客戶端級別
    10.2.4繫統級別
    10.2.5設置最大並行度
    10.3重啟策略
    10.3.1固定延遲重啟策略
    10.3.2故障率重啟策略
    10.3.3沒有重新啟動策略
    10.3.4回退重啟策略
    10.4程序打包和部署
    10.4.1打包Flink程序
    10.4.2Web UI(Web管控臺)提交
    10.4.3命令行客戶端提交
    10.5命令行接口
    10.5.1將Flink程序提交到Flink集群
    10.5.2列出集群中的作業
    10.5.3調整集群中的作業
    10.5.4保存點操作命令
    10.6執行計劃
    10.6.1在線可視化工具
    10.6.2Web管控臺可視化

    查看全部↓

    前言/序言

    前言



    為什麼要寫這本書?
    最近幾年,在Apache Flink(簡稱Flink)社區的推動下,國內越來越多的公司開始應用Flink去解決生產問題。筆者在2019年便開始全面從Storm轉到Flink。當時正值Flink在國內推廣的起步階段,相關繫統性學習資料較少,因此筆者隻能通過閱讀Flink官網和瀏覽Flink框架源碼進行學習,踩了不計其數的“雷”。例如,某些特性因為相關描述較少,導致初學者無法真正理解該特性所解決的實際業務背景,或者因為某些特性的示例代碼不全,導致初學者無法快速使用該特性編寫可運行的代碼。本書按照筆者的學習過程來編寫大綱,可以幫助初學者快速入門Flink,避免在學習過程中出現各種不必要的問題而浪費時間。

    本書內容
    本書共10章,其中第2、3、10章是讀者必須閱讀的章節,其他章節讀者可以結合自己的業務情況閱讀。
    第1章主要介紹Flink分布式處理框架的背景、特性及應用場景。讀者可以快速閱讀本章以建立對Flink的基本認識。
    第2章主要介紹Flink的多種部署方式,重點講解了它的單機部署、Standalone模式部署、YARN模式部署及相應的高可用設置。讀者可以根據自己的業務需求選擇其中一種方式搭建Flink。
    第3章主要介紹Flink分布式開發的基礎概念。這些概念是流處理和批處理開發中的通用概念,為此讀者需要仔細閱讀本章後再根據自己的業務需求選擇閱讀相關流處理章節、批處理章節或Table&SQL章節的內容。
    第4章主要介紹Flink的流處理開發的基本功能,包括讀取數據和輸出數據,以及對數據流進行各種轉換操作等,同時還講解了如何對開發的Flink應用程序進行本地測試。讀者在閱讀完本章後便可以使用Flink進行一些非關鍵業務程序的開發工作。
    第5章主要介紹Flink在流處理開發中對有狀態計算的支持,包括檢查點機制、保存點機制、各種狀態後端等。讀者在閱讀完本章後便可以使用Flink進行一些關鍵業務程序的開發工作。
    第6章主要介紹Flink在流處理開發中的高級功能,如窗口操作、時間處理、連接操作、側端輸出操作,以及自定義數據源和自定義數據接收器,同時講解了Apache Kafka連接器對數據源和數據接收器的支持。讀者在閱讀完本章後便可以使用Flink進行一些關鍵且復雜的業務程序的開發工作。
    第7章主要介紹Flink在批處理開發中的基本操作,包括讀取數據和輸出數據,以及對數據集進行的各種轉換操作等。讀者在閱讀完本章後便可以使用Flink進行一些離線批處理任務的開發工作。
    第8章主要介紹Flink的Table API和SQL如何統一流處理和批處理。Table API和SQL借助Apache Calcite進行查詢的解析、校驗和優化。它們可以簡化用戶的開發工作。針對一些常規的業務,開發者隻需要寫SQL,Flink會自動將SQL轉化為流程序或批程序去執行。
    第9章主要介紹Table API和SQL在流處理中的一些特別情況,包括動態表、時間屬性和時態表等。
    第10章主要介紹Flink中部署程序的基本操作,包括配置程序的執行參數、程序的並行度、程序的重啟策略、發布程序的方式等。

    本書是以Flink 的1.7版本為基礎編寫的,示例代碼均用Java語言進行編寫,同時本書的大部分代碼均可運行在Flink 的1.8、1.9、1.10版本上。在本書的下載資源中提供了1.8、1.9、1.10版本的變動詳情說明,版本變動主要體現在底層優化上,在API的使用方式上並無太大變動,大的差異在於SQL模塊(例如在基於流處理的SQL模塊中增加了新的特性,以及集成Hive等)。
    本書相關資源的下載地址為www.broadview.com.cn/39911。對本書的勘誤也可以在此網頁上提交。
    由於個人能力有限,書中難免有疏漏之處,歡迎讀者批評指正。

    劉洋

    查看全部↓



    "
     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部