[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • Hadoop與Spark入門
    該商品所屬分類:研究生 -> 工學
    【市場價】
    292-424
    【優惠價】
    183-265
    【作者】 覃雄派、陳躍國 
    【所屬類別】 圖書  教材  研究生/本科/專科教材  工學 
    【出版社】清華大學出版社 
    【ISBN】9787302613633
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302613633
    叢書名:面向新工科專業建設計算機繫列教材

    作者:覃雄派、陳躍國
    出版社:清華大學出版社
    出版時間:2022年11月 


        
        
    "
    編輯推薦

    本書篇幅不長,內容易懂,有利於快速入門。
    兼顧原理講解和具體操作,實踐性強,使讀者興趣盎然,更有成就感。
    利用虛擬化技術,無須搭建物理集群,在一臺計算機上完成分布式部署,萬事不求人,玩轉Hadoop和Spark。

     
    內容簡介

    本書為一本大數據技術的入門書籍,介紹Hadoop大數據平臺和Spark大數據平臺及相關工具的原理,以及如何進行部署和簡單開發。 全書包含13章: 第1、2章介紹如何為深入學習Hadoop和Spark做環境準備,包括VMware虛擬機的創建和CentOS操作繫統安裝。第3~6章介紹Hadoop大數據平臺的基本原理,包括HDFS、MapReduce計算模型、HBase數據庫,以及Hive數據倉庫的原理、部署方法和開發技術。第7~11章介紹Spark大數據平臺的基本原理,包括彈性分布式數據集、轉換與動作操作、寬依賴與窄依賴、有向無環圖表達的作業及其處理過程等,並且介紹了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和開發技術。後兩章介紹了Flume(第12章)和Kafka(第13章)兩個工具,Flume用於大量日志的收集和處理,Kafka用於對大量快速到達的數據進行及時、可靠、暫時的存儲。 本書適合高等院校高年級本科生以及碩士研究生使用,也可以供非計算機專業學生及相關領域技術人員參考。

    目錄
    第1章VMware與虛擬機1
    1.1VMware簡介1
    1.2VMware的安裝2
    1.3VMware的網絡配置2
    1.3.1VMnet0網卡配置2
    1.3.2VMnet1網卡配置3
    1.3.3VMnet8網卡配置3
    1.4Windows環境下對VMnet8的DNS進行配置6
    1.5利用管理員權限編輯網卡7
    1.6總結7
    1.7思考題8
    參考文獻8
    第2章CentOS操作繫統安裝9
    2.1新建VMware虛擬機9

    第1章VMware與虛擬機1
    1.1VMware簡介1
    1.2VMware的安裝2
    1.3VMware的網絡配置2
    1.3.1VMnet0網卡配置2
    1.3.2VMnet1網卡配置3
    1.3.3VMnet8網卡配置3
    1.4Windows環境下對VMnet8的DNS進行配置6
    1.5利用管理員權限編輯網卡7
    1.6總結7
    1.7思考題8
    參考文獻8
    第2章CentOS操作繫統安裝9
    2.1新建VMware虛擬機9
    2.2安裝CentOS14
    2.3配置Yum18
    2.4為CentOS安裝圖形用戶界面20
    2.5CentOS的網絡配置20
    2.5.1虛擬機的網絡配置20
    2.5.2在CentOS操作繫統裡對網卡進行設置21
    2.6Samba配置23
    2.7配置SSHD26
    2.8重新啟動虛擬機需要執行的命令27
    2.9思考題28
    第3章Hadoop入門29
    3.1Hadoop簡介29
    3.2HDFS30
    3.2.1寫文件31
    3.2.2讀文件32
    3.2.3Secondary NameNode介紹33
    3.3MapReduce工作原理34
    3.3.1MapReduce執行引擎35
    3.3.2MapReduce計算模型37
    3.3.3Hadoop 1.0的應用38
    3.4Hadoop生態繫統38
    3.5Hadoop 2.040
    3.5.1Hadoop 1.0的優勢和局限40
    3.5.2從Hadoop 1.0到Hadoop 2.041
    3.5.3YARN原理41
    3.5.4YARN的優勢43
    3.6思考題44
    〖3〗Hadoop與Spark入門目錄〖3〗第4章Hadoop安裝與HDFS、MapReduce實驗45
    4.1安裝JDK45
    4.2新建虛擬機集群47
    4.2.1網絡配置小結47
    4.2.2配置各個虛擬機別名48
    4.2.3配置各個虛擬機的/etc/hosts文件48
    4.3無密碼SSH登錄49
    4.4Hadoop安裝、配置和啟動52
    4.4.1coresite.xml配置文件54
    4.4.2hdfssite.xml配置文件54
    4.4.3mapredsite.xml配置文件55
    4.4.4yarnsite.xml配置文件56
    4.4.5配置hadoopenv.sh腳本文件59
    4.4.6配置yarnenv.sh腳本文件59
    4.4.7主機配置59
    4.5格式化HDFS60
    4.6啟動Hadoop60
    4.7報告HDFS的基本信息62
    4.8使用日志62
    4.9Hadoop管理界面63
    4.10Hadoop測試63
    4.10.1HDFS常用文件操作命令63
    4.10.2測試WordCount程序64
    4.11配置History Server64
    4.12若干問題解決65
    4.13HDFS Java程序分析69
    4.14WordCount程序代碼簡單分析73
    4.15MapReduce Sort76
    4.16MapReduce Java開發環境配置76
    4.17思考題79
    參考文獻80
    第5章HBase簡介、部署與開發81
    5.1HBase簡介81
    5.2HBase訪問接口81
    5.3HBase的數據模型82
    5.4HBase繫統架構83
    5.5HBase存儲格式85
    5.6在HBase繫統上運行MapReduce87
    5.7HBase安裝、配置與運行87
    5.8啟動HBase並且測試90
    5.9使用HBase Shell92
    5.10HBase Java實例分析93
    5.11若干問題解決97
    5.12思考題99
    參考文獻99
    第6章Hive數據倉庫100
    6.1Hive簡介100
    6.2Hive數據模型102
    6.3Hive安裝、配置和運行103
    6.3.1使用MySQ信息管理104
    6.3.2安裝和配置Hive105
    6.3.3啟動Hive108
    6.4若干問題解決110
    6.5hiveserver2與beeline112
    6.6Hive安裝問題115
    6.7HWI服務115
    6.8Metastore服務116
    6.9Hive的Java開發116
    6.10Tez簡介119
    6.10.1Hadoop 2.0上的交互式查詢引擎Hive on Tez119
    6.10.2把數據處理邏輯建模成一個DAG連接起來的任務121
    6.11Hadoop平臺上的列存儲技術121
    6.11.1列存儲的優勢121
    6.11.2Parquet列存儲格式121
    6.12思考題126
    參考文獻126
    第7章Spark及其生態繫統127
    7.1Spark簡介127
    7.1.1Spark軟件架構127
    7.1.2Spark的主要優勢128
    7.2Hadoop的局限和Spark的誕生129
    7.3Spark的特性130
    7.4Spark生態繫統131
    7.5RDD及其處理132
    7.5.1DAG、寬依賴與窄依賴133
    7.5.2DAG的調度執行134
    7.6Spark的部署135
    7.7Spark SQL136
    7.8Spark的應用案例137
    7.9總結138
    7.10思考題138
    參考文獻138
    第8章Spark的安裝、部署與運行139
    8.1Spark的安裝、配置與運行139
    8.2啟動Spark142
    8.2.1啟動sparksql shell運行SQL144
    8.2.2啟動pyspark shell運行SQL144
    8.2.3用pyspark shell進行數據處理145
    8.2.4啟動scala shell運行WordCount145
    8.2.5啟動scala shell運行SQL(本地文件)146
    8.2.6啟動scala shell運行SQL(HDFS文件)147
    8.2.7配置和啟動Thrift Server147
    8.2.8錯誤分析150
    8.3在Windows上用Eclipse調試Spark Java程序151
    8.4在Windows上安裝Maven和配置Eclipse157
    8.5思考題160
    參考文獻160
    第9章Spark SQL162
    9.1Spark SQL簡介162
    9.2查詢本地文件、HDFS文件以及HDFS Parquet列存儲格式文件163
    9.3內置實例分析與Java開發166
    9.3.1通過SQL Explorer插件存取Spark SQL166
    9.3.2JDBC Java編程167
    9.4思考題170
    參考文獻170
    第10章Spark MLlib171
    10.1MLlib簡介171
    10.2啟動平臺軟件172
    10.3分類實例173
    10.4聚類實例178
    10.5線性回歸180
    10.6協同過濾推薦181
    10.7思考題184
    參考文獻185
    第11章Spark GraphX186
    11.1GraphX簡介186
    11.2PageRank188
    11.3思考題190
    參考文獻190
    第12章Flume入門191
    12.1Flume簡介191
    12.2Flume的特性192
    12.3Flume的繫統架構和運行機制192
    12.4Flume的安裝、配置和運行195
    12.5使用netcat完成數據注入的實例197
    12.6以HBase為目標數據庫的實例198
    12.7以Hive為目標數據庫的實例200
    12.8Java開發204
    12.9如何安裝netcat204
    12.10思考題204
    參考文獻204
    第13章Kafka入門206
    13.1Kafka簡介206
    13.1.1話題和分區207
    13.1.2數據分布與存儲208
    13.1.3代理209
    13.1.4生產者209
    13.1.5消費者209
    13.1.6消息的順序210
    13.1.7Kafka的應用場景211
    13.1.8小結213
    13.2Zookeeper與Kafka213
    13.3Kafka的流數據處理組件Kafka Streams214
    13.4Kafka在繫統中的位置214
    13.5Kafka的安裝、配置和運行215
    13.5.1單Broker部署215
    13.5.2多Broker部署217
    13.5.3測試容錯性219
    13.6安裝問題220
    13.7Kafka的Java編程220
    13.8Kafka的綜合實例227
    13.9Kafka與Flume的配合228
    13.10流處理與批處理的結合231
    13.11思考題232
    參考文獻232

    前言

    Hadoop和Spark是兩大大數據處理平臺,各自形成了完整的生態繫統。在相當長的時間內,二者相互共存。
    本書是一本Hadoop和Spark的入門介紹書籍。
    針對Hadoop和Spark兩個生態繫統的主要工具,本書首先介紹其基本原理,然後給出安裝部署的詳細過程,並且通過對內置實例的分析,幫助讀者掌握初步的大數據平臺的編程技巧。
    本書的讀者為高等院校高年級本科生、碩士研究生和IT從業者,他們急需一本簡潔的手冊,幫助他們迅速入門Hadoop和Spark。
    本書包括13章: 第1、2章介紹VMware與虛擬機、CentOS操作繫統安裝,第3~6章介紹Hadoop生態繫統,第7~11章介紹Spark生態繫統,第12、13章介紹兩個工具Flume和Kafka。本書對Hadoop和Spark以及相關工具的原理、部署和開發做了詳細介紹,使讀者可以快速入門。


    Hadoop和Spark是兩大大數據處理平臺,各自形成了完整的生態繫統。在相當長的時間內,二者相互共存。
    本書是一本Hadoop和Spark的入門介紹書籍。
    針對Hadoop和Spark兩個生態繫統的主要工具,本書首先介紹其基本原理,然後給出安裝部署的詳細過程,並且通過對內置實例的分析,幫助讀者掌握初步的大數據平臺的編程技巧。
    本書的讀者為高等院校高年級本科生、碩士研究生和IT從業者,他們急需一本簡潔的手冊,幫助他們迅速入門Hadoop和Spark。
    本書包括13章: 第1、2章介紹VMware與虛擬機、CentOS操作繫統安裝,第3~6章介紹Hadoop生態繫統,第7~11章介紹Spark生態繫統,第12、13章介紹兩個工具Flume和Kafka。本書對Hadoop和Spark以及相關工具的原理、部署和開發做了詳細介紹,使讀者可以快速入門。
    本書引導讀者在3臺VMware虛擬機上進行實驗,虛擬機運行的操作繫統是CentOS 7。一般在一臺擁有8GB內存的i7筆記本計算機上就可以展開實驗,不必依賴更多的硬件,也不用租用雲平臺上的虛擬機。
    一生二,二生三,三生萬物。在3臺虛擬機上進行實驗,有利於讀者掌握大數據平臺的分布式部署(本書不介紹偽分布式部署和單機部署模式),以及把技能遷移到更大規模的集群上。
    讀者可以按照本書的各個章節,順序地了解各個工具的基本原理、部署的方法,並且通過實例了解如何進行實際應用開發。
    讀者可以自行下載CentOS安裝盤(ISO文件)以及相關軟件包,一步步地建立實驗環境,進行實驗。
    本書的編寫因時間倉促,加之編者水平有限,書中難免有疏漏和不足之處,在此懇請專家和廣大讀者批評指正!


    編者2022.9

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部