[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 數據清洗與ETL技術
    該商品所屬分類:研究生 -> 工學
    【市場價】
    236-344
    【優惠價】
    148-215
    【作者】 馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴 
    【所屬類別】 圖書  教材  研究生/本科/專科教材  工學 
    【出版社】清華大學出版社 
    【ISBN】9787302600817
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302600817
    叢書名:大數據繫列叢書

    作者:馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴
    出版社:清華大學出版社
    出版時間:2022年04月 


        
        
    "
    編輯推薦

    本教材資料齊全:配有電子教案、案例、習題、試卷、實訓教程等。

     
    內容簡介

    本書為大數據時代下的產物,由淺入深地介紹大數據及其相關知識,在大數據的背景下著重介紹ETL數據處理技術,同時引入數據清洗的知識,理論與實際相結合,突出所長。在理論上,本書突出重點與難點,較為繫統地介紹大數據的各項基本技術。在實踐操作上,本書貼近生活,切實理解,緊跟實驗進行,並從中萃取精華。同時本書還介紹ETL技術的主流工具,結合當下一些項目進行運用,並綜合課後思考題,使讀者在學習中體會大數據的樂趣,翱遊在大數據的海洋中。 本書可作為高校新興專業——數據科學專業的配套教材,也可作為其他專業的選修課教材,還可作為初學者的學習教程。

    作者簡介

    馮廣,男,碩士生導師,現任廣東工業大學網絡信息與現代教育技術中心副主任,博士,網絡規劃師,碩士研究生導師。長期從事計算機網絡技術、網絡控制技術和控制科學與控制工程領域的教學與科研工作。主要研究方向有網絡與信息化控制、化控制、RFID技術、計算機網絡等。

    目錄
    第1章從大數據到ETL1
    1.1大數據概述1
    1.1.1大數據的定義2
    1.1.2大數據的基本性質2
    1.1.3大數據的影響4
    1.1.4大數據帶來的挑戰7
    1.2科學處理數據9
    1.3ETL簡介10
    1.3.1ETL的基本定義10
    1.3.2ETL的基本過程11
    1.3.3ETL的架構體繫11
    1.3.4ETL的必要性13
    1.3.5ETL的分類14
    1.3.6基本ETL過程與數據清理的區別14

    第1章從大數據到ETL1
    1.1大數據概述1
    1.1.1大數據的定義2
    1.1.2大數據的基本性質2
    1.1.3大數據的影響4
    1.1.4大數據帶來的挑戰7
    1.2科學處理數據9
    1.3ETL簡介10
    1.3.1ETL的基本定義10
    1.3.2ETL的基本過程11
    1.3.3ETL的架構體繫11
    1.3.4ETL的必要性13
    1.3.5ETL的分類14
    1.3.6基本ETL過程與數據清理的區別14
    1.3.7ETL現狀與發展15
    1.4數據抽取16
    1.4.1數據抽取的概念16
    1.4.2分類抽取16
    1.4.3數據抽取的原則和方法17
    1.5數據轉換17
    1.5.1數據轉換的概念17
    1.5.2類型轉換17
    1.6數據加載18
    1.6.1數據加載的概念18
    1.6.2數據加載方式18
    1.7實驗任務——處理論文的年份19
    1.8小結23
    1.9習題23第2章數據抽取25
    2.1數據源25
    2.1.1關繫數據庫25
    2.1.2非關繫數據庫27
    2.1.3通用程序庫28
    2.2數據抽取方式29
    2.2.1全量抽取29
    2.2.2增量抽取29
    2.2.3增量抽取的比較分析30
    2.3Hadoop的數據抽取32
    2.3.1Hadoop簡介32
    2.3.2Hadoop研究現狀32
    2.3.3環境搭建34
    2.3.4數據采集34
    2.4Web文件的數據抽取35
    2.4.1Web文件簡介35
    2.4.2主要工作35
    2.4.3主要工具——Connotate35
    2.4.4應用分析——基於頁面標簽的Web結構化數據抽取37
    2.5數據庫的數據抽取41
    2.5.1數據庫簡介41
    2.5.2主要應用——基於ETL工具軟件的數據抽取43
    2.6文本文件的數據抽取44
    2.6.1文本文件數據抽取及應用領域44
    2.6.2網絡爬蟲44
    2.7實驗任務——MySQL環境搭建及數據抽取46
    2.7.1MySQL在Windows下的搭建46
    2.7.2MySQL在Linux下的搭建47
    2.7.3案例分析50
    2.8小結54
    2.9習題54第3章數據轉換56
    3.1數據轉換56
    3.1.1數據轉換的概念56
    3.1.2數據轉換的標準57
    3.1.3數據轉換的方法57
    3.1.4數據之間的關聯58
    3.2數據清洗59
    3.2.1數據清洗的主要內容59
    3.2.2數據清洗研究現狀60
    3.2.3數據清洗的必要性61
    3.2.4數據清洗的問題61
    3.2.5數據清洗對工具的要求62
    3.2.6數據清洗的流程62
    3.2.7數據清洗的原理63
    3.2.8數據清洗的方法63
    3.3Python下的數據清洗65
    3.3.1Python概述65
    3.3.2Python的特點66
    3.3.3Python Pandas——數據清洗67
    3.4數據轉換工具75
    3.4.1Data Stage75
    3.4.2Kettle78
    3.4.3Informatica PowerCenter81
    3.4.4ETL Automation82
    3.4.5SSIS82
    3.4.6幾種工具之間的比較83
    3.5實驗任務——Kettle的分類安裝及案例分析84
    3.5.1Kettle的分類安裝84
    3.5.2案例分析——利用Kettle處理錯誤代碼行84
    3.6小結87
    3.7習題87第4章數據加載89
    4.1數據加載89
    4.1.1數據加載的概念89
    4.1.2數據加載機制89
    4.2數據加載技術90
    4.2.1加載技術90
    4.2.2全量數據加載流程91
    4.3數據倉庫93
    4.3.1數據倉庫基本內容94
    4.3.2數據倉庫架構97
    4.3.3數據倉庫設計98
    4.3.4數據倉庫的規劃和需求分析99
    4.3.5數據倉庫的建模100
    4.3.6數據倉庫的物理模型分析107
    4.3.7數據倉庫的物理模型設計109
    4.4加載SQL123
    4.4.1SQL的基本內容123
    4.4.2MySQL集群體125
    4.5加載MyCat128
    4.5.1MyCat簡介128
    4.5.2MyCat的關鍵特性128
    4.5.3拓撲結構129
    4.5.4MyCat的功能描述129
    4.5.5MyCat下載安裝132
    4.6加載數據流134
    4.6.1流概述134
    4.6.2數據流的基本性質135
    4.6.3數據流的基本操作136
    4.6.4數據流的描述方法137
    4.7小結138
    4.8習題138第5章大數據ETL實現139
    5.1Spark的分布式ETL實現139
    5.1.1Spark概述140
    5.1.2Spark數據模型——RDD140
    5.1.3Spark的安裝配置141
    5.1.4分布式ETL總體架構143
    5.1.5分布式轉換引擎的實現144
    5.1.6SparkStreaming的實時同步實現147
    5.2Spark完成在ETL時的相關技術148
    5.2.1SparkApplication提交邏輯分析149
    5.2.2Spark交互模式150
    5.2.3使用Spark實現ETL151
    5.2.4小結151
    5.3Hive的ETL實現152
    5.3.1Hive簡介152
    5.3.2Hadoop偽分布式集群搭建152
    5.3.3Hive的安裝配置156
    5.3.4Hive的基本操作158
    5.4Sqoop的ETL實現169
    5.4.1Sqoop簡介169
    5.4.2Sqoop的安裝部署169
    5.4.3Sqoop的常用命令170
    5.4.4案例分析——利用Sqoop進行ETL操作173
    5.5小結176
    5.6習題176第6章案例分析177
    6.1校園大數據建設177
    6.1.1校園大數據建設背景177
    6.1.2校園大數據檢索需求178
    6.1.3總體目標178
    6.1.4建設內容179
    6.1.5數據抽取180
    6.1.6數據轉換180
    6.1.7數據倉庫的建設182
    6.1.8項目效益184
    6.2反洗錢繫統中的ETL應用185
    6.2.1反洗錢簡介185
    6.2.2反洗錢繫統中ETL的重要性185
    6.2.3反洗錢繫統中的ETL設計186
    6.3電信行業中的ETL應用190
    6.3.1背景知識190
    6.3.2設計目的191
    6.3.3ETL架構設計191
    6.3.4ETL接口設計193
    6.3.5控制實現195
    6.4雲計算下的ETL設計198
    6.4.1雲計算簡介198
    6.4.2傳統數據倉庫ETL面臨的困境198
    6.4.3ETL繫統設計199
    6.4.4ETL工作流199
    6.5BI項目中的ETL應用201
    6.5.1BI概述201
    6.5.2ETL功能架構202
    6.5.3ETL數據流202
    6.5.4ETL作業調度205
    6.5.5ETL監控和日志207
    6.5.6數據質量檢測209
    6.5.7BI項目中的ETL實現210
    6.6小結215
    6.7習題215參考文獻216

    前言
    在信息技術高速發展的今天,大數據的發展尤為顯著,並影響著社會生產和人類生活的方方面面。隨著信息數據量的急劇增長,大數據作為一門新興的學科出現在人們的眼前。大數據又稱巨量數據,是指涉及的資料量規模巨大到無法利用目前的主流軟件工具在合理時間內整理成為有用資訊的數據。
    對一個國家而言,能否緊緊抓住大數據的發展機遇,形成大數據體繫,參與新一輪的全球競爭,將影響未來的發展方向,甚至若干年內世界範圍內的科技力量主導。在大數據競爭的博弈中,大數據專業人纔的培養更是新一輪科學技術較量的基礎和重點,各大高校和研究機構承擔著大數據人纔培養的重任,要為國家的發展輸入源源不斷的動力。為此,大數據課程的開設和大數據知識的學習也就顯得尤為重要,受到了各大高校和科研機構的高度重視。
    ETL技術作為大數據背景下不可或缺的一環貫穿著數據的始終,是數據技術人員的技能,也逐漸成為大數據專業的一門重要的專業基礎課程。
    本書以幫助讀者掌握大數據技術為目標,詳細介紹大數據的基本情形和未來發展方向,ETL技術貫穿全書,使讀者在學習ETL技術的過程中感受大數據的魅力。
    本書分為6章,采用理論知識與項目教學的方式組織內容,每個項目都來自典型案例,具有說服力,各章節由理論介紹入手,結合實際項目練習擴展知識面,每章後提供自測題。
    第1章為緒論,由大數據切入,介紹大數據的基本概況,進而引入ETL,且對這3個過程做了整體說明,接著引入本書的個入門案例,利用ETL技術對論文中的年份進行處理。

    在信息技術高速發展的今天,大數據的發展尤為顯著,並影響著社會生產和人類生活的方方面面。隨著信息數據量的急劇增長,大數據作為一門新興的學科出現在人們的眼前。大數據又稱巨量數據,是指涉及的資料量規模巨大到無法利用目前的主流軟件工具在合理時間內整理成為有用資訊的數據。
    對一個國家而言,能否緊緊抓住大數據的發展機遇,形成大數據體繫,參與新一輪的全球競爭,將影響未來的發展方向,甚至若干年內世界範圍內的科技力量主導。在大數據競爭的博弈中,大數據專業人纔的培養更是新一輪科學技術較量的基礎和重點,各大高校和研究機構承擔著大數據人纔培養的重任,要為國家的發展輸入源源不斷的動力。為此,大數據課程的開設和大數據知識的學習也就顯得尤為重要,受到了各大高校和科研機構的高度重視。
    ETL技術作為大數據背景下不可或缺的一環貫穿著數據的始終,是數據技術人員的技能,也逐漸成為大數據專業的一門重要的專業基礎課程。
    本書以幫助讀者掌握大數據技術為目標,詳細介紹大數據的基本情形和未來發展方向,ETL技術貫穿全書,使讀者在學習ETL技術的過程中感受大數據的魅力。
    本書分為6章,采用理論知識與項目教學的方式組織內容,每個項目都來自典型案例,具有說服力,各章節由理論介紹入手,結合實際項目練習擴展知識面,每章後提供自測題。
    第1章為緒論,由大數據切入,介紹大數據的基本概況,進而引入ETL,且對這3個過程做了整體說明,接著引入本書的個入門案例,利用ETL技術對論文中的年份進行處理。
    第2章引入ETL的個過程(數據抽取),詳細介紹數據抽取的方式,緊接著對各種形式下的數據源抽取進行分類介紹,後在Windows和Linux環境下搭建MySQL,且對此進行數據抽取操作。
    第3章為數據轉換,介紹數據轉換的基本知識點,並對數據轉換工具進行詳細說明,後將Kettle安裝及其部署作為本章的一個案例,並利用Kettle工具對某一文件的錯誤行進行統計並生成日志。
    第4章為數據加載,介紹數據加載的基本理論知識,然後搭建數據倉庫,後對幾種環境下的數據進行加載分析。
    第5章為ETL在大數據下的實現,講解ETL在Spark、Hive、Sqoop這3種環境下的實現,並搭建Hadoop偽分布式集群,後利用Sqoop實現ETL過程。
    第6章為案例分析,講解ETL在高校大數據建設、反洗錢繫統、商業智能(BI)和電信領域內的應用及其實現。
    本書的讀者對像為想學習和了解大數據的科研工作者、高校師生以及對大數據、ETL技術有極大興趣的人士。通過本書的學習,初學者可以達到中等水平,能對大數據和ETL技術有很好的了解和認知,熟練掌握MySQL數據庫、虛擬機命令、Hadoop平臺、數據倉庫技術等。已在大數據領域造詣極深的學者也可以參考本書,對科研、學習也有一定的幫助。
    本書的參考學時為32學時,建議采用理論實踐一體化的教學模式,各章的參考學時詳見如下學時分配表。學時分配表項目及章節課 程 內 容學時第1章從大數據到ETL2案例1處理論文的年份1第2章數據抽取2案例2MySQL環境搭建及數據抽取1第3章數據轉換2案例3Kettle的分類安裝及案例分析2第4章數據加載4案例4數據倉庫的搭建2第5章大數據ETL實現4案例5Hadoop偽分布式集群和Sqoop案例4第6章案例分析4案例6校園大數據建設4本書由馮廣主編,龔旭輝編寫第1章,周瀚章編寫第2章,李嘉編寫第3章,馮廣編寫第4章,曾虎編寫第5章,徐啟東編寫第6章,孔立斌、石鳴鳴負責修改全書,後由馮廣統稿。
    由於編者水平和經驗有限,書中難免有欠妥和錯誤之處,懇請讀者批評指正。


    編者2022年3月

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部