作 者:餘平 等 編
定 價:69
出 版 社:電子工業出版社
出版日期:2022年05月01日
頁 數:232
裝 幀:平裝
ISBN:9787121432934
本書在講述概念的同宇宙的應用場景、未來趨勢、投資賽道等做了分析。此外,融入諸多案宇宙的入局者具有很強的指導意義。
●項目一 大數據采集認知
任務1.1 開始大數據采集認知
1.1.1 任務描述
1.1.2 知識準備
1.1.3 任務效果
任務1.2 了解大數據采集平臺
1.2.1 任務描述
1.2.2 知識準備
1.2.3 任務實施
1.2.4 任務效果
任務1.3 認識大數據預處理
1.3.1 任務描述
1.3.2 知識準備
1.3.3 任務實施
1.3.4 任務效果
任務1.4 了解大數據預處理常用工具
1.4.1 任務描述
1.4.2 任務實施
1.4.3 任務效果
項目小結
習題
項目二 使用Apache Flume采集日志數據
任務2.1 Windows環境下的Apache Flume環境搭建
2.1.1 任務描述
2.1.2 知識準備
2.1.3 任務實施
2.1.4 任務效果
任務2.2 Apache Flume數據采集案例
2.2.1 任務描述
2.2.2 任務實施
項目小結
習題
項目三 使用Logstash采集日志數據
任務3.1 Logstash工具安裝
3.1.1 任務描述
3.1.2 知識準備
3.1.3 任務實施
3.1.4 任務效果
任務3.2 Logstash數據采集工作
3.2.1 任務描述
3.2.2 任務實施
3.2.3 任務效果
項目小結
習題
項目四 使用爬蟲工具完成網頁數據獲取
任務4.1 使用Web Scraper完成列車時刻表數據采集工作
4.1.1 任務描述
4.1.2 任務知識準備
4.1.3 任務實施
4.1.4 任務效果
任務4.2 使用八爪魚工具采集數據
4.2.1 任務描述
4.2.2 知識準備
4.2.3 任務實施
4.2.4 任務效果
項目小結
習題
項目五 完成招聘數據預處理
任務5.1 使用OpenRefine完成數據清洗任務
5.1.1 任務描述
5.1.2 任務實施
5.1.3 任務效果
任務5.2 使用Kettle完成數據集成任務
5.2.1 任務描述
5.2.2 任務實施
5.2.3 任務效果
項目小結
習題
項目六 數據可視化處理
任務6.1 數據可視化認知
6.1.1 任務描述
6.1.2 知識準備
6.1.3 任務效果
任務6.2 熟悉Echarts數據可視化
6.2.1 任務描述
6.2.2 知識準備
6.2.3 任務實施
任務6.2.3 任務效果
任務6.3 使用Tableau Desktop完成數據可視化任務
6.3.1 任務描述
6.3.2 知識準備
6.3.3 任務實施
6.3.4 任務效果
項目小結
習題
項目七 數據標注
預備知識
任務7.1 安裝Labelme圖像標注工具
7.1.1 任務描述
7.1.2 知識準備
7.1.3 任務實施
任務7.2 使用Labelme標注工具完成數據標注任務
7.2.1 任務描述
7.2.2 知識準備
7.2.3 任務實施
項目小結
習題
本書是大數據處理的基礎教材。從介紹基礎的大數據采集開始,關注數據的采集、數據預處理、數據的可視化、數據的標注,以及大數據的相關應用等大數據的處理知識。其中,既包括文本或數值相關數據的處理,也包括對圖片這樣的非結構化數據的梳理。知識內容涵蓋面較為廣泛。本書以項目制的方式編寫,淺顯易懂,可以讓沒有相關經驗的讀者,比如高職高專的人工智能相關專業的學生,在短時間內了解人工智能數據處理相關知識,並在各自的領域提高工作效率和產出。
餘平 等 編
本書在講述概念的同宇宙的應用場景、未來趨勢、投資賽道等做了分析。此外,融入諸多案宇宙的入局者具有很強的指導意義。