好的數據是以圖片、動畫示人的。構建客觀、準確而又容易理解的可視化圖形是我們希望做到的事情。本書通過大量豐富而生動的實例闡述了如何讀取數據並選用恰當的圖形完成數據可視化的流程。
在眾多的編程語言中,適合做數據分析、可視化的就是Python。對於初學者來說,Python很容易上手,更重要的是它是當今大數據時代的工具。現在大數據已人盡皆知,但是在這個數據大爆炸的時代,隻有海量數據是沒有任何價值的,必須將它們進行分析和處理,提供直觀的、交互的和反應靈敏的可視化環境。Python數據可視化將技術與藝術完美結合,借助圖形化的手段,清晰有效地傳達與溝通信息,直觀、形像地顯示海量的數據和信息,並進行交互處理。數據可視化的應用十分廣泛,幾乎可以應用於包括自然科學、工程技術、金融和商業在內的各種領域。
本書以圖文並茂和豐富的示例代碼講解的形式,繫統地講解以文本形式存在的數據是如何經過處理,得到的不是難以理解的矩陣或列表,而是平面圖形、3D圖形甚至動畫形式的展示,這也是機器學習中至關重要的一步。這一切主要依賴Python的matplotlib庫。
matplotlib庫已經成為Python中公認的數據可視化工具,本書介紹使用matplotlib如何畫一些或簡單或復雜的圖形,如何編寫幾行代碼即可生成線形圖、直方圖、條形圖、散點圖、餅圖、圖像處理以及炫麗的3D圖形、動畫圖、地圖等,是為讀者提供快速由淺入深掌握數據可視化基礎知識及提高技能的參考書籍。另外,本書從源碼分析角度深入剖析代碼,希望讀者不僅做到知其然,更要知其所以然,對數據可視化有更加深入的研究。本書作者在相關領域有多年豐富的實踐和應用經驗,相信通過對本書的學習可以給讀者帶來事半功倍的效果。
本書由從事多年大數據行業的大數據架構分析師和一線任課老師共同編寫完成。從工程師的視角出發,從安裝到使用再到圖形應用開發,內容由淺入深,適合於不同層次的學生使用,並且所有知識點都結合具體實例和程序講解,便於讀者理解和掌握。
本書有以下特點。
(1)圖文並茂、循序漸進
本書內容翔實、語言流暢、圖文並茂、突出實用性,並提供了大量的操作示例和相應代碼,較好地將學習與應用結合在一起。內容由淺及深,循序漸進,適合各個層次讀者的學習。
(2)實例典型、輕松易學
本書將可視化與應用有機結合,采用理論 實踐的方式,對可視化相關技術進行了詳細講解。本書所引用的繪圖實例既實用又有趣,比如分析醉漢行走軌跡、雨滴落地面的效果、做家務與學歷的關繫等,這樣讀者在使用本書的過程中不會覺得乏味,有助於提升學習興趣,從而提高學習效率。
(3)應用實踐、隨時練習
書中所有項目後都提供了拓展項目,讀者在練習過程中可回顧所學的知識,並將這些知識進行提高和拓展,同時也為進一步學習做好準備。
(4)案例引導
本書從工作過程出發,通過“項目背景”“項目描述”“項目分析”“項目實操”四部分內容完成具體的項目,之後再打破以知識點為理論體繫的傳統模式,按照工作過程來組織和講解知識,將每個任務又劃分為多個小任務,讓學生以“做”為中心,在學中做,在做中學,從而完成對知識點的學習和技能的訓練,進而培養學生的職業技能和職業素養。
(5)緊跟行業技能發展
計算機技術發展很快,本書著重於當前主流技術並兼顧新技術講解,內容與行業聯繫密切,緊跟行業技術的發展。
本書由賈如春負責整體策劃及審稿,由長春人文學院王素華、四川農業大學李源彬主編,由東北師範大學信息科學與技術學院孫小新,長春人文學院趙大偉、孫慧、姜寶華,吉林師範大學孫宏宇,黔南民族師範學院吳勇靈,長春職業技術學院張立輝共同編寫而成。
由於大數據領域技術發展快,作者水平有限,書中難免存在不足之處,敬請廣大讀者不吝賜教。