為搶抓人工智能發展的重大戰略機遇,構築我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國,於17年印發了《新一代人工智能發展規劃》。規劃指明在30年要搶占人工智能領域制高點。為了實現這個目標,我國從小學教育、目,到大學院校,將會逐步新增人工智能的課程,建設全國人纔梯隊。 作為職業教育中堅力量的高職院校也迅速響應,陸續開設人工智能和大數據相關課程,但當前符合高職院校教學需求的教材比較缺乏。作為人工智能專業核心課程,數據分析與可視化課程的教材也比較缺乏。我們知道,人工智能離不開數據,數據是人工智能的“養料”,我們需要將沒有“雜質”的、有價值的數據“喂給”計算機,這樣計算機纔能從數據中學到經驗,達到智能的效果。因此,拿到數據後,首先需要對數行預處理,比如合並數據、缺失值處理、重復數據處理、轉換數據等,還需要對數行分析和統計,找出隱藏在數據中的客觀規律。當然,還需要通過可視化圖表將數據形像地展現給用戶。 另外,隨著職業教育1+X制度的全面展開,越來越多的學生將有機會參加各種職業資格的考試。因此課證需要融合,即學校開設的課程全面涵蓋1+X的知識體繫和內容,這樣在相關專業課程完成後,學生就可以參加1+X考試,不必再花費大量時行培訓和學科大訊飛制定的《人工智能數據處理》等級,分為初級、中級和高級三個等級,其中初級和中級需要掌握數據預處理、數據分析與數據可視化的知識。 本書主要涉及數據預處理、數據分析與數據可視化的相關知識,具括使用NumP行數據處理與科學計算、使用Panda行數據分析與可視化、使用Matplotli行數據可視化,以及使用Power B行數據分析與可視化,不僅能夠滿足高職院校專業課程的實施,而且與1+X知識體繫相融合。 本書 1.課證融合,緊貼實際 本書主要講解數據預處理、數據分析與數據可視化的知識,不僅滿足大數據、人工智能專業相關的專業核心課教學需求,而且符合《人工智能數據處理》1+X的考核要求,達到課證融合,並緊貼實際。 2.項目教學,融會貫通 每個項目都按項目實現的流程編排,首先提出項目需求,對項行分析,梳理項目流程和目標;然後在項目實現過程中引入新知識並及時運用到項目中,幫助讀者融會貫通,提高解決實際問題的能力。 3.注解詳細,一目了然 在上篇Python數據分析與可視化部分,Python程序代碼中都做了詳細的注釋,讀者理解起來會更加順暢。另外,由於Power BI操作性較強,本書不僅提供了詳細操作的截圖,而且清晰地標注了圖中需要操作的控件,便於讀者操作。 4.課後加強鞏固 在每個項目的後都提供課後括選擇題、簡答題、編程題和操作題,幫助讀者鞏固與提高所學知識。 5.配套豐富,方便教學 本書配套有微課,掃描書中二維碼,即可觀看;配有源代碼、配套數據集,方便讀者邊學邊做;還配有專業的電子課件、教學大綱、課時安排,以方便相關院校或培訓機構的教學人員授課。 本書內容 上篇 Python數據分析與可視化 項目1 使用NumPy分析空氣質量狀況 本項目基於通過網絡爬蟲或從相關網站得到的空氣質量數據集,使用NumPy對數據行處理和科學計算,並通過統計和分析得到相關指標,為決策提供重要的科學依據。 項目2 使用Matplotlib實現空氣質量數據可視化 本項目通過Matplotlib可視化工具,對項目1處理得到的空氣質量數行可視化實現。形像地將數據通過折線圖、條形圖、散點圖、子圖和圖展現出來,有助於洞察數據中蘊含的關繫和規律。 項目3 使用Pandas分析股票交易數據 本項目基於從東方財富網中獲取的股票交易數據,使用Pandas對數據行處理,並使用統計分析模塊對數行統計分析,找出規律和趨勢,為投資決策提供理論依據,降低投資風險。 項目4 使用Pandas實現股票交易數據可視化 本項目使用Pandas內嵌的可視化模塊實現股票交易數據的可視化。可視化圖括折線圖、散點圖、條形圖、圖和K線圖。通過可視化圖表能夠更加客觀、形像地找出規律和趨勢。 下篇 Power BI數據分析與可視化 項目5 空氣質量狀況分析 本項目使用Power BI Desktop實現空氣質量數據集的數據預處理、數據分析和數據可能。涉及的可視化圖形有折線圖、柱形圖、圖、關鍵影響者圖,並通過數據鑽取、編輯交互、篩選器和切片器與圖行更深入、細致的交互。 項目6 企業財務報表數據分析 本項目使用Power BI Desktop實現股票交易數據集的數據預處理、數據建模、數據分析和數據可能。涉及的可視化圖形有度量值圖、卡片圖、矩陣圖、瀑布圖和K線圖。 項目7 銀行客戶營銷分析 本項目基於從UCI中獲取的某銀行電話直銷活動的數據集,使用Power BI Desktop實現數據集的數據預處理、數據分析和數據可能。涉及的可視化圖形有儀表盤、折線和堆積條形圖、簇狀條形圖、關鍵影響者圖和問答繫統。 項目8 電商App用戶購物行為分析 本項目基於從阿裡雲天池獲取的電商App用戶購物行為數據集,將其持久化到MySQL數據庫中,然後使用Power BI Desktop實現數據集的數據預處理、數據分析和數據可能。涉及的可視化圖形有多行卡、漏鬥圖、折線圖和環形圖。本書作者張濤,科大訊飛高校人纔培養業務線人工智能技監,研究方向為數據處理、網絡爬蟲和機器學與了1+X《人工智能數據處理職業技能等級標準》的起草工作,並組織了《人工智能數據處理》1+X的師資培訓工作。由於編者所限,加之時間倉促,書中可能還存在一些疏漏和不當之處,敬請各位讀者斧正。 編者 |