店鋪:機械工業出版社官方旗艦店 出版社:機械工業出版社 ISBN:9787111633204 商品編碼:10026483327298 品牌:機械工業出版社(CMP) 出版時間:2019-08-01 頁數:200 字數:492000 審圖號:9787111633204 作者:王宇濤
" 商品參數 商品基本信息 | 商品名稱: | Python金融大數據挖掘與分析全流程詳解 | 作者: | 王宇韜 房宇亮 肖金鑫等 | 市場價: | 89.80 | ISBN號: | 9787111633204 | 版次: | 1-1 | 出版日期: | 1900-01 | 頁數: | 312 | 字數: | 492 | 出版社: | 機械工業出版社 | 內容介紹 金融從業者每天都要與海量的數據打交道,如何從這些數據中挖掘出需要的信息,並進行相應的分析,是很多金融從業者非常關心的內容。本書以功能強大且較易上手的Python語言為編程環境,全面講解了金融數據的獲取、處理、分析及結果呈現。 全書共16章,內容涉及Python基礎知識、網絡數據爬蟲技術、數據庫存取、數據清洗、數據可視化、數據相關性分析、IP代理、瀏覽器模擬操控、郵件發送、定時任務、文件讀寫、雲端部署、機器學習等,可以實現輿情監控、智能投顧、量化金融、大數據風控、金融反欺詐模型等多種金融應用。無論是編程知識還是金融相關知識,本書都力求從易到難、循序漸進地講解,並輔以商業實戰案例來加深印像。 本書定位為一本金融科技入門讀物,但書中的數據挖掘與分析思想對其他行業來說也具備較高的參考價值。本書又是一個金融科技工具箱,裡面的代碼可以方便地速查速用,解決實際工作中的問題。 本書適合金融行業的從業人員學習。對於大中專院校金融、財會等專業的師生,以及具備一定計算機編程基礎,又希望投身金融行業的讀者,本書也是不錯的參考讀物。 目錄 *1章Python基礎 1.1Python安裝與*一個Python程序 1.1.1安裝Python 1.1.2編寫*一個Python程序 1.1.3PyCharm的安裝與使用 1.2Python基礎知識 1.2.1變量、行、縮進與注釋 1.2.2數據類型:數字與字符串 1.2.3數據類型:列表與組與集合 1.2.4運算符 1.3Python語句 1.3.1if條件語句 1.3.2for循環語句 1.3.3while循環語句 *1章Python基礎 1.1Python安裝與*一個Python程序 1.1.1安裝Python 1.1.2編寫*一個Python程序 1.1.3PyCharm的安裝與使用 1.2Python基礎知識 1.2.1變量、行、縮進與注釋 1.2.2數據類型:數字與字符串 1.2.3數據類型:列表與組與集合 1.2.4運算符 1.3Python語句 1.3.1if條件語句 1.3.2for循環語句 1.3.3while循環語句 1.3.4try/except異常處理語句 1.4函數與庫 1.4.1函數的定義與調用 1.4.2函數的返回值與作用域 1.4.3常用基本函數介紹 1.4.4庫 *2章金融數據挖掘之爬蟲技術基礎 2.1爬蟲技術基礎1—wangye結構基礎 2.1.1查看wangye源代碼—F12鍵 2.1.2查看wangye源代碼—右鍵菜單 2.1.3*構成及http與https協議 2.1.4wangye結構初步了解 2.2爬蟲技術基礎2—wangye結構進階 2.2.1HTML基礎知識1—我的*一個wangye 2.2.2HTML基礎知識2—基礎結構 2.2.3HTML基礎知識3—標題、段落、鏈接 2.2.4HTML基礎知識4—區塊 2.2.5HTML基礎知識5—類與id 2.3初步實戰—百度新聞源代碼獲取 2.3.1獲取wangye源代碼 2.3.2分析wangye源代碼信息 2.4爬蟲技術基礎3—正則表達式 2.4.1正則表達式基礎1—findall()函數 2.4.2正則表達式基礎2—非貪婪匹配之(.*?) 2.4.3正則表達式基礎3—非貪婪匹配之.*? 2.4.4正則表達式基礎4—自動考慮換行的修飾符re.S 2.4.5正則表達式基礎5—知識點補充 第3章第3章金融數據挖掘案例實戰1 3.1提取百度新聞標題、*、日期及來源 3.1.1獲取wangye源代碼 3.1.2編寫正則表達式提取新聞信息 3.1.3數據清洗並打印輸出 3.2批量獲取多家公司的百度新聞並生成數據報告 3.2.1批量爬取多家公司的百度新聞 3.2.2自動生成輿情數據報告文本文件 3.3異常處理及24小時實時數據挖掘實戰 3.3.1異常處理實戰 3.3.224小時實時爬取實戰 3.4按時間順序爬取及批量爬取多頁內容 3.4.1按時間順序爬取百度新聞 3.4.2一次性批量爬取多頁內容 3.5搜狗新聞與新浪財經數據挖掘實戰 3.5.1搜狗新聞數據挖掘實戰 3.5.2新浪財經數據挖掘實戰 第4章數據庫詳解及實戰 4.1MySQL數據庫簡介及安裝 4.2MySQL數據庫基礎 4.2.1MySQL數據庫管理平臺phpMyAdmin介紹 4.2.2創建數據庫及數據表 4.2.3數據表基本操作 4.3Python與MySQL數據庫的交互 4.3.1安裝PyMySQL庫 4.3.2用Python連接數據庫 4.3.3用Python存儲數據到數據庫 4.3.4用Python在數據庫中查找並提取數據 4.3.5用Python從數據庫中刪除數據 4.4案例實戰:把金融數據存入數據庫 第5章 數據清洗優化及數據評分繫統搭建 5.1深度分析—數據去重及清洗優化 5.1.1數據去重 5.1.2常見的數據清洗手段及日期格式統一 5.1.3文本內容深度過濾—剔除噪聲數據 5.2數據亂碼的處理 5.2.1編碼分析 5.2.2重新編碼及解碼 5.2.3解決亂碼問題的經驗方法 5.3輿情數據評分繫統搭建 5.3.1輿情數據評分繫統版本1—根據標題評分 5.3.2輿情數據評分繫統版本2—根據正文內容評分 5.3.3輿情數據評分繫統版本3—解決亂碼問題 5.3.4輿情數據評分繫統版本4—處理非相關信息 5.4完整的百度新聞數據挖掘繫統搭建 5.4.1將輿情數據評分存入數據庫 5.4.2百度新聞數據挖掘繫統代碼整合 5.4.3從數據庫彙總每日評分 第6章 數據分析利器:NumPy與pandas庫 6.1NumPy庫基礎 6.1.1NumPy庫與數組 6.1.2創建數組的幾種方式 6.2pandas庫基礎 6.2.1二維數據表格DataFrame的創建與索引的修改 6.2.2Excel工作簿等文件的讀取和寫入 6.2.3數據的讀取與編輯 6.2.4數據表的拼接 6.3利用pandas庫導出輿情數據評分 6.3.1彙總輿情數據評分 6.3.2導出輿情數據評分表格 第7章 數據可視化與數據相關性分析 7.1用Tushare庫調取股價數據 7.1.1Tushare庫的基本用法 7.1.2匹配輿情數據評分與股價數據 7.2輿情數據評分與股價數據的可視化 7.2.1數據可視化基礎 7.2.2數據可視化實戰 7.3輿情數據評分與股價數據相關性分析 7.3.1皮爾遜相關繫數 7.3.2相關性分析實戰 第8章 金融數據挖掘之爬蟲技術進階 8.1爬蟲技術進階1—IP代理簡介 8.1.1IP代理的工作原理 8.1.2IP代理的使用方法 8.2爬蟲技術進階2—Selenium庫詳解 8.2.1網絡數據挖掘的難點 8.2.2模擬瀏覽器ChromeDriver的下載與安裝 8.2.3Selenium庫的安裝 8.2.4Selenium庫的使用 第9章 金融數據挖掘案例實戰2 9.1新浪財經股票實時數據挖掘實戰 9.1.1獲取wangye源代碼 9.1.2數據提取 9.2東方財富網數據挖掘實戰 9.2.1獲取wangye源代碼 9.2.2編寫正則表達式提取數據 9.2.3數據清洗及打印輸出 9.2.4函數定義及調用 9.3裁判文書網數據挖掘實戰 9.4巨潮資訊網數據挖掘實戰 9.4.1獲取wangye源代碼 9.4.2編寫正則表達式提取數據 9.4.3數據清洗及打印輸出 9.4.4函數定義及調用 *10章 通過PDF文本解析上市公司理財公告 10.1PDF文件批量下載實戰 10.1.1爬取多頁內容 10.1.2自動篩選所需內容 10.1.3理財公告PDF文件的自動批量下載 10.2PDF文本解析基礎 10.2.1用pdfplumber庫提取文本內容 10.2.2用pdfplumber庫提取表格內容 10.3PDF文本解析實戰—尋找合適的理財公告 10.3.1遍歷文件夾裡所有的PDF文件 10.3.2批量解析每一個PDF文件 10.3.3將合格的PDF文件自動歸檔 *11章郵件提醒繫統搭建 11.1用Python自動發送郵件 11.1.1通過騰訊企鵝郵箱發送郵件 11.1.2通過網易163郵箱發送郵件 11.1.3發送HTML格式的郵件 11.1.4發送郵件附件 11.2案例實戰:定時發送數據分析報告 11.2.1用Python提取數據並發送數據分析報告郵件 11.2.2用Python實現每天定時發送郵件 *12章基於評級報告的投資決策分析 12.1獲取券商研報wangzhan的表格數據 12.1.1表格數據的常規獲取方法 12.1.2用Selenium庫爬取和訊研報網表格數據 12.2pandas庫的高階用法 12.2.1重復值和缺失值處理 12.2.2用groupby()函數分組彙總數據 12.2.3用pandas庫進行批量處理 12.3評估券商分析師預測準確度 12.3.1讀取分析師評級報告數據進行數據預處理 12.3.2用Tushare庫計算股票收益率 12.3.3計算平均收益率並進行分析師預測準確度排名 12.4策略延伸 12.4.1漲停板的考慮 12.4.2按分析師查看每隻股票的收益率 12.4.3計算多階段股票收益率 *13章用Python生成Word文檔 13.1用Python創建Word文檔的基礎知識 13.1.1初識python-docx庫 13.1.2python-docx庫的基本操作 13.2用Python創建Word文檔的進階知識 13.2.1設置中文字體 13.2.2在段落中新增文字 13.2.3設置字體大小及顏色 13.2.4設置段落格式 13.2.5設置表格樣式 13.2.6設置圖片樣式 13.3案例實戰:自動生成數據分析報告Word文檔 *14章基於股票信息及其衍生變量的數據分析 14.1策略基本思路 14.2獲取股票基本信息及衍生變量數據 14.2.1獲取股票基本信息數據 14.2.2獲取股票衍生變量數據 14.2.3通過相關性分析選取合適的衍生變量 14.2.4數據表優化及代碼彙總 14.3數據可視化呈現 14.4用xlwings庫生成Excel工作簿 14.4.1xlwings庫的基本用法 14.4.2案例實戰:自動生成Excel工作簿報告 14.5策略深化思路 *15章雲服務器部署實戰 15.1雲服務器的購買與配置 15.2程序的雲端部署 15.2.1安裝運行程序所需的軟件 15.2.2實現程序24小時不間斷運行 *16章機器學習之客戶違約預測模型搭建 16.1機器學習在金融領域的應用 16.2決策樹模型的基本原理 16.2.1決策樹模型簡介 16.2.2決策樹模型的建樹依據 16.3案例實戰:客戶違約預測模型搭建 16.3.1模型搭建 16.3.2模型預測及評估 16.3.3模型可視化呈現 顯示全部信息
" |