內容介紹 | |
出版社:中國金融出版社 ISBN:9787522016276 商品編碼:10063032853952 品牌:文軒 出版時間:2022-09-01 代碼:72 作者:李春濤,司海濤,薛原
" 作 者:李春濤,司海濤,薛原 著 定 價:72 出 版 社:中國金融出版社 出版日期:2022年09月01日 頁 數:272 裝 幀:平裝 ISBN:9787522016276 ●第1章正則表達式入門1 1.1通配符1 1.2正則表達式4 1.3正則表達式的用途6 1.4如何使用正則表達式15 1.5Stata版本選擇16 1.6字符、字節與Stata編碼17 1.7本章小結18 第2章正則表達式字符串函數20 2.1匹配函數:regexm()和ustrregexm()20 2.2提取函數:regexs()和ustrregexs()23 2.3替換函數:regexr()、ustrregexrf()和ustrregexra()27 2.4本章小結32 字符33 3.字符33 3.字符44 3.3特字符61 3.字符68 3.5前後查找74 3.字符80 3.7回溯引用:前後一致匹配91 3.8Unicode轉義字符98 3.9 IX字符101 3.10本章小結104 第4章正則表達式綜合運用105 4.1英文地址提取郵編(三)105 4.2提取性別、年齡、種族108 4.3中文地址中城市名稱的提取115 4.4英文姓名拆分(二)129 4.5提取生產日期135 4.6本章小結139 第5章與正則表達式相關的命令140 5.1moss命令140 5.2subinfile命令146 5.3filesearch命令152 5.4fromroman命令159 5.5toroman命令162 5.6varsearch命令163 5.7screening命令166 5.8jregex命令175 5.9本章小結181 第6章正則表達式與網絡爬蟲182 6.1網絡爬蟲概述182 6.2基於網絡爬蟲編寫的命令182 6.3網絡爬蟲實例195 6.4本章小結248 附錄A基礎ASCII字符表249 附錄B生成基礎ASCII表的Stata程序254 後記256 隨著教學和數據分析業務的開展,我們發現更多的數據來自文本,而正則表達式是對文本數據的分析必不可少的技能。因此近年來,爬蟲俱樂部在開展的Stata編程課程中融入了較多的正則表達式內容。雖然我們在課程中融入很多生動的案例,但是正則表達式看似簡單實則一學就會但是容易忘,客觀上需要一本常備參考手冊。市面上關於正則表達式的參考書很少,而且沒有關於Stata使用正則表達式的資料,用戶隻能閱讀Stata公司提供的晦澀難懂的手冊,因此每次上課都會有學員咨詢有沒有可能寫一本專門介紹Stata使用正則表達式方法的書。為此,我們下決心撰寫本書,希望繫統地介紹Stata調用正則表達式的方法及其應用。 李春濤,司海濤,薛原 著 李春濤,河南葉縣人,香港大學金融學博士,中南財經政法大學金融學院教授、博士生導師,河南大學“攀登計劃”特聘教授。主要研究方向為公司治理和企業創新。在《經濟研究》、《管理世界》、《金融研究》、《中國工業經濟》、《財貿經濟》、StataJournal、 Journal of ComparativeEconomics等期刊發表論文50餘篇。
" | | |