自然語言處理方法——使用Python基於機器學習和深度學習發掘文本
市場價:390元 優惠價:330元
立刻節省:60元
本書繫統介紹了基於機器學習和深度學習對文本數據進行挖掘和分析的方法,從文本分類、語音識別、主題建模、文本總結、文本生成、情感分析等多個自然語言處理的應用角度出發,對自然語言處理進行了深入解讀,通過大量Python代碼幫助讀者快速學習並實現基本的甚至較高級的自然語言處理技術。 全書共六章。第1章介紹數據的收集和提取,包括從網頁、PDF、Word、HTML、JSON中收集數據;第2章介紹文本數據的處理,包括形式轉換、刪除標點符號、拼寫校正、詞干提取、詞形還原等;第3章介紹文本特征工程,采用的技術包括OneHot編碼、統計向量化、N-grams、哈希向量化、共生矩陣等;第4章介紹高級自然語言處理,包括文本相似度計算、詞性標注、提取實體、提取主題、情感分析、語音和文本互轉等;第5章介紹自然語言處理的行業應用,如多類分類、文本數據總結、文檔聚類、自然語言處理在搜索引擎中的應用等;第6章介等
|