內容介紹 | |
![](/c3/10067951930169.jpg)
出版社:清華大學出版社 ISBN:9787302612957 商品編碼:10067951930169 品牌:文軒 出版時間:2022-11-01 代碼:99 作者:宗成慶,夏睿,張家俊
" 作 者:宗成慶,夏睿,張家俊 著 定 價:99 出 版 社:清華大學出版社 出版日期:2022年11月01日 頁 數:352 裝 幀:平裝 ISBN:9787302612957 "《文本數據挖掘(第2版)》通過實例說明實現相關任務的理論方法和技術思路,而不過多地涉及實現細節,盡量使讀者能夠在充分理解基本原理的基礎上掌握應用繫統的實現方法。" ●第1章緒論 1.1基本概念 1.2文本挖掘任務 1.3文本挖掘面臨的困難 1.4方法概述與本書的內容組織 1.5進一步閱讀 習題 第2章數據預處理和標注 2.1概述 2.2數據獲取 2.3數據預處理 2.4數據標注 2.5基本工具 2.5.1漢語自動分詞與詞性標注 2.5.2句法分析 …… 文本數據挖掘是通過機器學習、自然語言處理和推理等相關技術或方法,理解、分析和挖掘文本的內容,從而完成信息抽取、關繫發現、熱點預測、文本分類和自動摘要等具體任務的信息處理技術。《文本數據挖掘(第2版)》主要介紹與文本數據挖掘有關的基本概念、理論模型和實現算法,包括數據預處理、文本表示、文本分類、文本聚類、主題模型、情感分析與觀點挖掘、話題檢測與跟蹤、信息抽取以及文本自動摘要等,最後通過具體實例展示相關技術在實際應用中的使用方法。 《文本數據挖掘(第2版)》書可作為高等院校計算機、自動化、網絡安全、大數據分析等專業,以及利用到文本信息處理的交叉學科(如金融財經、社會人文、生物醫藥等)的高年級本科生或研究生從事相關研究的入門參考書,也可供相關技術研發人員閱讀和參考。 宗成慶,夏睿,張家俊 著 宗成慶,中國科學院自動化所研究員、博士生導師,中國科學院大學崗位教授,ACL/CAAI/CCF Fellow,主要從事自然語言處理、機器翻譯和語言認知計算等研究,主持國家項目10餘項,發表論文200餘篇,出版《統計自然語言處理》、《文本數據挖掘》和Text Data Mining三部專著及兩部譯著。擔任國際計算語言學委員會(ICCL)委員,中國中文信息學會副理事長,曾任亞洲自然語言處理學會(AFNLP)主席,不錯學術會議ACL’2015和COLING’2020程序委員會主席、ACL’2021大會主席。榮獲國家科技進步獎二等獎和多個省部級及國家一級學會的科技獎勵,獲得北京市優秀教師、中科院優秀導等
" | | |