出版社:機械工業出版社 ISBN:9787111555155 商品編碼:11524102286 品牌:文軒 出版時間:2017-02-01 代碼:79 作者:詹姆斯·普斯特若夫斯基(JamesPuste
" 作 者:(美)詹姆斯·普斯特若夫斯基(James Pustejovsky),(美)安伯·斯塔布斯(Amber Stubbs) 著;邱立坤,金澎,王萌 譯 定 價:79 出 版 社:機械工業出版社 出版日期:2017年02月01日 頁 數:293 裝 幀:平裝 ISBN:9787111555155 ●前言1 ●第1章基礎知識7 ●1.1語言標注的重要性7 ●1.1.1語言學描述的層次8 ●1.1.2什麼是自然語言處理9 ●1.2語料庫語言學簡史10 ●1.2.1什麼是語料庫13 ●1.2.2語料庫的早期應用15 ●1.2.3當今的語料庫17 ●1.2.4標注類型18 ●1.3語言數據和機器學習24 ●1.3.1分類25 ●1.3.2聚類25 ●1.3.3結構化模式歸納26 ●1.4標注開發循環26 ●1.4.1現像建模27 ●1.4.2按照規格說明進行標注30 ●1.4.3在語料庫上訓練和測試算法31 ●1.4.4對結果進行評價32 ●1.4.5修改模型和算法33 ●部分目錄 自然語言理解是人工智能的一個重要分支,主要研究如何利用計算機來理解和生成自然語言。本書重點介紹了自然語言理解所涉及的各個方面,包括語法分析、語義分析、概念分析、語料庫語言學、詞彙語義驅動、中間語言、WordNet、詞彙樹鄰接文法、鏈接文法、基於語段的機器翻譯方法、內識別與文本過濾、機器翻譯的評測等,既有對基礎知識的介紹,又有對新研究進展的綜述,同時還結合了作者(JamesPustejovsky,生成詞庫理論的創始人)多年的研究成果。本書內容全面、詳略得當,結合實例講解,使讀者更易理解。 (美)詹姆斯·普斯特若夫斯基(James Pustejovsky),(美)安伯·斯塔布斯(Amber Stubbs) 著;邱立坤,金澎,王萌 譯 詹姆斯·普斯特若夫斯基,James Pustejovsky是布蘭迪斯大學計算機科學繫教授,從事人工智能和計算語言學領域的教學和研究工作。 安伯·斯塔布斯,Amber Stubbs博士於2013年在布蘭迪斯大學計算機科學繫取得博士學位,其博士論文的主題是自然語言標注方法論。之後Amber Stubbs博士任紐約州立大學阿爾巴尼分校博士後研究員,目前是波士頓西蒙斯學院圖書館與信息科學學院及計算機科學專業的助理教授。 前言本書的讀者是那些使用計算機來處理自然語言的人。自然語言是指人類所說的任何一種語言,可以是當代語言(如英語、漢語、西班牙語),也可以指過去曾經使用過的語言(如拉丁語、古希臘語、梵語)。標注(annotation)是一個過程,它通過向文本數據來增強計算機執行自然語言處理(Natural Language Processing, NLP)的能力。特別地,我們考察如何通過標注將信息加入自然語言文本中以便改善機器學習(Machine Learning,ML)算法(一組設計好的計算機程序,它從文本提供的信息中推出規則,目的是將這些規則用於將來未標注的文本中)的性能。 面向機器學習的自然語言標注本書詳細介紹創建自己的自然語言標注數據集(稱為語料庫)所需的各個階段和過程,以便為基於語言的數據和知識發現訓練機器等
" |