●章
緒論1.1
基本概念1.1.1
語言學與語音學1.1.2
自然語言處理1.1.3
關於“理解”的標準1.2
自然語言處理研究的內容和面臨的困難1.2.1
自然語言處理研究的內容1.2.2
自然語言處理涉及的幾個層次1.2.3
自然語言處理面臨的困難1.3
自然語言處理的基本方法及其發展1.3.1
自然語言處理的基本方法1.3.2
自然語言處理的發展1.4
自然語言處理的研究現狀1.5
本書的內容安排第2章
預備知識2.1
概率論基本概念2.1.1
概率2.1.2
優選似然估計2.1.3
條件概率2.1.4
貝葉斯法則2.1.5
隨機變量2.1.6
二項式分布2.1.7
聯合概率分布和條件概率分布2.1.8
貝葉斯決策理論2.1.9
期望和方差2.2
信息論基本概念2.2.1
熵2.2.2
聯合熵和條件熵2.2.3
互信息2.2.4
相對熵2.2.5
交叉熵2.2.6
困惑度2.2.7
噪聲信道模型2.3
支持向量機2.3.1
線性分類2.3.2
線性不可分2.3.3
構造核函數第3章
形式語言與自動機3.1
基本概念3.1.1
圖3.1.2
樹3.1.3
字符串3.2
形式語言3.2.1
概述3.2.2
形式語法的定義3.2.3
形式語法的類型3.2.4
CFG識別句子的派生樹表示3.3
自動機理論3.3.1
有限自動機3.3.2
正則文法與自動機的關繫3.3.3
上下文無關文法與下推自動機3.3.4
圖靈機3.3.5
線性界限自動機3.4
自動機在自然語言處理中的應用3.4.1
單詞拼寫檢查3.4.2
單詞形態分析3.4.3
詞性消歧第4章
語料庫與語言知識庫4.1
語料庫技術4.1.1
概述4.1.2
語料庫語言學的發展4.1.3
語料庫的類型4.1.4
漢語語料庫建設中的問題4.1.5
典型語料庫介紹……第5章
語言模型第6章
概率圖模型第7章
自動分詞、命名實體識別與詞性標注第8章
句法分析第9章
語義分析0章
篇章分析1章
統計機器翻譯2章
語音翻譯3章
文本分類與情感分類4章
信息檢索與問答繫統5章
自動文摘與信息抽取6章
口語信息處理與人機對話繫統參考文獻自然語言處理及其相關領域的國際會議名詞術語索引
內容簡介
《中文信息處理叢書:統計自然語言處理(第2版)》全面介紹了統計自然語言處理的基本概念、理論方法和很新研究進展,內容包括形式語言與自動機及其在自然語言處理中的應用、語言模型、隱馬爾可夫模型、語料庫技術、漢語自動分詞與詞性標注、句法分析、詞義消歧、篇章分析、統計機器翻譯、語音翻譯、文本分類、信息檢索與問答繫統、自動文摘和信息抽取、口語信息處理與人機對話繫統等,既有對基礎知識和理論模型的介紹,也有對相關問題的研究背景、實現方法和技術現狀的詳細闡述。 《中文信息處理叢書:統計自然語言處理(第2版)》可作為高等院校計算機、信息技術等相關專業的高年級本科生或研究生的教材或參考書,也可供從事自然語言處理、數據挖掘和人工智能等研究的相關人員參考。