●序
章 緒論
節 中文信息處理概述
一、什麼是中文信息處理
二、研究中文信息處理的意義
第二節 中文信息處理的內容
一、中文信息處理的研究範圍
二、中文信息處理的研究方法
三、常見的應用繫統
第三節 中文信息處理研究的格局
一、中文信息處理與相關學科的關繫
二、中文信息處理的研究取向
三、中文信息處理研究的基本歷史分期
參考文獻
第二章 中文信息處理的起步期
節 中文信息處理問題的誕生背景及萌芽
一、自然語言處理的理論準備
二、自然語言處理的發端
三、中文信息處理的萌芽
第二節 中文信息處理問題的興起
一、沉寂後的復蘇
二、漢字信息處理時代的到來
三、漢字精密照排繫統的發展
第三節 漢字編碼工作的開展
一、漢字編碼的基本任務
二、字頻統計工作的展開
三、萬“碼”奔騰時代的到來
四、漢字交換碼標準的編制及發展
五、漢字編碼的國際標準
第四節 漢字的輸入及輸出技術
一、鍵盤輸入技術
二、漢字自動識別輸入
三、漢語語音識別輸入
四、漢字的存儲及輸出技術
第五節 起步期的應用研究及理論探索
一、從機器翻譯到自然語言理解
二、自然語言理解與人機對話
三、信息檢索及相關技術
四、學會組織的建立與發展
第六節 小結
參考文獻
第三章 中文信息處理的發展期
節 “詞”處理時代的到來
一、“詞”處理的基本任務
二、詞頻統計與詞表編制
第二節 語料庫的發展與建設
一、統計方法的復蘇與語料庫的發展
二、我國的早期語料庫建設
第三節 自動分詞技術的發展
一、自動分詞的困境
二、自動分詞方法的探索
三、歧義與未登錄詞
四、自動分詞繫統的研制
五、分詞規範的編訂
六、自動分詞技術的評測
第四節 詞性標注技術的發展
一、詞性標注與詞類劃分
二、詞性標注中的兼類詞難題
三、詞性標注技術的發展
第五節 語音處理技術的突破
一、隱馬爾可夫模型
二、語音識別技術的新進展
三、語音合成技術
第六節 應用研究的發展
一、“語言工程”概念的提出
二、機器翻譯的新發展
三、計算機輔助語言教學與測試
第七節 小結
參考文獻
第四章 中文信息處理的成熟期
節 成熟期的基本格局
一、統計方法的回歸
二、從“詞”處理到“句”處理
三、“句”處理的主要困難
第二節 句法分析與語義分析
一、句法、語義分析技術的發展背景
二、句法分析理論的兩大體繫
三、漢語句法分析方法的探索
四、語義資源及語義分析理論的發展
五、語義消歧與語義標注
第三節 基礎資源庫建設
一、語料庫迅猛發展
二、大規模語言知識庫建設
第四節 應用型技術及相關研究
一、機器翻譯
二、網絡技術下的新動向
第五節 小結
參考文獻
第五章 中文信息處理的繁榮期
節 研究範式的徹底轉向
一、從人工神經網絡到深度學習
二、人工智能與大數據
三、語音識別技術的突飛猛進
第二節 新時期的中文信息處理
一、中文信息處理的新特點
二、基於深度學習的中文信息處理研究
三、新研究領域的拓展
四、應用型技術的百花齊放
第三節 深度學習語境下的新挑戰
一、語言學知識有待回歸
二、進一步拓展與深化新的應用領域
三、與認知科學及腦神經科學相結合
四、走向多模態信息處理
五、深入國際交流與合作
第四節 小結
參考文獻
後記
內容簡介
本書簡要介紹了中文信息處理的發展歷程,集中梳理了中文信息處理技術的發展脈絡,確立了早期、發展期、成熟期的歷史分期,並以"字處理→詞處理→句處理"為主線,按照大致的時間發展順序介紹了每一階段中文信息處理各項技術的發展情況、主要成就等內容。在此基礎上,本書對今後中文信息處理技術的發展所面臨的挑戰做了粗淺的分析,展望了中文信息處理技術的未來。