●章引言()節問題的提出及研究意義()第二節語音識別概述()一、語音識別的發展()二、語音識別的分類()三、基於統計模型的語音識別()第三節影響語音識別魯棒性的因素()第四節語音識別及聲學技術在農業領域的應用()一、國外研究情況()二、國內研究情況()第五節研究內容()第六節章節安排()第二章噪聲魯棒性語音識別的研究現狀()節噪聲分類()一、加性噪聲與乘性噪聲()二、噪聲特性分析()第二節噪聲魯棒性方法研究現狀()一、語音增強()二、魯棒性特征提取()三、模型補償()第三章基於HMM框架的農產品價格語音識別()節HMM模型()一、HMM的概述()二、HMM的數學定義()三、HMM的三個基本問題()第二節基於HTK的實驗平臺構建()一、語音數據庫()二、MFCC特征提取()三、聲學模型的設置()四、識別性能的評價標準()第四章繫統的三音子模型優化及特征規整()節擴展的聲韻母()一、漢語語音學特點()二、漢語聲母結構()三、漢語韻母結構()四、擴展的聲韻母定義()第二節基於決策樹的狀態共享()一、決策樹的構造()二、二值問題集的設計()三、結點分裂準則()四、結點停止分裂()五、結點合並()第三節增加高斯混合分量()第四節倒譜特征歸一化()第五節實驗及分析()一、三音子模型識別實驗()二、決策樹狀態聚類()三、高斯混合分量增加()四、倒譜均值方差(CMVN)歸一化()第五章聯合譜減增強和失真補償的魯棒性方法()節譜減法()一、譜減的基本原理()二、使用過減(over subtraction)技術的譜減算法()第二節多帶(multi band)譜減法()第三節MMSE譜減算法()第四節實驗()一、MMSE譜減法參數優化實驗()二、不同環境下聯合算法實驗()第六章基於統計模型的前端增強與失真補償的結合()節MMSE幅度譜估計()一、MMSE幅度估計器()二、先驗SNR的估計()第二節對數MMSE估計器()第三節MMSE估計的實現()第四節實驗()一、采用MMSE估計器與logMMSE方法增強()二、MMSE、logMMSE與CMVN聯合實驗()三、實際環境語音測試()第五節算法綜合比較()第七章結論及展望()節研究總結()第二節展望()參考文獻()
內容簡介
當前語音識別的研究已取得了較為豐碩的成果,在安靜環境下性能令人滿意,逐漸被應用在諸多人機交互的場合。然而,由於噪聲的存在,語音識別繫統在實際環境下性能急劇下降,如何提高語音識別的噪聲魯棒性,逐漸成為近年來語音識別的研究熱點。本文主要研究農產品市場信息采集作業環境中的語音識別噪聲魯棒性問題,針對當前缺乏面向農產品市場信息采集領域的語音識別引擎,而通用領域的識別算法又不適合解決上述問題,分析環境的噪聲特點,面向非特定人和中小規模詞彙量的連續漢語普通話識別,訓練聲學模型,研究適用於該環境下的語音識別魯棒性方法。
靠前章引言靠前節問題的提出及研究意義農產品市場信息是發展現代農業的重要信息來源,是農產品市場分析和預警的基礎數據,對保證我國農產品市場安全穩定有重要意義。農產品市場信息覆蓋範圍廣,包含的信息內容紛繁復雜,更有學者(許世衛等,2011)提出了農產品全息市場信息的概念。農產品市場信息有其必要屬性,如名稱、價格;也有次要屬性,如顏色、口味等,消費者所關心的農產品信息主要包括種類、購買地點、價格、產品質量、購買量等,但不同群體的關注程度有所差異。我國目前的農產品市場信息大多隻包含名稱、價格、銷量、產地、等級等少部分信息。針對農產品市場信息的重要性,國家相關部門和地方政府也紛紛建立了各種形式的農產品市場信息采集機制,信息的采集方式往往利用傳統的人工抄錄再二次錄入計算機、電話報價或郵件彙總等方式來完成,但此類信息采集方法重復勞動較多,效率不高,且時效性較......
前言當前語音識別的研究已取得了較為豐碩的成果,在安靜環境下性能令人滿意,逐漸被應用在諸多人機交互的場合。然而,由於噪聲的存在,語音識別繫統在實際環境下性能急劇下降,如何提高語音識別的噪聲魯棒性,逐漸成為近年來語音識別的研究熱點。本書主要研究農產品市場信息采集作業環境中的語音識別噪聲魯棒性問題,針對當前缺乏面向農產品市場信息采集領域的語音識別引擎,而通用領域的識別算法又不適合解決上述問題,分析環境的噪聲特點,面向非特定人和中小規模詞彙量的連續漢語普通話識別,訓練聲學模型,研究適用於該環境下的語音識別魯棒性方法。本書主要研究的內容包括:(1)基於隱馬爾科夫模型(HMM)框架建立了聲學模型,利用自建的農產品市場信息語料庫進行訓練和測試HHM模型,基於HTK工具包建立了農產品價格語音識別基線繫統。(2)在分析農產品市場信息采集環境的噪聲特點的基礎上,從模型空間和特征空間對繫統采取了多種魯棒性方法,......
"