![](/c49/99/11507239.jpg)
出版社:電子工業出版社 ISBN:9787121226250 版次:01 商品編碼:11507239 品牌:電子工業出版社 包裝:平裝 叢書名:工業和信息產業科技與教育專著出版資金資助出版 開本:16開 出版時間:2014-07-01 用紙:膠版紙 頁數:440 正文語種:中文 作者:胡航
" 內容簡介 本書繫統介紹了語音信號處理的基礎、原理、方法、應用、新理論、新成果與新技術,以及該研究領域的背景知識、研究現狀、應用前景和發展趨勢。 全書分三篇共17章。第一篇語音信號處理基礎,包括第1章緒論,第2章語音信號處理的基礎知識;第二篇語音信號分析,包括第3章時域分析,第4章短時傅裡葉分析,第5章倒譜分析與同態濾波,第6章線性預測分析,第7章語音信號的非線性分析,第8章語音特征參數檢測與估計,第9章矢量量化,第10章隱馬爾可夫模型;第三篇語音信號處理技術與應用,包括第11章語音編碼,第12章語音合成,第13章語音識別,第14章說話人識別和語種辨識,第15章智能信息處理技術在語音信號處理中的應用,第16章語音增強,第17章基於麥克風陣列的語音信號處理。 本書體繫完整,結構嚴謹;繫統性強,層次分明;內容深入淺出,原理闡述透徹;取材廣泛,繁簡適中;內容豐富而新穎;聯繫實際應用。 作者簡介 胡航,博士,哈爾濱工業大學電子信息學院副教授,主要教授《信號與繫統》、《數字信號處理》等課程,研究方向為現代語音信號處理。 目錄 目 錄 第一篇 語音信號處理基礎
第1章 緒論\t1 1.1 語音信號處理的發展歷史\t1 1.2 語音信號處理的主要研究內容及發展 概況\t3 1.3 本書的內容\t7 思考與復習題\t8 第2章 語音信號處理的基礎知識\t9 2.1 概述\t9 2.2 語音產生的過程\t9 2.3 語音信號的特性\t12 2.3.1 語言和語音的基本特性\t12 2.3.2 語音信號的時間波形和頻譜特性\t13 2.3.3 語音信號的統計特性\t15 2.4 語音產生的線性模型\t16 2.4.1 激勵模型\t17 2.4.2 聲道模型\t18 2.4.3 輻射模型\t20 2.4.4 語音信號數字模型\t21 2.5 語音產生的非線性模型\t22 2.5.1 FM-AM模型的基本原理\t22 2.5.2 Teager能量算子\t22 2.5.3 能量分離算法\t23 2.5.4 FM-AM模型的應用\t24 2.6 語音感知\t24 2.6.1 聽覺繫統\t24 2.6.2 神經繫統\t25 2.6.3 語音感知\t26 思考與復習題\t29
第二篇 語音信號分析
第3章 時域分析\t30 3.1 概述\t30 3.2 數字化和預處理\t31 3.2.1 取樣率和量化字長的選擇\t31 3.2.2 預處理\t33 3.3 短時能量分析\t34 3.4 短時過零分析\t36 3.5 短時相關分析\t39 3.5.1 短時自相關函數\t39 3.5.2 修正的短時自相關函數\t40 3.5.3 短時平均幅差函數\t42 3.6 語音端點檢測\t42 3.6.1 雙門限前端檢測\t43 3.6.2 多門限過零率前端檢測\t43 3.6.3 基於FM-AM模型的端點檢測\t43 3.7 基於高階累積量的語音端點檢測\t44 3.7.1 噪聲環境下的端點檢測\t44 3.7.2 高階累積量與高階譜\t44 3.7.3 基於高階累積量的端點檢測\t46 思考與復習題\t48 第4章 短時傅裡葉分析\t50 4.1 概述\t50 4.2 短時傅裡葉變換\t50 4.2.1 短時傅裡葉變換的定義\t50 4.2.2 傅裡葉變換的解釋\t51 4.2.3 濾波器的解釋\t54 4.3 短時傅裡葉變換的取樣率\t55 4.4 語音信號的短時綜合\t56 4.4.1 濾波器組求和法\t56 4.4.2 FFT求和法\t58 4.5 語譜圖\t59 思考與復習題\t61 第5章 倒譜分析與同態濾波\t62 5.1 概述\t62 5.2 同態信號處理的基本原理\t62 5.3 復倒譜和倒譜\t63 5.4 語音信號兩個卷積分量復倒譜的性質\t64 5.4.1 聲門激勵信號\t64 5.4.2 聲道衝激響應序列\t65 5.5 避免相位卷繞的算法\t66 5.5.1 微分法\t67 5.5.2 最小相位信號法\t67 5.5.3 遞推法\t69 5.6 語音信號復倒譜分析實例\t70 5.7 Mel頻率倒譜繫數\t72 思考與復習題\t73 第6章 線性預測分析\t74 6.1 概述\t74 6.2 線性預測分析的基本原理\t74 6.2.1 基本原理\t74 6.2.2 語音信號的線性預測分析\t75 6.3 線性預測方程組的建立\t76 6.4 線性預測分析的解法(1)―自相關和 協方差法\t77 6.4.1 自相關法\t78 6.4.2 協方差法\t79 6.4.3 自相關和協方差法的比較\t80 6.5 線性預測分析的解法(2)―格型法\t81 6.5.1 格型法基本原理\t81 6.5.2 格型法的求解\t83 6.6 線性預測分析的應用―LPC譜估計和 LPC復倒譜\t85 6.6.1 LPC譜估計\t85 6.6.2 LPC復倒譜\t87 6.6.3 LPC譜估計與其他譜分析方法的 比較\t88 6.7 線譜對(LSP)分析\t89 6.7.1 線譜對分析原理\t89 6.7.2 線譜對參數的求解\t91 6.8 極零模型\t91 思考與復習題\t93 第7章 語音信號的非線性分析\t94 7.1 概述\t94 7.2 時頻分析\t94 7.2.1 短時傅裡葉變換的局限\t95 7.2.2 時頻分析\t96 7.3 小波分析\t97 7.3.1 概述\t97 7.3.2 小波變換的定義\t97 7.3.3 典型的小波函數\t99 7.3.4 離散小波變換\t100 7.3.5 小波多分辨分析與Mallat算法\t100 7.4 基於小波的語音分析\t101 7.4.1 語音分解與重構\t101 7.4.2 清/濁音判斷\t102 7.4.3 語音去噪\t102 7.4.4 聽覺繫統模擬\t103 7.4.5 小波包變換在語音端點檢測中的 應用\t103 7.5 混沌與分形\t104 7.6 基於混沌的語音分析\t105 7.6.1 語音信號的混沌性\t105 7.6.2 語音信號的相空間重構\t106 7.6.3 語音信號的Lyapunov指數\t108 7.6.4 基於混沌的語音、噪聲判別\t109 7.7 基於分形的語音分析\t110 7.7.1 概述\t110 7.7.2 語音信號的分形特征\t111 7.7.3 基於分形的語音分割\t112 思考與復習題\t113 第8章 語音特征參數估計\t114 8.1 基音估計\t114 8.1.1 自相關法\t115 8.1.2 並行處理法\t117 8.1.3 倒譜法\t118 8.1.4 簡化逆濾波法\t120 8.1.5 高階累積量法\t122 8.1.6 小波變換法\t123 8.1.7 基音檢測的後處理\t124 8.2 共振峰估計\t125 8.2.1 帶通濾波器組法\t125 8.2.2 DFT法\t126 8.2.3 倒譜法\t127 8.2.4 LPC法\t129 8.2.5 FM-AM模型法\t130 思考與復習題\t131 第9章 矢量量化\t132 9.1 概述\t132 9.2 矢量量化的基本原理\t133 9.3 失真測度\t134 9.3.1 歐氏距離―均方誤差\t135 9.3.2 LPC失真測度\t135 9.3.3 識別失真測度\t137 9.4 最佳矢量量化器和碼本的設計\t137 9.4.1 矢量量化器最佳設計的兩個條件\t137 9.4.2 LBG算法\t138 9.4.3 初始碼書生成\t138 9.5 降低復雜度的矢量量化繫統\t139 9.5.1 無記憶的矢量量化繫統\t140 9.5.2 有記憶的矢量量化繫統\t142 9.6 語音參數的矢量量化\t144 9.7 模糊矢量量化\t145 9.7.1 模糊集概述\t146 9.7.2 模糊矢量量化\t147 9.8 遺傳矢量量化\t148 9.8.1 遺傳算法\t148 9.8.2 遺傳矢量量化\t150 思考與復習題\t151 第10章 隱馬爾可夫模型\t152 10.1 概述\t152 10.2 隱馬爾可夫模型的引入\t153 10.3 隱馬爾可夫模型的定義\t155 10.4 隱馬爾可夫模型三個問題的求解\t156 10.4.1 概率的計算\t157 10.4.2 HMM的識別\t159 10.4.3 HMM的訓練\t160 10.4.4 EM算法\t161 10.5 HMM的選取\t162 10.5.1 HMM的類型選擇\t162 10.5.2 輸出概率分布的選取\t163 10.5.3 狀態數的選取\t163 10.5.4 初值選取\t163 10.5.5 訓練準則的選取\t165 10.6 HMM應用與實現中的一些問題\t166 10.6.1 數據下溢\t166 10.6.2 多輸出(觀察矢量序列)情況\t166 10.6.3 訓練數據不足\t167 10.6.4 考慮狀態持續時間的HMM\t168 10.7 HMM的結構和類型\t170 10.7.1 HMM的結構\t170 10.7.2 HMM的類型\t172 10.7.3 按輸出形式分類\t173 10.8 HMM的相似度比較\t174 思考與復習題\t175
第三篇 語音信號處理技術與應用
第11章 語音編碼\t176 11.1 概述\t176 11.2 語音信號的壓縮編碼原理\t178 11.2.1 語音壓縮的基本原理\t178 11.2.2 語音通信中的語音質量\t179 11.2.3 兩種壓縮編碼方式\t180 11.3 語音信號的波形編碼\t180 11.3.1 PCM及APCM\t180 11.3.2 預測編碼及自適應預測編碼\t183 11.3.3 ADPCM及ADM\t185 11.3.4 子帶編碼(SBC)\t187 11.3.5 自適應變換編碼(ATC)\t189 11.4 聲碼器\t191 11.4.1 概述\t191 11.4.2 聲碼器的基本結構\t192 11.4.3 通道聲碼器\t192 11.4.4 同態聲碼器\t194 11.5 LPC聲碼器\t195 11.5.1 LPC參數的變換與量化\t196 11.5.2 LPC-10\t197 11.5.3 LPC-10e\t198 11.5.4 變幀率LPC聲碼器\t199 11.6 各種常規語音編碼方法的比較\t200 11.6.1 波形編碼的信號壓縮技術\t200 11.6.2 波形編碼與聲碼器的比較\t200 11.6.3 各種聲碼器的比較\t201 11.7 基於LPC模型的混合編碼\t201 11.7.1 混合編碼采用的技術\t202 11.7.2 MPLPC\t204 11.7.3 RPELPC\t207 11.7.4 CELP\t209 11.7.5 CELP的改進形式\t211 11.7.6 基於分形碼本的CELP\t213 11.8 基於正弦模型的混合編碼\t214 11.8.1 正弦變換編碼\t215 11.8.2 多帶激勵(MBE)編碼\t215 11.9 極低速率語音編碼\t217 11.9.1 400~1.2kb/s數碼率的聲碼器\t217 11.9.2 識別-合成型聲碼器\t218 11.10 語音編碼的性能指標\t219 11.11 語音編碼的質量評價\t221 11.11.1 主觀評價方法\t221 11.11.2 客觀評價方法\t222 11.11.3 主客觀評價方法的結合\t225 11.11.4 基於多重分形的語音質量評價\t226 11.12 語音編碼國際標準\t227 11.13 語音編碼與圖像編碼的關繫\t228 小結\t229 思考與復習題\t229 第12章 語音合成\t231 12.1 概述\t231 12.2 語音合成原理\t232 12.2.1 語音合成的方法\t232 12.2.2 語音合成的繫統特性\t234 12.3 共振峰合成\t235 12.3.1 共振峰合成原理\t235 12.3.2 共振峰合成實例\t237 12.4 LPC合成\t237 12.5 PSOLA語音合成\t239 12.5.1 概述\t239 12.5.2 PSOLA的原理\t240 12.5.3 PSOLA的實現\t240 12.5.4 PSOLA的改進\t242 12.5.5 PSOLA語音合成繫統的發展\t243 12.6 文語轉換繫統\t243 12.6.1 組成與結構\t243 12.6.2 文本分析\t244 12.6.3 韻律控制\t245 12.6.4 語音合成\t248 12.6.5 TTS繫統的一些問題\t248 12.7 基於HMM的參數化語音合成\t249 12.8 語音合成的研究現狀和發展趨勢\t253 12.9 語音合成硬件簡介\t255 思考與復習題\t256 第13章 語音識別\t257 13.1 概述\t257 13.2 語音識別原理\t260 13.3 動態時間規整\t264 13.4 基於有限狀態矢量量化的語音識別\t266 13.5 孤立詞識別繫統\t267 13.6 連接詞識別\t270 13.6.1 基本原理\t270 13.6.2 基於DTW的連接詞識別\t271 13.6.3 基於HMM的連接詞識別\t273 13.6.4 基於分段K-均值的最佳詞串分割及 模型訓練\t273 13.7 連續語音識別\t274 13.7.1 連續語音識別存在的困難\t274 13.7.2 連續語音識別的訓練及識別方法\t275 13.7.3 連續語音識別的整體模型\t276 13.7.4 基於HMM統一框架的大詞彙非特定 人連續語音識別\t277 13.7.5 聲學模型\t278 13.7.6 語言學模型\t280 13.7.7 最優路徑搜索\t282 13.8 說話人自適應\t284 13.8.1 MAP算法\t285 13.8.2 基於變換的自適應方法\t285 13.8.3 基於說話人分類的自適應方法\t286 13.9 魯棒的語音識別\t287 13.10 關鍵詞確認\t289 13.11 可視語音識別\t291 13.11.1 概述\t291 13.11.2 機器自動唇讀\t291 13.11.3 雙模態語音識別\t293 13.12 語音理解\t296 13.12.1 MAP語義解碼\t297 13.12.2 語義結構的表示\t297 13.12.3 意圖解碼器\t298 小結\t299 思考與復習題\t299 第14章 說話人識別\t300 14.1 概述\t300 14.2 特征選取\t301 14.2.1 說話人識別所用的特征\t301 14.2.2 特征類型的優選準則\t302 14.2.3 常用的特征參數\t303 14.3 說話人識別繫統\t303 14.3.1 說話人識別繫統的結構\t303 14.3.2 說話人識別的基本方法概述\t304 14.4 說話人識別繫統實例\t305 14.4.1 DTW型說話人識別繫統\t305 14.4.2 應用VQ的說話人識別繫統\t306 14.5 基於HMM的說話人識別\t307 14.6 基於GMM的說話人識別\t310 14.7 說話人識別中需進一步研究的問題\t312 14.8 語種辨識\t313 思考與復習題\t316 第15章 智能信息處理技術在語音信號 處理中的應用\t317 15.1 人工神經網絡\t317 15.1.1 概述\t317 15.1.2 神經網絡的基本概念\t319 15.2 神經網絡的模型結構\t320 15.2.1 單層感知機\t320 15.2.2 多層感知機\t321 15.2.3 自組織映射神經網絡\t323 15.2.4 時延神經網絡\t324 15.2.5 循環神經網絡\t325 15.3 神經網絡與傳統方法的結合\t325 15.3.1 概述\t325 15.3.2 神經網絡與DTW\t326 15.3.3 神經網絡與VQ\t326 15.3.4 神經網絡與HMM\t327 15.4 神經網絡語音識別\t328 15.4.1 靜態語音識別\t328 15.4.2 連續語音識別\t330 15.5 基於神經網絡的說話人識別\t330 15.6 基於神經網絡的語音信號非線性預測 編碼\t332 15.6.1 語音信號的非線性預測\t332 15.6.2 基於MLP的非線性預測編碼\t333 15.6.3 基於RNN的非線性預測編碼\t334 15.7 基於神經網絡的語音合成\t335 15.8 支持向量機\t336 15.8.1 概述\t336 15.8.2 支持向量機的基本原理\t337 15.9 基於支持向量機的語音分類識別\t339 15.10 基於支持向量機的說話人識別\t340 15.10.1 基於支持向量機的說話人辨認\t340 15.10.2 基於支持向量機的說話人確認\t340 15.11 基於混沌神經網絡的語音識別\t342 15.11.1 混沌神經網絡\t342 15.11.2 基於混沌神經網絡的語音識別\t342 15.12 分形在語音識別中的應用\t344 15.13 智能優化算法在語音信號處理中的 應用\t344 15.14 各種智能信息處理技術的融合與 集成\t346 15.14.1 模糊繫統與神經網絡的融合\t347 15.14.2 神經網絡與遺傳算法的融合\t347 15.14.3 模糊邏輯、神經網絡及遺傳算法的 融合\t348 15.14.4 神經網絡、模糊邏輯及混沌的 融合\t349 15.14.5 混沌與遺傳算法的融合\t349 思考與復習題\t350 第16章 語音增強\t351 16.1 概述\t351 16.2 語音、人耳感知及噪聲的特性\t352 16.3 濾波器法\t354 16.3.1 固定濾波器\t354 16.3.2 變換技術\t354 16.3.3 自適應噪聲對消\t354 16.4 非線性處理\t357 16.5 基於相關特性的語音增強\t358 16.6 減譜法\t359 16.6.1 減譜法的基本原理\t359 16.6.2 減譜法的改進形式\t360 16.7 基於Wiener濾波的語音增強\t361 16.8 基於語音產生模型的語音增強\t362 16.9 基於小波的語音增強\t364 16.9.1 概述\t364 16.9.2 基於小波的語音增強\t364 16.9.3 基於小波包的語音增強\t366 16.10 基於信號子空間分解的語音增強\t367 16.11 語音增強的一些新發展\t370 小結\t371 思考與復習題\t372 第17章 基於麥克風陣列的語音信號 處理\t373 17.1 概述\t373 17.2 麥克風陣列語音處理技術的難點\t374 17.3 聲源定位\t375 17.3.1 去混響\t375 17.3.2 近場模型\t376 17.3.3 聲源定位\t377 17.4 語音增強\t381 17.4.1 概述\t381 17.4.2 方法與技術\t382 17.4.3 應用\t386 17.4.4 本節小結\t387 17.5 語音盲分離\t387 17.5.1 瞬時線性混合模型\t388 17.5.2 卷積混合模型\t393 17.5.3 非線性混合模型\t395 17.5.4 需進一步研究的問題\t396 思考與復習題\t396 漢英名詞術語對照\t398 參考文獻\t407 查看全部↓
" |