了得網圖書_現代語音信號處理

目錄
第一篇語音信號處理基礎

第1章緒論\t1
1．1 語音信號處理的發展歷史\t1
1．2 語音信號處理的主要研究內容及發展
概況\t3
1．3 本書的內容\t7
思考與復習題\t8
第2章語音信號處理的基礎知識\t9
2．1 概述\t9
2．2 語音產生的過程\t9
2．3 語音信號的特性\t12
2．3．1 語言和語音的基本特性\t12
2．3．2 語音信號的時間波形和頻譜特性\t13
2．3．3 語音信號的統計特性\t15
2．4 語音產生的線性模型\t16
2．4．1 激勵模型\t17
2．4．2 聲道模型\t18
2．4．3 輻射模型\t20
2．4．4 語音信號數字模型\t21
2．5 語音產生的非線性模型\t22
2．5．1 FM-AM模型的基本原理\t22
2．5．2 Teager能量算子\t22
2．5．3 能量分離算法\t23
2．5．4 FM-AM模型的應用\t24
2．6 語音感知\t24
2．6．1 聽覺繫統\t24
2．6．2 神經繫統\t25
2．6．3 語音感知\t26
思考與復習題\t29

第二篇語音信號分析

第3章時域分析\t30
3．1 概述\t30
3．2 數字化和預處理\t31
3．2．1 取樣率和量化字長的選擇\t31
3．2．2 預處理\t33
3．3 短時能量分析\t34
3．4 短時過零分析\t36
3．5 短時相關分析\t39
3．5．1 短時自相關函數\t39
3．5．2 修正的短時自相關函數\t40
3．5．3 短時平均幅差函數\t42
3．6 語音端點檢測\t42
3．6．1 雙門限前端檢測\t43
3．6．2 多門限過零率前端檢測\t43
3．6．3 基於FM-AM模型的端點檢測\t43
3．7 基於高階累積量的語音端點檢測\t44
3．7．1 噪聲環境下的端點檢測\t44
3．7．2 高階累積量與高階譜\t44
3．7．3 基於高階累積量的端點檢測\t46
思考與復習題\t48
第4章短時傅裡葉分析\t50
4．1 概述\t50
4．2 短時傅裡葉變換\t50
4．2．1 短時傅裡葉變換的定義\t50
4．2．2 傅裡葉變換的解釋\t51
4．2．3 濾波器的解釋\t54
4．3 短時傅裡葉變換的取樣率\t55
4．4 語音信號的短時綜合\t56
4．4．1 濾波器組求和法\t56
4．4．2 FFT求和法\t58
4．5 語譜圖\t59
思考與復習題\t61
第5章倒譜分析與同態濾波\t62
5．1 概述\t62
5．2 同態信號處理的基本原理\t62
5．3 復倒譜和倒譜\t63
5．4 語音信號兩個卷積分量復倒譜的性質\t64
5．4．1 聲門激勵信號\t64
5．4．2 聲道衝激響應序列\t65
5．5 避免相位卷繞的算法\t66
5．5．1 微分法\t67
5．5．2 最小相位信號法\t67
5．5．3 遞推法\t69
5．6 語音信號復倒譜分析實例\t70
5．7 Mel頻率倒譜繫數\t72
思考與復習題\t73
第6章線性預測分析\t74
6．1 概述\t74
6．2 線性預測分析的基本原理\t74
6．2．1 基本原理\t74
6．2．2 語音信號的線性預測分析\t75
6．3 線性預測方程組的建立\t76
6．4 線性預測分析的解法(1)―自相關和
協方差法\t77
6．4．1 自相關法\t78
6．4．2 協方差法\t79
6．4．3 自相關和協方差法的比較\t80
6．5 線性預測分析的解法(2)―格型法\t81
6．5．1 格型法基本原理\t81
6．5．2 格型法的求解\t83
6．6 線性預測分析的應用―LPC譜估計和
LPC復倒譜\t85
6．6．1 LPC譜估計\t85
6．6．2 LPC復倒譜\t87
6．6．3 LPC譜估計與其他譜分析方法的
比較\t88
6．7 線譜對(LSP)分析\t89
6．7．1 線譜對分析原理\t89
6．7．2 線譜對參數的求解\t91
6．8 極零模型\t91
思考與復習題\t93
第7章語音信號的非線性分析\t94
7．1 概述\t94
7．2 時頻分析\t94
7．2．1 短時傅裡葉變換的局限\t95
7．2．2 時頻分析\t96
7．3 小波分析\t97
7．3．1 概述\t97
7．3．2 小波變換的定義\t97
7．3．3 典型的小波函數\t99
7．3．4 離散小波變換\t100
7．3．5 小波多分辨分析與Mallat算法\t100
7．4 基於小波的語音分析\t101
7．4．1 語音分解與重構\t101
7．4．2 清/濁音判斷\t102
7．4．3 語音去噪\t102
7．4．4 聽覺繫統模擬\t103
7．4．5 小波包變換在語音端點檢測中的
應用\t103
7．5 混沌與分形\t104
7．6 基於混沌的語音分析\t105
7．6．1 語音信號的混沌性\t105
7．6．2 語音信號的相空間重構\t106
7．6．3 語音信號的Lyapunov指數\t108
7．6．4 基於混沌的語音、噪聲判別\t109
7．7 基於分形的語音分析\t110
7．7．1 概述\t110
7．7．2 語音信號的分形特征\t111
7．7．3 基於分形的語音分割\t112
思考與復習題\t113
第8章語音特征參數估計\t114
8．1 基音估計\t114
8．1．1 自相關法\t115
8．1．2 並行處理法\t117
8．1．3 倒譜法\t118
8．1．4 簡化逆濾波法\t120
8．1．5 高階累積量法\t122
8．1．6 小波變換法\t123
8．1．7 基音檢測的後處理\t124
8．2 共振峰估計\t125
8．2．1 帶通濾波器組法\t125
8．2．2 DFT法\t126
8．2．3 倒譜法\t127
8．2．4 LPC法\t129
8．2．5 FM-AM模型法\t130
思考與復習題\t131
第9章矢量量化\t132
9．1 概述\t132
9．2 矢量量化的基本原理\t133
9．3 失真測度\t134
9．3．1 歐氏距離―均方誤差\t135
9．3．2 LPC失真測度\t135
9．3．3 識別失真測度\t137
9．4 最佳矢量量化器和碼本的設計\t137
9．4．1 矢量量化器最佳設計的兩個條件\t137
9．4．2 LBG算法\t138
9．4．3 初始碼書生成\t138
9．5 降低復雜度的矢量量化繫統\t139
9．5．1 無記憶的矢量量化繫統\t140
9．5．2 有記憶的矢量量化繫統\t142
9．6 語音參數的矢量量化\t144
9．7 模糊矢量量化\t145
9．7．1 模糊集概述\t146
9．7．2 模糊矢量量化\t147
9．8 遺傳矢量量化\t148
9．8．1 遺傳算法\t148
9．8．2 遺傳矢量量化\t150
思考與復習題\t151
第10章隱馬爾可夫模型\t152
10．1 概述\t152
10．2 隱馬爾可夫模型的引入\t153
10．3 隱馬爾可夫模型的定義\t155
10．4 隱馬爾可夫模型三個問題的求解\t156
10．4．1 概率的計算\t157
10．4．2 HMM的識別\t159
10．4．3 HMM的訓練\t160
10．4．4 EM算法\t161
10．5 HMM的選取\t162
10．5．1 HMM的類型選擇\t162
10．5．2 輸出概率分布的選取\t163
10．5．3 狀態數的選取\t163
10．5．4 初值選取\t163
10．5．5 訓練準則的選取\t165
10．6 HMM應用與實現中的一些問題\t166
10．6．1 數據下溢\t166
10．6．2 多輸出(觀察矢量序列)情況\t166
10．6．3 訓練數據不足\t167
10．6．4 考慮狀態持續時間的HMM\t168
10．7 HMM的結構和類型\t170
10．7．1 HMM的結構\t170
10．7．2 HMM的類型\t172
10．7．3 按輸出形式分類\t173
10．8 HMM的相似度比較\t174
思考與復習題\t175

第三篇語音信號處理技術與應用

第11章語音編碼\t176
11．1 概述\t176
11．2 語音信號的壓縮編碼原理\t178
11．2．1 語音壓縮的基本原理\t178
11．2．2 語音通信中的語音質量\t179
11．2．3 兩種壓縮編碼方式\t180
11．3 語音信號的波形編碼\t180
11．3．1 PCM及APCM\t180
11．3．2 預測編碼及自適應預測編碼\t183
11．3．3 ADPCM及ADM\t185
11．3．4 子帶編碼(SBC)\t187
11．3．5 自適應變換編碼(ATC)\t189
11．4 聲碼器\t191
11．4．1 概述\t191
11．4．2 聲碼器的基本結構\t192
11．4．3 通道聲碼器\t192
11．4．4 同態聲碼器\t194
11．5 LPC聲碼器\t195
11．5．1 LPC參數的變換與量化\t196
11．5．2 LPC-10\t197
11．5．3 LPC-10e\t198
11．5．4 變幀率LPC聲碼器\t199
11．6 各種常規語音編碼方法的比較\t200
11．6．1 波形編碼的信號壓縮技術\t200
11．6．2 波形編碼與聲碼器的比較\t200
11．6．3 各種聲碼器的比較\t201
11．7 基於LPC模型的混合編碼\t201
11．7．1 混合編碼采用的技術\t202
11．7．2 MPLPC\t204
11．7．3 RPELPC\t207
11．7．4 CELP\t209
11．7．5 CELP的改進形式\t211
11．7．6 基於分形碼本的CELP\t213
11．8 基於正弦模型的混合編碼\t214
11．8．1 正弦變換編碼\t215
11．8．2 多帶激勵(MBE)編碼\t215
11．9 極低速率語音編碼\t217
11．9．1 400～1．2kb/s數碼率的聲碼器\t217
11．9．2 識別-合成型聲碼器\t218
11．10 語音編碼的性能指標\t219
11．11 語音編碼的質量評價\t221
11．11．1 主觀評價方法\t221
11．11．2 客觀評價方法\t222
11．11．3 主客觀評價方法的結合\t225
11．11．4 基於多重分形的語音質量評價\t226
11．12 語音編碼國際標準\t227
11．13 語音編碼與圖像編碼的關繫\t228
小結\t229
思考與復習題\t229
第12章語音合成\t231
12．1 概述\t231
12．2 語音合成原理\t232
12．2．1 語音合成的方法\t232
12．2．2 語音合成的繫統特性\t234
12．3 共振峰合成\t235
12．3．1 共振峰合成原理\t235
12．3．2 共振峰合成實例\t237
12．4 LPC合成\t237
12．5 PSOLA語音合成\t239
12．5．1 概述\t239
12．5．2 PSOLA的原理\t240
12．5．3 PSOLA的實現\t240
12．5．4 PSOLA的改進\t242
12．5．5 PSOLA語音合成繫統的發展\t243
12．6 文語轉換繫統\t243
12．6．1 組成與結構\t243
12．6．2 文本分析\t244
12．6．3 韻律控制\t245
12．6．4 語音合成\t248
12．6．5 TTS繫統的一些問題\t248
12．7 基於HMM的參數化語音合成\t249
12．8 語音合成的研究現狀和發展趨勢\t253
12．9 語音合成硬件簡介\t255
思考與復習題\t256
第13章語音識別\t257
13．1 概述\t257
13．2 語音識別原理\t260
13．3 動態時間規整\t264
13．4 基於有限狀態矢量量化的語音識別\t266
13．5 孤立詞識別繫統\t267
13．6 連接詞識別\t270
13．6．1 基本原理\t270
13．6．2 基於DTW的連接詞識別\t271
13．6．3 基於HMM的連接詞識別\t273
13．6．4 基於分段K-均值的最佳詞串分割及
模型訓練\t273
13．7 連續語音識別\t274
13．7．1 連續語音識別存在的困難\t274
13．7．2 連續語音識別的訓練及識別方法\t275
13．7．3 連續語音識別的整體模型\t276
13．7．4 基於HMM統一框架的大詞彙非特定
人連續語音識別\t277
13．7．5 聲學模型\t278
13．7．6 語言學模型\t280
13．7．7 最優路徑搜索\t282
13．8 說話人自適應\t284
13．8．1 MAP算法\t285
13．8．2 基於變換的自適應方法\t285
13．8．3 基於說話人分類的自適應方法\t286
13．9 魯棒的語音識別\t287
13．10 關鍵詞確認\t289
13．11 可視語音識別\t291
13．11．1 概述\t291
13．11．2 機器自動唇讀\t291
13．11．3 雙模態語音識別\t293
13．12 語音理解\t296
13．12．1 MAP語義解碼\t297
13．12．2 語義結構的表示\t297
13．12．3 意圖解碼器\t298
小結\t299
思考與復習題\t299
第14章說話人識別\t300
14．1 概述\t300
14．2 特征選取\t301
14．2．1 說話人識別所用的特征\t301
14．2．2 特征類型的優選準則\t302
14．2．3 常用的特征參數\t303
14．3 說話人識別繫統\t303
14．3．1 說話人識別繫統的結構\t303
14．3．2 說話人識別的基本方法概述\t304
14．4 說話人識別繫統實例\t305
14．4．1 DTW型說話人識別繫統\t305
14．4．2 應用VQ的說話人識別繫統\t306
14．5 基於HMM的說話人識別\t307
14．6 基於GMM的說話人識別\t310
14．7 說話人識別中需進一步研究的問題\t312
14．8 語種辨識\t313
思考與復習題\t316
第15章智能信息處理技術在語音信號
處理中的應用\t317
15．1 人工神經網絡\t317
15．1．1 概述\t317
15．1．2 神經網絡的基本概念\t319
15．2 神經網絡的模型結構\t320
15．2．1 單層感知機\t320
15．2．2 多層感知機\t321
15．2．3 自組織映射神經網絡\t323
15．2．4 時延神經網絡\t324
15．2．5 循環神經網絡\t325
15．3 神經網絡與傳統方法的結合\t325
15．3．1 概述\t325
15．3．2 神經網絡與DTW\t326
15．3．3 神經網絡與VQ\t326
15．3．4 神經網絡與HMM\t327
15．4 神經網絡語音識別\t328
15．4．1 靜態語音識別\t328
15．4．2 連續語音識別\t330
15．5 基於神經網絡的說話人識別\t330
15．6 基於神經網絡的語音信號非線性預測
編碼\t332
15．6．1 語音信號的非線性預測\t332
15．6．2 基於MLP的非線性預測編碼\t333
15．6．3 基於RNN的非線性預測編碼\t334
15．7 基於神經網絡的語音合成\t335
15．8 支持向量機\t336
15．8．1 概述\t336
15．8．2 支持向量機的基本原理\t337
15．9 基於支持向量機的語音分類識別\t339
15．10 基於支持向量機的說話人識別\t340
15．10．1 基於支持向量機的說話人辨認\t340
15．10．2 基於支持向量機的說話人確認\t340
15．11 基於混沌神經網絡的語音識別\t342
15．11．1 混沌神經網絡\t342
15．11．2 基於混沌神經網絡的語音識別\t342
15．12 分形在語音識別中的應用\t344
15．13 智能優化算法在語音信號處理中的
應用\t344
15．14 各種智能信息處理技術的融合與
集成\t346
15．14．1 模糊繫統與神經網絡的融合\t347
15．14．2 神經網絡與遺傳算法的融合\t347
15．14．3 模糊邏輯、神經網絡及遺傳算法的
融合\t348
15．14．4 神經網絡、模糊邏輯及混沌的
融合\t349
15．14．5 混沌與遺傳算法的融合\t349
思考與復習題\t350
第16章語音增強\t351
16．1 概述\t351
16．2 語音、人耳感知及噪聲的特性\t352
16．3 濾波器法\t354
16．3．1 固定濾波器\t354
16．3．2 變換技術\t354
16．3．3 自適應噪聲對消\t354
16．4 非線性處理\t357
16．5 基於相關特性的語音增強\t358
16．6 減譜法\t359
16．6．1 減譜法的基本原理\t359
16．6．2 減譜法的改進形式\t360
16．7 基於Wiener濾波的語音增強\t361
16．8 基於語音產生模型的語音增強\t362
16．9 基於小波的語音增強\t364
16．9．1 概述\t364
16．9．2 基於小波的語音增強\t364
16．9．3 基於小波包的語音增強\t366
16．10 基於信號子空間分解的語音增強\t367
16．11 語音增強的一些新發展\t370
小結\t371
思考與復習題\t372
第17章基於麥克風陣列的語音信號
處理\t373
17．1 概述\t373
17．2 麥克風陣列語音處理技術的難點\t374
17．3 聲源定位\t375
17．3．1 去混響\t375
17．3．2 近場模型\t376
17．3．3 聲源定位\t377
17．4 語音增強\t381
17．4．1 概述\t381
17．4．2 方法與技術\t382
17．4．3 應用\t386
17．4．4 本節小結\t387
17．5 語音盲分離\t387
17．5．1 瞬時線性混合模型\t388
17．5．2 卷積混合模型\t393
17．5．3 非線性混合模型\t395
17．5．4 需進一步研究的問題\t396
思考與復習題\t396
漢英名詞術語對照\t398
參考文獻\t407

查看全部↓

商品搜索

商品分类

【醫學】

【各大出版社】

【医学】

【各大出版社】

內容簡介

作者簡介

目錄