[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 語音信號處理(第3版)
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    440-638
    【優惠價】
    275-399
    【作者】 韓紀慶、張磊、鄭鐵然 
    【所屬類別】 圖書  計算機/網絡  計算機理論 
    【出版社】清華大學出版社 
    【ISBN】9787302517603
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302517603
    叢書名:人工智能科學與技術叢書

    作者:韓紀慶、張磊、鄭鐵然
    出版社:清華大學出版社
    出版時間:2019年04月 


        
        
    "

    產品特色
    編輯推薦
    語音交互是實現人工智能的基石!全面論述語音信號的生成、處理、壓縮、傳輸、合成、識別與理解!清華、中科院、中國計算機學會、百度人工智能專家聯袂推薦!本書適合作為叢書語音信號處理、音頻處理等方向的工程技術人員,高校師生閱讀,參考! 
    內容簡介
    本書繫統地介紹語音信號處理的基礎、概念、原理、方法與應用。全書共分9章。第1章介紹語音信號處理及其發展過程; 第2章介紹語音信號的產生與人類聽覺的機理,傳統的線性語音產生模型,以及非線性語音產生模型; 第3章從語音信號的時域特征入手,引入時頻分析的思想,並進一步闡述時頻分析中短時傅裡葉變換和小波變換在語音信號特征分析中的應用,*後對廣泛使用的倒譜特征以及同態解卷積進行介紹; 第4章介紹語音信號的線性預測原理、解法、幾種推演方法以及線譜對分析法; 第5章介紹語音編碼的相關知識,包括語音的波形編碼、極低速率語音編碼技術,以及相關編碼器的性能指標和評測方法; 第6章介紹語音識別的基本內容,從基於矢量量化的識別技術到動態時間歸正的識別技術,從隱馬爾可夫模型技術到基於深度學習的語音識別技術,從孤立詞識別到連接詞識別及連續語音識別技術,再到關鍵詞檢出技術,*後還介紹新興起的語音識別應用技術,以及用於HMM繫統構建的HTK工具和用於深度學習繫統構建的Kaldi工具等; 第7章介紹說話人識別的基本內容,從基於GMMUBM的識別技術到基於支持向量機的識別技術,從基於聯合因子分析的識別技術到基於ivector的識別技術,以及近年來受到關注的基於深度學習的識別技術等; 第8章介紹頑健語音識別技術,從影響語音識別性能的環境變化因素分析開始,介紹噪聲環境下頑健語音識別技術,以及變異語音識別的技術; 第9章介紹語音合成的基本原理、線性預測合成、共振峰合成以及漢語按規則合成,以及基於HMM的合成技術等內容。
    本書可作為高等院校計算機應用、信號與信息處理、通信與電子繫統等專業及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。
    作者簡介
    韓紀慶  現任哈爾濱工業大學計算機科學與技術學院二級教授、學校長聘崗教授、博士生導師。兼任中國中文信息學會理事及語音處理專委會副主任、全國人機語音通訊學術會議常設機構委員會副主席、《中文信息學報》編委、《數據采集與處理》雜志編委。長期從事語音信號處理、音頻信息處理等領域的教學與科研工作。作為項目負責人,正在主持和已經完成“國家自然科學基金重點項目”2項、“面上項目”5項、“國家973計劃”課題1項、*“跨世紀優秀人纔培養計劃”基金1項及其他科研項目10餘項。獲省部級科技二等獎3項、三等獎2項。獲國家發明專利7項。已在國內外刊物和會議上發表論文200餘篇,並出版圖書5部。
    目錄
    目錄


    第1章緒論

    1.1語音信號處理的發展

    1.2語音信號處理的應用

    1.3語音信號處理的總體結構

    參考文獻目錄




    第1章緒論

    1.1語音信號處理的發展

    1.2語音信號處理的應用

    1.3語音信號處理的總體結構

    參考文獻

    第2章語音信號的聲學基礎及產生模型

    2.1語音信號的產生

    2.1.1語音的發音器官

    2.1.2語音的聲學特征

    2.1.3語音信號在時域和頻域的表示

    2.1.4漢語中語音的分類

    2.1.5漢語語音的韻律特性

    2.2語音信號的感知

    2.2.1聽覺繫統

    2.2.2聽覺特性

    2.2.3掩蔽效應

    2.3語音信號的線性產生模型

    2.3.1激勵模型

    2.3.2聲道模型

    2.3.3輻射模型

    2.4語音信號的非線性產生模型

    2.4.1調頻調幅模型的基本原理

    2.4.2Teager能量算子

    2.4.3能量分離算法

    2.4.4調頻調幅模型的應用

    參考文獻

    第3章語音信號的特征分析

    3.1語音信號數字化

    3.1.1語音信號的采樣和量化

    3.1.2短時加窗處理

    3.2語音信號的時域分析

    3.2.1短時能量分析

    3.2.2短時平均過零率

    3.2.3短時自相關函數和短時平均幅度差函數

    3.2.4端點檢測和語音分割

    3.3語音信號的頻域分析

    3.3.1濾波器組方法

    3.3.2傅裡葉頻譜分析

    3.4傳統傅裡葉變換缺點及時頻分析的思想

    3.4.1信號的時頻表示

    3.4.2不確定原理

    3.5Gabor變換

    3.6小波變換在語音信號分析中的應用

    3.6.1小波的數學表示及意義

    3.6.2小波分析特點

    3.6.3小波變換的多分辨分析

    3.6.4小波變換在語音處理中的應用

    3.7語音信號的同態解卷積

    3.7.1同態信號處理的基本原理

    3.7.2語音信號的復倒譜

    3.7.3避免相位卷繞的算法

    3.7.4基於聽覺特性的Mel頻率倒譜繫數

    3.8語音信號特征應用

    3.8.1基音周期估計

    3.8.2共振峰的估計

    參考文獻

    第4章語音信號的線性預測分析

    4.1線性預測的基本原理

    4.2線性預測方程組的解法

    4.2.1自相關法

    4.2.2協方差法

    4.2.3格型法

    4.2.4幾種求解線性預測方法的比較

    4.3線性預測的幾種推演參數

    4.3.1歸一化自相關函數

    4.3.2反射繫數

    4.3.3預測器多項式的根

    4.3.4LPC倒譜

    4.3.5全極點繫統的衝激響應及其自相關函數

    4.3.6預測誤差濾波器的衝激響應及其自相關函數

    4.3.7對數面積比繫數

    4.4線譜對分析法

    4.4.1線譜對分析的原理

    4.4.2線譜對參數的求解

    4.5感知線性預測PLP繫數

    參考文獻

    第5章語音編碼

    5.1波形編碼

    5.1.1均勻量化PCM

    5.1.2非均勻量化 PCM

    5.1.3自適應量化PCM

    5.1.4差分脈衝編碼

    5.1.5自適應差分脈衝編碼

    5.1.6增量調制和自適應增量調制

    5.1.7子帶編碼

    5.1.8自適應變換域編碼

    5.2參數編碼和混合編碼

    5.2.1參數編碼

    5.2.2基於全極點語音產生模型的混合編碼

    5.2.3基於正弦模型的混合編碼

    5.3極低速率語音編碼技術

    5.3.1400bps~1.2Kbps的聲碼器

    5.3.2識別合成型聲碼器

    5.4語音編碼器的性能指標和質量評測方法

    5.4.1編碼速率

    5.4.2頑健性

    5.4.3時延

    5.4.4計算復雜度和算法的可擴展性

    5.4.5語音質量及其評價方法

    5.5語音編碼國際標準

    5.6感知音頻編碼

    5.6.1感知編碼的一般框架

    5.6.2心理聲學模型

    5.6.3常用的感知編碼標準

    參考文獻

    第6章語音識別

    6.1概述

    6.2基於矢量量化的識別技術

    6.2.1Kmeans矢量量化算法

    6.2.2LBG算法

    6.3動態時間歸正的識別技術

    6.3.1DTW基本原理

    6.3.2模板訓練算法

    6.4隱馬爾可夫模型技術

    6.4.1HMM基本思想

    6.4.2HMM基本算法

    6.4.3HMM算法實現中的問題

    6.4.4關於HMM訓練的幾點考慮

    6.5連接詞語音識別技術

    6.5.1連接詞識別問題的一般描述

    6.5.2二階動態規劃算法

    6.5.3分層構築方法

    6.6大詞表連續語音識別中的聲學模型和語言學模型

    6.6.1聲學模型

    6.6.2統計語言學模型

    6.6.3統計語言學模型平滑技術

    6.6.4語言學模型自適應技術

    6.7大詞表連續語音識別中的解碼技術

    6.7.1圖的基本搜索算法

    6.7.2面向語音識別的搜索算法

    6.8大詞表連續語音識別後處理技術

    6.8.1語音識別中間結果的表示形式

    6.8.2錯誤處理

    6.8.3小字錯誤率解碼方法

    6.9基於HMM的自適應技術

    6.9.1基於Bayesian理論的自適應方法

    6.9.2基於變換的自適應方法

    6.10基於深度學習的語音識別技術

    6.10.1基於DNNHMM的語音識別技術

    6.10.2基於RNN的語音識別技術

    6.10.3端到端的語音識別技術

    6.11關鍵詞檢出技術

    6.11.1問題描述

    6.11.2關鍵詞檢出繫統的組成

    6.11.3垃圾模型建模方法

    6.11.4語音解碼器的設計

    6.11.5關鍵詞確認過程

    6.11.6關鍵詞檢出繫統性能優化

    6.12語音識別的應用技術

    6.12.1語音信息檢索

    6.12.2發音學習技術

    6.12.3基於語音的情感處理

    6.12.4網絡環境下的語音識別

    6.12.5嵌入式語音識別技術

    6.13HTK工具介紹

    6.13.1數據準備階段

    6.13.2模型訓練階段

    6.13.3識別階段

    6.14Kaldi工具介紹

    6.14.1Kaldi工具簡介

    6.14.2Kaldi工具安裝

    6.14.3數據準備

    6.14.4特征提取

    6.14.5模型訓練

    6.14.6性能評測

    參考文獻

    第7章說話人識別

    7.1概述

    7.2基於GMM與GMMUBM說話人識別

    7.2.1GMM的說話人識別

    7.2.2GMMUBM的說話人識別

    7.3基於SVM的說話人識別

    7.3.1SVM說話人識別

    7.3.2基於GMM均值超矢量的SVM說話人識別

    7.3.3基於GMM得分的SVM說話人識別

    7.4復雜信道下的說話人識別

    7.4.1特征映射

    7.4.2說話人模型合成

    7.4.3擾動屬性投影

    7.4.4聯合因子分析

    7.5基於ivector的說話人識別

    7.5.1基於GMMUBM的ivector說話人識別

    7.5.2基於DNN的ivector說話人識別

    7.6得分規整

    7.6.1零規整

    7.6.2測試規整

    7.6.3說話人自適應的測試規整

    7.6.4TZnorm

    7.6.5Hnorm

    7.6.6Cnorm

    參考文獻

    第8章頑健語音識別技術

    8.1概述

    8.2影響語音識別性能的環境變化因素

    8.3噪聲環境下的頑健語音識別技術

    8.3.1基於語音增強的方法

    8.3.2通道畸變的抑制方法

    8.3.3基於模型的補償方法

    8.4變異語音識別方法

    8.4.1變異語音的分析

    8.4.2變異語音的分類

    8.4.3變異語音的識別

    參考文獻

    第9章語音合成

    9.1語音合成的基本原理

    9.2參數合成方法

    9.2.1線性預測合成方法

    9.2.2共振峰合成方法

    9.3波形拼接合成技術

    9.3.1TDPSOLA算法

    9.3.2FDPSOLA算法

    9.4漢語按規則合成

    9.4.1韻律規則

    9.4.2多音節協同發音規則合成

    9.4.3輕聲音節規則合成

    9.4.4兒化音節的規則合成

    9.5基於HMM的參數化語音合成技術

    9.5.1基於HMM參數語音合成繫統的訓練

    9.5.2基於HMM參數語音合成繫統的合成階段

    參考文獻
    前言
    前言
    語音信號處理以語音為研究對像,涉及心理學、生理學、語言學、數字信號處理、模式識別、人工智能、機器學習等諸多研究領域,甚至還涉及人說話時的表情、手勢等體態語言信息。由於語音是人們日常生活中的主要交流手段,因此語音信號處理在現代信息社會中占有重要地位。
    語音信號處理的研究工作早可以追溯到19世紀70年代,在20世紀得到了長足的發展,並在20世紀90年代,隨著IBM、Microsoft、Apple、AT T、NTT等著名公司為語音識別的實用化開發投以巨資,掀起了語音信號處理技術的應用熱潮。進入21世紀,伴隨著以深度神經網絡為代表的深度學習理論的全面突破、以通用圖形處理器(GPU)為代表的硬件技術的迅猛發展,語音識別的性能得到顯著提高,從而迎來了語音信號處理技術的蓬勃發展。前言
    語音信號處理以語音為研究對像,涉及心理學、生理學、語言學、數字信號處理、模式識別、人工智能、機器學習等諸多研究領域,甚至還涉及人說話時的表情、手勢等體態語言信息。由於語音是人們日常生活中的主要交流手段,因此語音信號處理在現代信息社會中占有重要地位。
    語音信號處理的研究工作早可以追溯到19世紀70年代,在20世紀得到了長足的發展,並在20世紀90年代,隨著IBM、Microsoft、Apple、AT&T、NTT等著名公司為語音識別的實用化開發投以巨資,掀起了語音信號處理技術的應用熱潮。進入21世紀,伴隨著以深度神經網絡為代表的深度學習理論的全面突破、以通用圖形處理器(GPU)為代表的硬件技術的迅猛發展,語音識別的性能得到顯著提高,從而迎來了語音信號處理技術的蓬勃發展。
    目前在語音信號處理領域中不斷有新的技術湧現。本書再版的目的就是將這些新的技術融合到已有的相關理論與技術中。全書以語音信號處理過程的總體框架為線索,全面闡述語音信號的前端處理技術、語音編碼技術、語音識別和說話人識別技術,以及語音合成技術。相對於上一版,本書補充了基於深度學習的語音識別、基於ivector的說話人識別等本領域的前沿理論和技術,以利於讀者充分了解的學術發展動態,並能在學術思想上受到啟發。同時,書中也介紹了當前深度學習方法中廣泛采用的Kaldi工具的使用技巧,以幫助讀者掌握相關的實踐手段。
    本書涉及作者承擔的多項國家自然科學基金項目的部分研究成果,在內容上既注重基本理論的繫統性,又兼顧實用性和可讀性,可作為高等院校計算機應用、信號與信息處理、通信與電子繫統等專業及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。
    本書的第1、2、4章由韓紀慶編寫,第3、6、9章由張磊編寫,第5、7、8章由鄭鐵然編寫。韓紀慶負責全書的總體安排和審定。在新版增加的內容中,鄭鐵然在基於深度學習的語音識別部分、陳晨在說話人識別部分、史秋瑩在Kaldi工具部分的撰寫上作出了重要貢獻。鄭貴濱為書稿的完善做了大量工作,在此表示感謝!
    本書雖然是作者從事語音信號處理工作30年的理論與實踐的結晶,但因作者水平有限、時間倉促,缺點和錯誤在所難免,敬請讀者批評指正,提出寶貴意見。
    作者於哈爾濱工業大學2019年1月
    在線試讀
    第3章
    CHAPTER 3


    語音信號的特征分析

    前面討論了語言學、漢語語音學和信號模型等基礎知識。語音信號處理雖然包括語音通信、語音合成、語音識別等,但其前提是對語音信號的分析。隻有將語音信號分析表示成其本質特性的參數,纔有可能利用這些參數進行高效的語音通信,纔能建立用於語音合成的語音庫,也纔可能建立用於識別的模板或知識庫。而且,語音合成的音質好壞、語音識別率的高低,都取決於對語音信號分析的準確性和精度。例如,利用線性預測分析來進行語音合成,其先決條件是要先用線性預測方法分析語音庫,如果線性預測分析獲得的語音參數較好,則用此參數合成的語音音質就好。又如,利用帶通濾波器組法來進行語音識別,其先決條件是要弄清楚語音共振峰的幅值、個數、頻率變化範圍及其分布情況。因此,應先對語音信號進行特征分析,得到提高語音識別率的有用數據,並據此來設計語音識別繫統的硬件和軟件。
    國內外的經驗說明,語音分析的工作必須先於其他的語音信號處理工作。例如,20世紀40年代,貝爾實驗室的研究人員就對語音信號分析做了大量的、卓有成效的工作,這些成果推動了語音信號處理的發展。第3章
    CHAPTER 3


    語音信號的特征分析





    前面討論了語言學、漢語語音學和信號模型等基礎知識。語音信號處理雖然包括語音通信、語音合成、語音識別等,但其前提是對語音信號的分析。隻有將語音信號分析表示成其本質特性的參數,纔有可能利用這些參數進行高效的語音通信,纔能建立用於語音合成的語音庫,也纔可能建立用於識別的模板或知識庫。而且,語音合成的音質好壞、語音識別率的高低,都取決於對語音信號分析的準確性和精度。例如,利用線性預測分析來進行語音合成,其先決條件是要先用線性預測方法分析語音庫,如果線性預測分析獲得的語音參數較好,則用此參數合成的語音音質就好。又如,利用帶通濾波器組法來進行語音識別,其先決條件是要弄清楚語音共振峰的幅值、個數、頻率變化範圍及其分布情況。因此,應先對語音信號進行特征分析,得到提高語音識別率的有用數據,並據此來設計語音識別繫統的硬件和軟件。
    國內外的經驗說明,語音分析的工作必須先於其他的語音信號處理工作。例如,20世紀40年代,貝爾實驗室的研究人員就對語音信號分析做了大量的、卓有成效的工作,這些成果推動了語音信號處理的發展。
    根據所分析的參數不同,語音信號分析可分為時域、頻域、倒譜域等方法。進行語音信號分析時,先接觸到的、直觀的是它的時域波形。語音信號本身就是時域信號,因而時域分析是早使用且應用範圍廣的一種方法。時域分析具有簡單直觀、清晰易懂、運算量小、物理意義明確等優點,但更為有效的分析多是圍繞頻域進行的,因為語音中重要的感知特性反映在其功率譜中,而相位變化隻起著很小的作用。
    常用的頻域分析方法有帶通濾波器組方法、傅裡葉變換法和線性預測分析法等,其中線性預測方法將在第4章中具體介紹。頻譜分析具有如下優點: 時域波形較易隨外界環境變化,但語音信號的頻譜對外界環境變化具有一定的頑健性。另外,語音信號的頻譜具有非常明顯的聲學特性,利用頻域分析獲得的語音特征具有實際的物理意義,如共振峰參數、基音周期參數等。
    倒譜域是將對數功率譜進行反傅裡葉變換後得到的,它可以將聲道特性和激勵特性有效地分開,因此可以更好地揭示語音信號的本質特征。
    按照語音學的觀點,可將語音信號分析分為模型分析法和非模型分析法兩種。模型分析法是指依據語音信號產生的數學模型,來分析和提取表征這些模型的特征參數; 共振峰模型分析及線性預測分析即屬於這種方法。凡不進行模型化分析的其他方法都屬於非模型分析法,包括上面提到的時域分析法、頻域分析法及同態分析法等。
    貫穿於語音信號分析全過程的是“短時分析技術”。根據對語音信號的研究,其特性是隨時間而變化的,所以它是一個非穩態過程。但從另一方面看,雖然語音信號具有時變特性,但不同的語音是由人的口腔肌肉運動構成聲道的某種形狀而產生的響應,而這種肌肉運動頻率相對於語音頻率來說是緩慢的,因而在一個短時間範圍內,其特性基本保持不變,即相對穩定,所以可以將其看作是一個準穩態過程。基於這樣的考慮,對語音信號的分析和處理必須建立在“短時”的基礎上,即進行“短時分析”。將語音信號分為一段一段來分析,其中每一段稱為一“幀”(frame)。由於語音信號通常在10~30ms之內是保持相對平穩的,因而幀長一般取10~30ms。
    本章首先介紹語音信號的數字化處理,接著介紹語音信號的時域處理技術及頻域和倒譜域的相應處理。此外,還將介紹常見的倒譜特征、基音周期和共振峰參數的提取等。
    3.1語音信號數字化
    語音信號數字化之前,必須先進行防混疊濾波及防工頻干擾濾波。其中防混疊濾波指濾除高於1/2采樣頻率的信號成分或噪聲,使信號帶寬限制在某個範圍內; 否則,如果采樣率不滿足采樣定理,則會產生頻譜混疊,此時信號中的高頻成分將產生失真; 而工頻干擾指50Hz的電源干擾。由於防混疊和工頻干擾濾波器在一個集成塊中,實現起來很簡便,在這裡不再贅述。
    3.1.1語音信號的采樣和量化
    語音信號是時間和幅度都連續變化的一維模擬信號,要想在計算機中對它進行處理,就要先進行采樣和量化,將它變成時間和幅度都離散的數字信號。
    在語音信號處理中,需要將信號表示成可以處理的函數的形式。對於模擬信號xa(t),它表示函數值隨著連續時間變量t的變化趨勢。如果以一定的時間間隔T對這樣的連續信號取值,則連續信號xa(t)即變成離散信號x(n)=xa(nT),這個過程稱為采樣,其中兩個取樣點之間的間隔T稱為采樣周期,它的倒數Fs稱為采樣頻率。
    根據采樣定理,當采樣頻率大於信號頻率的兩倍時,在采樣過程中就不會丟失信息,並且可以用采樣後的信號重構原始信號。實際的信號常有一些低能量的頻譜分量超過采樣頻率的一半,如濁音的頻譜超過4kHz的分量比其峰值至少要低40dB; 而對於清音,即使超過8kHz,頻率分量也沒有顯著下降,因此語音信號所占的頻率範圍可以達到10kHz以上。雖然這樣,但對語音清晰度有明顯影響部分的頻率為5.7kHz左右。CCITT(國際電報電話咨詢委員會)提出的G.711標準建議采樣頻率為8kHz,但一般情況下這隻適合電話語音的情況,因為電話語音的頻率為60~3400Hz。在實際的語音信號處理中,采樣頻率一般為8~10kHz。有一些繫統為了實現更高質量的語音合成,或者使語音識別繫統得到更高的識別率,將可處理的語音信號擴展到7~9kHz,這時的采樣頻率一般為15~20kHz。 表31給出了采樣率對語音識別繫統性能的影響。


    表31不同采樣率對誤識率降低程度的影響



    采樣率
    相對誤識率的降低程度采樣率
    相對誤識率的降低程度

    8kHz基線繫統16kHz 10%
    11kHz 10%22kHz
    0%

    在表31中,將8kHz采樣率時的繫統作為基線繫統,當采樣率為11kHz時,繫統的誤識率有10%的降低; 繼續升高采樣率到16kHz時,繫統的誤識率與11kHz相比有10%的降低; 當采樣率繼續增加時,誤識率幾乎沒有降低。因此在一般的識別繫統中,采樣率選擇在16kHz。
    圖31的下半部分為一段模擬信號,其上半部分為對應的離散信號。可以看出,采樣後的信號在時間域上是離散的形式,但在幅度上還保持著連續的特點,所以要進行量化。量化的目的是將信號波形的幅度值離散化。一個量化器就是將整個信號的幅度值分成若干個有限的區間,並且把落入同一個區間的樣本點都用同一個幅度值表示,這個幅度值稱為量化值。量化方式有3種: 零記憶量化、分組量化和序列量化。零記憶量化是每次量化一個模擬采樣值,並對所有采樣點都使用相同的量化器特性。分組量化是從可能輸出組的離散集合中,選出一組輸出值,代表一組輸入的模擬采樣值。序列量化是在分組或非分組的基礎上,用一些鄰近采樣點的信息對采樣序列進行量化。

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部