出版時間:2012-7 出版社:電子工業(yè) 作者:張雪英 頁數(shù):247
Tag標(biāo)簽:無
內(nèi)容概要
本書系統(tǒng)地闡述了語音信號處理的原理、方法、技術(shù)和應(yīng)用,同時給出了部分內(nèi)容對應(yīng)的MATLAB仿真源程序。全書共12章,第1章至第7章是基本理論部分,包括語音信號的數(shù)字模型、語音信號的短時時域分析和頻域分析、語音信號的同態(tài)處理、語音信號線性預(yù)測分析和矢量量化;第8章至第12章是應(yīng)用部分,包括語音編碼、語音合成、語音識別、語音增強和語音處理的實時實現(xiàn)。本書內(nèi)容全面,重點突出,原理闡述深入淺出,注重理論與實際應(yīng)用的結(jié)合,可讀性強。 本書可作為高等院校通信工程、電子信息工程、自動控制、計算機技術(shù)與應(yīng)用等專業(yè)高年級本科生相關(guān)課程的教材,也可供從事語音信號處理研究的研究生和科研人員參考。
書籍目錄
第1章 緒論 1.1 概述 1.2 語音信號處理的發(fā)展 1.2.1 語音合成 1.2.2 語音編碼 1.2.3 語音識別 1.3 語音信號處理的應(yīng)用及新方向 1.4 語音信號處理過程的總體結(jié)構(gòu) 1.5 MATLAB在數(shù)字語音信號處理中的應(yīng)用 第2章 語音信號的數(shù)字模型 2.1 概述 2.2 語音的發(fā)聲機理 2.2.1 人的發(fā)聲器官 2.2.2 語音生成 2.3 語音的聽覺機理 2.3.1 聽覺器官 2.3.2 耳蝸的信號處理機制 2.3.3 語音信號聽覺模型 2.4 語音的感知 2.4.1 幾個概念 2.4.2 掩蔽效應(yīng) 2.4.3 臨界帶寬與頻率群 2.5 語音信號模型 2.5.1 激勵模型 2.5.2 聲道模型 2.5.3 輻射模型 2.6 語音信號數(shù)字模型 2.6.1 數(shù)字模型 2.6.2 模型局限性 第3章 語音信號的短時時域分析 3.1 概述 3.2 語音信號的預(yù)處理 3.2.1 語音信號的預(yù)加重處理 3.2.2 語音信號的加窗處理 3.3 短時平均能量 3.4 短時平均幅度函數(shù) 3.5 短時平均過零率 3.6 短時自相關(guān)分析 3.6.1 短時自相關(guān)函數(shù) 3.6.2 語音信號的短時自相關(guān)函數(shù) 3.6.3 修正的短時自相關(guān)函數(shù) 3.6.4 短時平均幅度差函數(shù) 3.7 基于能量和過零率的語音端點檢測 3.8 基音周期估值 3.8.1 基于短時自相關(guān)法的基音周期估值 3.8.2 基于短時平均幅度差函數(shù)AMDF法的基音周期估值 3.8.3 基音周期估值的后處理 3.8.4 基音周期估值后處理的MATLAB實現(xiàn) 第4章 語音信號短時頻域分析 4.1 概述 4.2 傅里葉變換的解釋 4.3 濾波器的解釋 4.4 短時譜的時域及頻域采樣率 4.5 短時綜合的濾波器組相加法 4.5.1 短時綜合的濾波器組相加法原理 4.5.2 短時綜合的濾波器組相加法的MATLAB程序?qū)崿F(xiàn) 4.5.3 短時綜合的疊接相加法原理及MATLAB程序?qū)崿F(xiàn) 第5章 語音信號的同態(tài)處理 5.1 概述 5.2 疊加原理和廣義疊加原理 5.3 卷積同態(tài)系統(tǒng) 5.4 復(fù)倒譜和倒譜 5.4.1 定義 5.4.2 復(fù)倒譜的性質(zhì) 5.5 復(fù)倒譜的幾種計算方法 5.5.1 最小相位信號法 5.5.2 遞歸法 5.5.3 倒譜的MATLAB實現(xiàn) 5.6 語音的倒譜分析及應(yīng)用 5.6.1 語音的倒譜分析原理 5.6.2 語音的倒譜應(yīng)用 第6章 語音信號線性預(yù)測分析 6.1 概述 6.2 LPC的基本原理 6.3 LPC和語音信號模型的關(guān)系 6.4 LPC方程的自相關(guān)解法及其MATLAB實現(xiàn) 6.5 模型增益G的確定 6.6 線譜對LSP分析 6.6.1 LSP的定義和特點 6.6.2 LPC參數(shù)到LSP參數(shù)的轉(zhuǎn)換及MATLAB實現(xiàn) 6.6.3 LSP參數(shù)到LPC參數(shù)的轉(zhuǎn)換及MATLAB實現(xiàn) 6.7 導(dǎo)抗譜對ISP分析 6.7.1 ISP的定義和特點 6.7.2 LPC與ISP參數(shù)間的轉(zhuǎn)換及MATLAB實現(xiàn) 6.8 LPC導(dǎo)出的其他語音參數(shù) 6.8.1 反射系數(shù) 6.8.2 對數(shù)面積比系數(shù)LAR 6.8.3 LPC倒譜及其MATLAB實現(xiàn) 6.9 LPC分析的頻域解釋 6.9.1 最小預(yù)測誤差的頻域解釋 6.9.2 LPC譜估計 第7章 矢量量化 7.1 概述 7.2 矢量量化基本原理 7.2.1 矢量量化的定義 7.2.2 失真測度 7.2.3 矢量量化器 7.3 最佳矢量量化器 7.4 矢量量化器的設(shè)計算法及MATLAB實現(xiàn) 7.4.1 LBG算法 7.4.2 初始碼書的選定與空胞腔的處理 7.4.3 已知訓(xùn)練序列的LBG算法的MATLAB實現(xiàn) 7.5 降低復(fù)雜度的矢量量化系統(tǒng) 7.5.1 樹形搜索矢量量化器 7.5.2 多級矢量量化器 7.5.3 波形/增益矢量量化器 7.5.4 分離均值矢量量化器 7.5.5 有記憶的矢量量化 第8章 語音編碼 8.1 概述 8.2 語音編碼的分類及特性 8.2.1 波形編碼 8.2.2 參數(shù)編碼 8.2.3 混合編碼 8.2.4 語音壓縮編碼的依據(jù) 8.3 語音編碼性能的評價指標(biāo) 8.3.1 編碼速率 8.3.2 編碼質(zhì)量 8.3.3 編解碼延時 8.3.4 算法復(fù)雜度 8.4 語音信號波形編碼 8.4.1 脈沖編碼調(diào)制PCM 8.4.2 自適應(yīng)預(yù)測編碼APC 8.4.3 自適應(yīng)差分脈沖編碼調(diào)制 8.5 語音信號參數(shù)編碼 8.5.1 LPC聲碼器原理 8.5.2 LPC?10編碼器 8.6 語音信號混合編碼 8.6.1 合成分析技術(shù)和感覺加權(quán)濾波器 8.6.2 激勵模型的改進(jìn) 8.6.3 G.728語音編碼標(biāo)準(zhǔn)簡介 8.7 語音信號寬帶變速率編碼 第9章 語音合成 9.1 概述 9.2 語音合成的原理及分類 9.2.1 波形合成法 9.2.2 參數(shù)合成法 9.2.3 規(guī)則合成法 9.3 共振峰合成法 9.3.1 級聯(lián)型共振峰模型 9.3.2 并聯(lián)型共振峰模型 9.3.3 混合型共振峰模型 9.4 線性預(yù)測參數(shù)合成法 9.5 基音同步疊加法 9.5.1 基音同步疊加PSOLA算法原理 9.5.2 基音同步疊加PSOLA算法實現(xiàn)步驟 9.6 文語轉(zhuǎn)換系統(tǒng) 9.6.1 文語轉(zhuǎn)換系統(tǒng)的組成 9.6.2 漢語按規(guī)則合成 第10章 語音識別 10.1 概述 10.1.1 預(yù)處理 10.1.2 語音識別特征提取 10.1.3 語音識別方法 10.2 HMM基本原理及在語音識別中的應(yīng)用 10.2.1 隱馬爾可夫模型 10.2.2 隱馬爾可夫模型的三個基本問題 10.2.3 隱馬爾可夫模型用于語音識別 第11章 語音增強 11.1 概述 11.2 語音感知特性和噪聲特性 11.2.1 語音特性 11.2.2 人耳感知特性 11.2.3 噪聲特性 11.3 語音增強算法 11.3.1 參數(shù)方法 11.3.2 非參數(shù)方法 11.3.3 統(tǒng)計方法 11.3.4 其他方法 11.3.5 譜減法語音增強的仿真實現(xiàn) 第12章 語音處理的實時實現(xiàn) 12.1 概述 12.2 可編程DSP芯片應(yīng)用基礎(chǔ) 12.2.1 DSP的發(fā)展歷程 12.2.2 DSP芯片的特點 12.2.3 DSP芯片的分類 12.2.4 DSP芯片的基本結(jié)構(gòu) 12.2.5 常用DSP芯片簡介 12.2.6 DSP芯片的應(yīng)用 12.3 基于DSP的語音處理系統(tǒng) 12.3.1 基于DSP的實時語音處理系統(tǒng)的構(gòu)成 12.3.2 基于DSP的語音處理系統(tǒng)的特點 12.3.3 基于DSP的語音處理系統(tǒng)的設(shè)計過程 12.4 DSP CCS集成開發(fā)環(huán)境 12.4.1 DSP的開發(fā)工具 12.4.2 CCS概述 12.4.3 CCS的構(gòu)成 12.5 基于TMS320C5409的實時語音識別系統(tǒng) 12.5.1 硬件介紹 12.5.2 軟件設(shè)計 12.5.3 獨立系統(tǒng)形成 附錄A 專業(yè)術(shù)語縮寫英漢對照表 參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁: 插圖: 隨著計算機及數(shù)字通信技術(shù)的高速發(fā)展,人類之間交流的信息日益豐富,包括語音、文本、圖像、視頻等。這些信息變換成信號后,必須通過一定的系統(tǒng)進(jìn)行傳輸或加工處理。數(shù)字通信系統(tǒng)以其抗干擾能力強,保密性好,便于傳輸、存儲、交換和處理等優(yōu)點得到廣泛應(yīng)用,但數(shù)字信號的數(shù)據(jù)量通常很大,給存儲器的存儲容量、通信信道的帶寬及計算機的處理速度帶來壓力,因此必須對其量化壓縮。量化可以分為兩大類:一類是標(biāo)量量化,另一類是矢量量化VQ。標(biāo)量量化是把抽樣后的信號值逐個進(jìn)行量化,而矢量量化是先將k(k≥2)個抽樣值形成k維空間Rk中的一個矢量,然后將此矢量進(jìn)行量化,并設(shè)法使其失真或量化噪聲最小,它可以極大地降低數(shù)碼率,優(yōu)于標(biāo)量量化。各種數(shù)據(jù)都可以用矢量表示,直接對矢量進(jìn)行量化,可以方便地對數(shù)據(jù)進(jìn)行壓縮。矢量量化屬于不可逆壓縮方法,能夠有效地利用矢量中各分量間相互關(guān)聯(lián)的性質(zhì)(線性依賴性、非線性依賴性、概率密度函數(shù)的形狀及矢量維數(shù))以消除冗余度,具備比特率低、解碼簡單、失真較小的優(yōu)點。矢量量化壓縮技術(shù)不但廣泛應(yīng)用于圖像和語音壓縮編碼等傳統(tǒng)領(lǐng)域,而且在移動通信、語音識別、文獻(xiàn)檢索及數(shù)據(jù)庫檢索等領(lǐng)域得到越來越廣泛的應(yīng)用。 矢量量化的理論基礎(chǔ)是香農(nóng)的率—失真理論。
編輯推薦
《電子信息科學(xué)與工程類專業(yè)電子信息與電氣學(xué)科規(guī)劃教材:數(shù)字語音處理及MATLAB仿真》主要以高年級本科生和初次學(xué)習(xí)語音信號處理知識的研究生為讀者對象,注重語音信號處理基礎(chǔ)知識及主要應(yīng)用的描述,同時對本領(lǐng)域的最新成果也有簡單介紹。全書共12章,第1章是緒論;第2章是語音信號的數(shù)字模型;第3章是語音信號的短時時域分析;第4章是語音信號短時頻域分析;第5章是語音信號的同態(tài)處理;第6章是語音信號線性預(yù)測分析;第7章是矢量量化;第8章是語音編碼;第9章是語音合成;第10章是語音識別;第11章是語音增強;第12章是語音處理的實時實現(xiàn)。附錄部分是本書中出現(xiàn)過的專業(yè)名詞縮寫及中英文對照,供大家學(xué)習(xí)時參考。本書第1章至第7章屬于基本理論部分,所附的MATLAB程序較多,第8章至第12章是語音信號處理技術(shù)的應(yīng)用,這方面的程序一般都比較長,且有一定難度,所以附帶的程序較少,且都是相對簡單的??梢哉f,本書是一本關(guān)于語音信號處理的入門實踐教材,在學(xué)習(xí)和掌握本書內(nèi)容的基礎(chǔ)上,再進(jìn)行本專業(yè)更深層次的學(xué)習(xí)是合適的。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載