出版時(shí)間:2013-1 出版社:電子工業(yè)出版社 作者:李曄 頁(yè)數(shù):345 字?jǐn)?shù):571000
Tag標(biāo)簽:無(wú)
內(nèi)容概要
本書全面、系統(tǒng)地闡述了數(shù)字語(yǔ)音編碼的相關(guān)技術(shù)。全書共15章,內(nèi)容包括:語(yǔ)音編碼概述和聲學(xué)基礎(chǔ),語(yǔ)音編碼中的數(shù)字分析和矢量量化,語(yǔ)音編碼的評(píng)價(jià)指標(biāo)和關(guān)聯(lián)技術(shù),語(yǔ)音信號(hào)的波形編碼、參數(shù)編碼和混合編碼,語(yǔ)音編碼領(lǐng)域的熱點(diǎn)問(wèn)題——低速率語(yǔ)音編碼、寬帶語(yǔ)音編碼、變速率語(yǔ)音編碼和嵌入式語(yǔ)音編碼,語(yǔ)音編碼系統(tǒng)的硬件實(shí)現(xiàn),以及語(yǔ)音編碼的國(guó)內(nèi)外標(biāo)準(zhǔn)。
書籍目錄
第1章 緒論
1.1 概述
1.2 語(yǔ)音編碼的應(yīng)用
1.3 語(yǔ)音編碼的分類
1.3.1 按編碼方法分類
1.3.2 按編碼速率分類
1.3.3 按編碼語(yǔ)音帶寬分類
1.3.4 按編碼信號(hào)所在域分類
1.4 語(yǔ)音編碼的硬件與系統(tǒng)
1.5 語(yǔ)音編碼的發(fā)展趨勢(shì)
1.6 全書的組織
參考文獻(xiàn)
第2章 語(yǔ)音編碼的聲學(xué)基礎(chǔ)
2.1 語(yǔ)音信號(hào)的時(shí)域波形
2.2 語(yǔ)音的產(chǎn)生機(jī)理與模型
2.2.1 肺與喉
2.2.2 聲道
2.2.3 語(yǔ)音信號(hào)的產(chǎn)生模型
2.3 語(yǔ)音信號(hào)的聲學(xué)特性
2.3.1 語(yǔ)音信號(hào)的分類
2.3.2 基音與四聲
2.4 人耳聽(tīng)覺(jué)特性
2.4.1 正常人的聽(tīng)域與聽(tīng)閾
2.4.2 響度級(jí)(Loudness Level)和響度(Loudness)
2.4.3 音調(diào)
2.4.4 掩蔽效應(yīng)(Masking Effect)
2.4.5 言語(yǔ)聽(tīng)覺(jué)
參考文獻(xiàn)
第3章 語(yǔ)音編碼中的數(shù)字分析技術(shù)
3.1 短時(shí)分析技術(shù)基礎(chǔ)
3.1.1 預(yù)濾波、采樣、A/D變換
3.1.2 存儲(chǔ)和加窗
3.2 短時(shí)能量、短時(shí)平均幅度和短時(shí)過(guò)零率
3.3 短時(shí)自相關(guān)函數(shù)和短時(shí)頻譜
3.4 短時(shí)基音周期分析
3.5 語(yǔ)譜圖分析
3.6 線性預(yù)測(cè)分析
3.6.1 線性預(yù)測(cè)分析的基本概念
3.6.2 線性預(yù)測(cè)分析的求解
3.6.3 德賓(Durbin)遞推算法
3.6.4 LPC模型階數(shù)P和激勵(lì)增益G的確定
3.7 各種LPC參數(shù)以及它們之間的關(guān)系
參考文獻(xiàn)
第4章 語(yǔ)音編碼中的矢量量化技術(shù)
4.1 概述
4.2 矢量量化的基本原理
4.2.1 矢量量化的定義
4.2.2 矢量量化的評(píng)價(jià)指標(biāo)
4.2.3 矢量量化的關(guān)鍵技術(shù)
4.3 矢量量化器
4.3.1 窮盡搜索矢量量化器
4.3.2 多級(jí)矢量量化器
4.3.3 分裂矢量量化器
4.3.4 分類矢量量化器
4.3.5 形狀-增益矢量量化器
4.3.6 預(yù)測(cè)矢量量化器
4.3.7 有限狀態(tài)矢量量化器
4.4 矢量量化的碼本設(shè)計(jì)
4.4.1 LBG算法
4.4.2 模擬退火碼本設(shè)計(jì)算法
4.4.3 其他碼本設(shè)計(jì)算法
4.5 矢量量化的碼字搜索
4.5.1 部分失真搜索算法
4.5.2 基于不等式的快速搜索算法
4.5.3 帶有時(shí)變加權(quán)的快速搜索算法
4.6 矢量量化的碼字索引分配
4.6.1 基于BSA的碼字分配算法
4.6.2 基于模擬退火的碼字分配算法
4.7 LSF參數(shù)的矢量量化
4.7.1 P-MSMQ算法
4.7.2 帶有級(jí)間預(yù)測(cè)的多級(jí)矩陣量化算法
4.7.3 帶有級(jí)間預(yù)測(cè)的多級(jí)碼本聯(lián)合優(yōu)化
4.8 多參數(shù)多模式碼本尺寸聯(lián)合調(diào)整
4.8.1 矢量參數(shù)多模式量化
4.8.2 參與碼本尺寸聯(lián)合調(diào)整的參數(shù)
參考文獻(xiàn)
第5章 語(yǔ)音編碼的評(píng)價(jià)指標(biāo)
5.1 評(píng)價(jià)語(yǔ)音編碼的考慮要素
5.1.1 說(shuō)話人和語(yǔ)種
5.1.2 信號(hào)能量
5.1.3 背景噪聲
5.1.4 多次轉(zhuǎn)接
5.1.5 信道誤碼
5.1.6 非語(yǔ)音信號(hào)
5.2 語(yǔ)音編碼的主觀測(cè)量
5.2.1 音質(zhì)評(píng)價(jià)方法
5.2.2 可懂度評(píng)價(jià)方法
5.3 語(yǔ)音編碼的客觀測(cè)量
5.3.1 信噪比與譜失真
5.3.2 PSQM與PESQ
5.4 語(yǔ)音編碼的復(fù)雜度和時(shí)延
參考文獻(xiàn)
第6章 語(yǔ)音信號(hào)的波形編碼
6.1 語(yǔ)音信號(hào)的標(biāo)量量化
6.1.1 均勻量化
6.1.2 非均勻量化
6.1.3 自適應(yīng)量化
6.2 自適應(yīng)差分脈沖編碼
6.2.1 DPCM的工作原理
6.2.2 自適應(yīng)預(yù)測(cè)
6.2.3 CCITT G.721高質(zhì)量32 kb/s ADPCM
6.2.4 鑲嵌式ADPCM
6.3 變換域編碼
6.3.1 概述
6.3.2 最佳正交變換——KLT
6.3.3 離散余弦變換(DCT)
6.3.4 自適應(yīng)比特分配
參考文獻(xiàn)
第7章 語(yǔ)音信號(hào)的參數(shù)編碼
7.1 線性預(yù)測(cè)編碼的基本原理
7.2 LPC-10聲碼器
7.3 LPC-10e聲碼器
7.3.1 激勵(lì)源的改善
7.3.2 基音提取方法的改進(jìn)
7.3.3 聲道濾波器參數(shù)量化的改進(jìn)
7.3.4 LSF參數(shù)的矢量量化
7.4 本章小結(jié)
參考文獻(xiàn)
第8章 語(yǔ)音信號(hào)的混合編碼
8.1 混合編碼的基本原理
8.1.1 合成分析法ABS(Analysis By Synthesis)
8.1.2 感覺(jué)加權(quán)濾波器
8.1.3 中、低速率混合編碼
8.2 多脈沖及規(guī)則脈沖激勵(lì)線性預(yù)測(cè)聲碼器(MPLPC及RPE-LPC)
8.2.1 多脈沖線性預(yù)測(cè)聲碼器
8.2.2 規(guī)則脈沖激勵(lì)線性預(yù)測(cè)聲碼器(RPE-LPC)
8.3 碼激勵(lì)線性預(yù)測(cè)聲碼器(CELP)
8.3.1 CELP編碼算法
8.3.2 CELP碼本搜索算法
8.3.3 美國(guó)政府標(biāo)準(zhǔn)4.8 kb/s CELP聲碼器FED-STD-1016
8.3.4 美國(guó)EIA/TIA 8 kb/s VSELP聲碼器
8.3.5 16 kb/s短延時(shí)碼激勵(lì)線性預(yù)測(cè)(LD-CELP)聲碼器
參考文獻(xiàn)
第9章 低速率語(yǔ)音編碼
9.1 波形插值編碼
9.1.1 波形插值編碼原理
9.1.2 特征波形的提取
9.1.3 特征波形的描述
9.1.4 特征波形的對(duì)齊
9.1.5 特征波形的量化
9.1.6 特征波形的重建和線性預(yù)測(cè)合成
9.2 正弦變換編碼
9.2.1 STC編碼參數(shù)的提取
9.2.2 STC編碼合成算法
9.2.3 正弦變換的低速率編碼模型
9.3 混合激勵(lì)線性預(yù)測(cè)編碼
9.3.1 MELP編碼器原理
9.3.2 MELP編碼參數(shù)量化
9.3.3 MELP解碼器原理
9.3.4 MELPe算法
9.4 正弦激勵(lì)編碼
9.4.1 SELP編碼器原理
9.4.2 SELP模型參數(shù)分析算法
9.4.3 SELP解碼器原理
9.5 多帶激勵(lì)編碼
9.5.1 多帶激勵(lì)語(yǔ)音模型
9.5.2 多帶激勵(lì)語(yǔ)音模型參數(shù)的提取
9.5.3 多帶激勵(lì)語(yǔ)音合成
9.6 極低速率語(yǔ)音編碼
9.6.1 速率在400~1 200 b/s左右的編碼技術(shù)
9.6.2 速率在150~300 b/s左右的編碼技術(shù)
9.7 低速率語(yǔ)音編碼展望
參考文獻(xiàn)
第10章 寬帶語(yǔ)音編碼
10.1 概述
10.2 子帶編碼
10.2.1 子帶編碼工作原理
10.2.2 子帶編碼的比特分配
10.2.3 整數(shù)帶濾波器組
10.2.4 正交鏡像濾波器組
10.3 G.722寬帶語(yǔ)音編碼
10.3.1 G.722編碼器原理
10.3.2 G.722解碼器原理
10.4 頻帶擴(kuò)展(BWE)技術(shù)
10.5 聯(lián)合語(yǔ)音音頻編碼(USAC)
10.5.1 USAC的組合型算法
10.5.2 USAC的統(tǒng)一型算法
10.6 寬帶語(yǔ)音編碼展望
參考文獻(xiàn)
第11章 變速率語(yǔ)音編碼
11.1 變速率語(yǔ)音編碼的發(fā)展現(xiàn)狀
11.2 變速率語(yǔ)音編碼的相關(guān)技術(shù)
11.2.1 語(yǔ)音端點(diǎn)檢測(cè)技術(shù)(VAD)
11.2.2 速率判決技術(shù)
11.2.3 差錯(cuò)隱藏技術(shù)
11.2.4 舒適噪聲生成技術(shù)
11.3 AMR變速率語(yǔ)音編碼
11.3.1 AMR編碼器原理
11.3.2 AMR參數(shù)表示及量化
11.3.3 AMR解碼器原理
11.3.4 AMR幀結(jié)構(gòu)
11.4 變速率語(yǔ)音編碼展望
參考文獻(xiàn)
第12章 嵌入式語(yǔ)音編碼
12.1 概述
12.2 嵌入式語(yǔ)音編碼的發(fā)展現(xiàn)狀
12.3 嵌入式語(yǔ)音編碼的有關(guān)理論
12.3.1 設(shè)計(jì)理念與編碼器的最優(yōu)性
12.3.2 分層矢量量化
12.4 嵌入式語(yǔ)音編碼的實(shí)現(xiàn)
12.4.1 嵌入式DPCM編碼
12.4.2 嵌入式CELP編碼
12.4.3 現(xiàn)有的CELP編碼的嵌入式擴(kuò)展
12.4.4 嵌入式參數(shù)量化
12.5 嵌入式語(yǔ)音編碼標(biāo)準(zhǔn)G.729.1
12.5.1 G.
編輯推薦
《數(shù)字語(yǔ)音編碼技術(shù)》全面、系統(tǒng)地闡述了數(shù)字語(yǔ)音編碼的相關(guān)技術(shù)。本書可供從事語(yǔ)音編碼和語(yǔ)音通信的科技研發(fā)人員和工程人員,以及電子通信類及相關(guān)專業(yè)的高校教師、高年級(jí)本科生和研究生參考閱讀。
圖書封面
圖書標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
數(shù)字語(yǔ)音編碼技術(shù) PDF格式下載