數(shù)字語音編碼技術(shù)

出版時間:2013-1  出版社:電子工業(yè)出版社  作者:李曄  頁數(shù):345  字數(shù):571000  
Tag標簽:無  

內(nèi)容概要

  本書全面、系統(tǒng)地闡述了數(shù)字語音編碼的相關(guān)技術(shù)。全書共15章,內(nèi)容包括:語音編碼概述和聲學(xué)基礎(chǔ),語音編碼中的數(shù)字分析和矢量量化,語音編碼的評價指標和關(guān)聯(lián)技術(shù),語音信號的波形編碼、參數(shù)編碼和混合編碼,語音編碼領(lǐng)域的熱點問題——低速率語音編碼、寬帶語音編碼、變速率語音編碼和嵌入式語音編碼,語音編碼系統(tǒng)的硬件實現(xiàn),以及語音編碼的國內(nèi)外標準。

書籍目錄

第1章 緒論
1.1 概述
1.2 語音編碼的應(yīng)用
1.3 語音編碼的分類
1.3.1 按編碼方法分類
1.3.2 按編碼速率分類
1.3.3 按編碼語音帶寬分類
1.3.4 按編碼信號所在域分類
1.4 語音編碼的硬件與系統(tǒng)
1.5 語音編碼的發(fā)展趨勢
1.6 全書的組織
參考文獻
第2章 語音編碼的聲學(xué)基礎(chǔ)
2.1 語音信號的時域波形
2.2 語音的產(chǎn)生機理與模型
2.2.1 肺與喉
2.2.2 聲道
2.2.3 語音信號的產(chǎn)生模型
2.3 語音信號的聲學(xué)特性
2.3.1 語音信號的分類
2.3.2 基音與四聲
2.4 人耳聽覺特性
2.4.1 正常人的聽域與聽閾
2.4.2 響度級(Loudness Level)和響度(Loudness)
2.4.3 音調(diào)
2.4.4 掩蔽效應(yīng)(Masking Effect)
2.4.5 言語聽覺
參考文獻
第3章 語音編碼中的數(shù)字分析技術(shù)
3.1 短時分析技術(shù)基礎(chǔ)
3.1.1 預(yù)濾波、采樣、A/D變換
3.1.2 存儲和加窗
3.2 短時能量、短時平均幅度和短時過零率
3.3 短時自相關(guān)函數(shù)和短時頻譜
3.4 短時基音周期分析
3.5 語譜圖分析
3.6 線性預(yù)測分析
3.6.1 線性預(yù)測分析的基本概念
3.6.2 線性預(yù)測分析的求解
3.6.3 德賓(Durbin)遞推算法
3.6.4 LPC模型階數(shù)P和激勵增益G的確定
3.7 各種LPC參數(shù)以及它們之間的關(guān)系
參考文獻
第4章 語音編碼中的矢量量化技術(shù)
4.1 概述
4.2 矢量量化的基本原理
4.2.1 矢量量化的定義
4.2.2 矢量量化的評價指標
4.2.3 矢量量化的關(guān)鍵技術(shù)
4.3 矢量量化器
4.3.1 窮盡搜索矢量量化器
4.3.2 多級矢量量化器
4.3.3 分裂矢量量化器
4.3.4 分類矢量量化器
4.3.5 形狀-增益矢量量化器
4.3.6 預(yù)測矢量量化器
4.3.7 有限狀態(tài)矢量量化器
4.4 矢量量化的碼本設(shè)計
4.4.1 LBG算法
4.4.2 模擬退火碼本設(shè)計算法
4.4.3 其他碼本設(shè)計算法
4.5 矢量量化的碼字搜索
4.5.1 部分失真搜索算法
4.5.2 基于不等式的快速搜索算法
4.5.3 帶有時變加權(quán)的快速搜索算法
4.6 矢量量化的碼字索引分配
4.6.1 基于BSA的碼字分配算法
4.6.2 基于模擬退火的碼字分配算法
4.7 LSF參數(shù)的矢量量化
4.7.1 P-MSMQ算法
4.7.2 帶有級間預(yù)測的多級矩陣量化算法
4.7.3 帶有級間預(yù)測的多級碼本聯(lián)合優(yōu)化
4.8 多參數(shù)多模式碼本尺寸聯(lián)合調(diào)整
4.8.1 矢量參數(shù)多模式量化
4.8.2 參與碼本尺寸聯(lián)合調(diào)整的參數(shù)
參考文獻
第5章 語音編碼的評價指標
5.1 評價語音編碼的考慮要素
5.1.1 說話人和語種
5.1.2 信號能量
5.1.3 背景噪聲
5.1.4 多次轉(zhuǎn)接
5.1.5 信道誤碼
5.1.6 非語音信號
5.2 語音編碼的主觀測量
5.2.1 音質(zhì)評價方法
5.2.2 可懂度評價方法
5.3 語音編碼的客觀測量
5.3.1 信噪比與譜失真
5.3.2 PSQM與PESQ
5.4 語音編碼的復(fù)雜度和時延
參考文獻
第6章 語音信號的波形編碼
6.1 語音信號的標量量化
6.1.1 均勻量化
6.1.2 非均勻量化
6.1.3 自適應(yīng)量化
6.2 自適應(yīng)差分脈沖編碼
6.2.1 DPCM的工作原理
6.2.2 自適應(yīng)預(yù)測
6.2.3 CCITT G.721高質(zhì)量32 kb/s ADPCM
6.2.4 鑲嵌式ADPCM
6.3 變換域編碼
6.3.1 概述
6.3.2 最佳正交變換——KLT
6.3.3 離散余弦變換(DCT)
6.3.4 自適應(yīng)比特分配
參考文獻
第7章 語音信號的參數(shù)編碼
7.1 線性預(yù)測編碼的基本原理
7.2 LPC-10聲碼器
7.3 LPC-10e聲碼器
7.3.1 激勵源的改善
7.3.2 基音提取方法的改進
7.3.3 聲道濾波器參數(shù)量化的改進
7.3.4 LSF參數(shù)的矢量量化
7.4 本章小結(jié)
參考文獻
第8章 語音信號的混合編碼
8.1 混合編碼的基本原理
8.1.1 合成分析法ABS(Analysis By Synthesis)
8.1.2 感覺加權(quán)濾波器
8.1.3 中、低速率混合編碼
8.2 多脈沖及規(guī)則脈沖激勵線性預(yù)測聲碼器(MPLPC及RPE-LPC)
8.2.1 多脈沖線性預(yù)測聲碼器
8.2.2 規(guī)則脈沖激勵線性預(yù)測聲碼器(RPE-LPC)
8.3 碼激勵線性預(yù)測聲碼器(CELP)
8.3.1 CELP編碼算法
8.3.2 CELP碼本搜索算法
8.3.3 美國政府標準4.8 kb/s CELP聲碼器FED-STD-1016
8.3.4 美國EIA/TIA 8 kb/s VSELP聲碼器
8.3.5 16 kb/s短延時碼激勵線性預(yù)測(LD-CELP)聲碼器
參考文獻
第9章 低速率語音編碼
9.1 波形插值編碼
9.1.1 波形插值編碼原理
9.1.2 特征波形的提取
9.1.3 特征波形的描述
9.1.4 特征波形的對齊
9.1.5 特征波形的量化
9.1.6 特征波形的重建和線性預(yù)測合成
9.2 正弦變換編碼
9.2.1 STC編碼參數(shù)的提取
9.2.2 STC編碼合成算法
9.2.3 正弦變換的低速率編碼模型
9.3 混合激勵線性預(yù)測編碼
9.3.1 MELP編碼器原理
9.3.2 MELP編碼參數(shù)量化
9.3.3 MELP解碼器原理
9.3.4 MELPe算法
9.4 正弦激勵編碼
9.4.1 SELP編碼器原理
9.4.2 SELP模型參數(shù)分析算法
9.4.3 SELP解碼器原理
9.5 多帶激勵編碼
9.5.1 多帶激勵語音模型
9.5.2 多帶激勵語音模型參數(shù)的提取
9.5.3 多帶激勵語音合成
9.6 極低速率語音編碼
9.6.1 速率在400~1 200 b/s左右的編碼技術(shù)
9.6.2 速率在150~300 b/s左右的編碼技術(shù)
9.7 低速率語音編碼展望
參考文獻
第10章 寬帶語音編碼
10.1 概述
10.2 子帶編碼
10.2.1 子帶編碼工作原理
10.2.2 子帶編碼的比特分配
10.2.3 整數(shù)帶濾波器組
10.2.4 正交鏡像濾波器組
10.3 G.722寬帶語音編碼
10.3.1 G.722編碼器原理
10.3.2 G.722解碼器原理
10.4 頻帶擴展(BWE)技術(shù)
10.5 聯(lián)合語音音頻編碼(USAC)
10.5.1 USAC的組合型算法
10.5.2 USAC的統(tǒng)一型算法
10.6 寬帶語音編碼展望
參考文獻
第11章 變速率語音編碼
11.1 變速率語音編碼的發(fā)展現(xiàn)狀
11.2 變速率語音編碼的相關(guān)技術(shù)
11.2.1 語音端點檢測技術(shù)(VAD)
11.2.2 速率判決技術(shù)
11.2.3 差錯隱藏技術(shù)
11.2.4 舒適噪聲生成技術(shù)
11.3 AMR變速率語音編碼
11.3.1 AMR編碼器原理
11.3.2 AMR參數(shù)表示及量化
11.3.3 AMR解碼器原理
11.3.4 AMR幀結(jié)構(gòu)
11.4 變速率語音編碼展望
參考文獻
第12章 嵌入式語音編碼
12.1 概述
12.2 嵌入式語音編碼的發(fā)展現(xiàn)狀
12.3 嵌入式語音編碼的有關(guān)理論
12.3.1 設(shè)計理念與編碼器的最優(yōu)性
12.3.2 分層矢量量化
12.4 嵌入式語音編碼的實現(xiàn)
12.4.1 嵌入式DPCM編碼
12.4.2 嵌入式CELP編碼
12.4.3 現(xiàn)有的CELP編碼的嵌入式擴展
12.4.4 嵌入式參數(shù)量化
12.5 嵌入式語音編碼標準G.729.1
12.5.1 G.

編輯推薦

《數(shù)字語音編碼技術(shù)》全面、系統(tǒng)地闡述了數(shù)字語音編碼的相關(guān)技術(shù)。本書可供從事語音編碼和語音通信的科技研發(fā)人員和工程人員,以及電子通信類及相關(guān)專業(yè)的高校教師、高年級本科生和研究生參考閱讀。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)字語音編碼技術(shù) PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7