出版時(shí)間:2004-11 出版社:人民郵電 作者:李昌立,吳善培 編著 頁數(shù):373
Tag標(biāo)簽:無
內(nèi)容概要
《數(shù)字語音:語音編碼實(shí)用教程》系統(tǒng)論述了數(shù)字語音及語音編碼領(lǐng)域的基礎(chǔ)知識、計(jì)算方法、實(shí)驗(yàn)探索,以及相關(guān)新技術(shù)的關(guān)鍵算法和應(yīng)用。內(nèi)容包括語音編碼概論、語音信號的采樣和量化、語音信號的分析和建模、使用線譜頻率(LSF)量化線性預(yù)測編碼(LPC)參量、按合成分析法(AbS)的語音編碼方案、低延遲語音編碼、多帶激勵(lì)語音編碼、低速率語音編碼、寬帶語音編碼、語音編碼的各種方案和標(biāo)準(zhǔn)算法、語音編碼器的質(zhì)量評價(jià)、語音編碼的實(shí)時(shí)實(shí)現(xiàn)、有關(guān)的系統(tǒng)應(yīng)用?! 稊?shù)字語音:語音編碼實(shí)用教程》概念講解清楚,系統(tǒng)性強(qiáng),是作者多年來從事數(shù)字語音及語音編碼工作的經(jīng)驗(yàn)總結(jié),具有較強(qiáng)的實(shí)用性,可作為高等院校通信工程、信息處理專業(yè)的高年級本科生和研究生的教材,也可供通信、信號與信息處理方面的工程技術(shù)人員閱讀。
書籍目錄
第1章 語音編碼概論 11.1 語音編碼的數(shù)字化 11.2 語音編碼的必要性和推動力 11.3 語音編碼的聲學(xué)基礎(chǔ)知識 31.3.1 響度級和響度 31.3.2 聽覺掩蔽和臨界頻帶 41.3.3 聽覺掩蔽在語音編碼中的作用 61.3.4 發(fā)聲器官的聲電類比線路 71.3.5 語言發(fā)聲的數(shù)學(xué)模型 101.4 語音信號的物理特性 151.4.1 語音信號在時(shí)域和頻域的特性 151.4.2 語音信號的統(tǒng)計(jì)特性 171.4.3 語音傳輸所需比特率的估計(jì) 191.5 除去語音冗余度的方法 211.6 語音編碼器方案的分類 231.6.1 波形近似語音編碼器 231.6.2 參量編碼器 241.7 語音編碼的發(fā)展趨勢 24參考文獻(xiàn) 25第2章 語音信號的采樣和量化 272.1 采樣 272.2 標(biāo)量量化 282.2.1 量化誤差 292.2.2 均勻量化器 302.2.3 最佳量化器 312.2.4 對數(shù)量化器 322.2.5 自適應(yīng)量化器 332.2.6 差分量化器 352.3 矢量量化 372.3.1 失真測度 382.3.2 碼書設(shè)計(jì) 392.3.3 碼書種類 402.3.4 訓(xùn)練試驗(yàn)和碼書的頑健性 45參考文獻(xiàn) 46第3章 語音信號的分析和建?!?83.1 短時(shí)頻譜分析 483.1.1 窗的作用 493.2 語音信號的線性預(yù)測模型 533.2.1 語音產(chǎn)生的源濾波器模型 543.2.2 線性預(yù)測分析(LPA)的求解 553.2.3 線性預(yù)測分析的實(shí)現(xiàn)和物理解釋 623.3 音調(diào)預(yù)測 643.3.1 語音信號的周期性 643.3.2 音調(diào)預(yù)測器 653.4 音調(diào)檢測 683.4.1 時(shí)域波形的相似性方法 693.4.2 頻率域頻譜的相似性方法 723.4.3 預(yù)處理和后處理技術(shù) 74參考文獻(xiàn) 79第4章 使用線譜頻率(LSF)量化線性預(yù)測編碼(LPC)參量 824.1 LPC參量的編碼 824.2 LPC參量的另外一種表示——PARCOR系數(shù) 824.3 LPC到LSF的變換 874.3.1 LSF的計(jì)算 884.3.2 LSF到LPC的變換 954.3.3 LSF的特性 964.4 轉(zhuǎn)換型——自適應(yīng)幀間矢量預(yù)測(SIVP) 984.4.1 SIVP編碼方案 984.4.2 矢量預(yù)測器 994.4.3 預(yù)測誤差的量化 1004.4.4 性能的比較 1024.4.5 實(shí)時(shí)實(shí)現(xiàn)中的問題 1054.5 SAVQ編碼方案 1074.5.1 SAVQ 系統(tǒng) 1074.5.2 性能比較 1074.6 無記憶的LSF量化 1094.6.1 LSF的分裂矢量量化 1094.6.2 非均勻的標(biāo)量量化 109參考文獻(xiàn) 111第5章 按合成分析法(AbS)的語音編碼方案 1125.1 按合成分析法(AbS)的基本原理 1125.2 通用的AbS編碼方案 1135.2.1 時(shí)變?yōu)V波器 1145.2.2 建立在理解上的最小化程序 1155.2.3 激勵(lì)信號 1165.2.4 最佳激勵(lì)序列的確定 1185.2.5 AbS-LPC 方案的特性 1215.3 多脈沖激勵(lì)線性預(yù)測編碼(MPLPC) 1245.3.1 MPLPC的最優(yōu)幅度激勵(lì) 1255.3.2 具有長期預(yù)測的MPLPC 1275.3.3 脈沖位置編碼 1295.3.4 脈沖幅度編碼 1305.3.5 聯(lián)合的脈沖幅度量化(JPAQ) 1325.4 碼激勵(lì)線性預(yù)測編碼 1345.4.1 引言 1345.4.2 短期預(yù)測(STP) 1355.4.3 長期預(yù)測(LTP) 1365.4.4 輔助激勵(lì)的計(jì)算 1455.4.5 LTP和輔助激勵(lì)聯(lián)合計(jì)算 1595.4.6 具有后濾波的CELP 160參考文獻(xiàn) 162第6章 低時(shí)延語音編碼 1656.1 編碼時(shí)延與對低時(shí)延編碼器的要求 1656.2 G.728 16kbit/s LD-CELP語音編碼器 1666.2.1 方框圖與工作原理 1666.2.2 高階后向自適應(yīng)線性預(yù)測 1686.2.3 聽覺加權(quán)濾波器 1696.2.4 激勵(lì)增益預(yù)測器 1706.2.5 碼書結(jié)構(gòu)與搜尋 1716.2.6 同步和帶內(nèi)信令 1786.2.7 自適應(yīng)后置濾波器(adaptive post-filter) 1786.2.8 G-728編解碼器的復(fù)雜度和性能 182參考文獻(xiàn) 183第7章 多帶激勵(lì)聲碼器 1847.1 導(dǎo)言 1847.2 多帶激勵(lì)語音模型 1857.3 多帶激勵(lì)語音分析 1897.3.1 頻域分析 1907.3.2 時(shí)域分析 1927.3.3 INMARSAT-M IMBE模型分析算法 1957.4 多帶激勵(lì)語音合成 2047.4.1 清音成分的合成 2047.4.2 濁音成分的合成 2057.4.3 重建語音的產(chǎn)生 207參考文獻(xiàn) 207第8章 低速率語音編碼 2088.1 波形內(nèi)插語音編碼 2088.1.1 濁音語音的波形內(nèi)插 2098.1.2 廣義WI模型 2128.1.3 2.4kbit/s GWI語音編碼系統(tǒng) 2158.2 正弦變換編碼 2188.2.1 語音信號的正弦分析 2188.2.2 語音信號的正弦合成 2198.2.3 低比特率正弦編碼器 2208.2.4 與原型波形內(nèi)插相結(jié)合 2218.2.5 基音的頻域估計(jì)法 2228.2.6 確定殘差信號的正弦模型參數(shù) 2238.2.7 正弦激勵(lì)參數(shù)的量化 2278.2.8 正弦變換解碼器 2318.2.9 正弦變換編碼器的性能 232參考文獻(xiàn) 234第9章 寬帶語音編碼 2359.1 引言 2359.2 子帶編碼(sub-band coding) 2369.2.1 工作原理 2369.2.2 子帶編碼的比特分配 2379.3 G.722寬帶語音編碼 2409.3.1 技術(shù)要求 2409.3.2 方框圖 2409.3.3 SB-ADPCM編碼器的工作原理 2419.3.4 SB-ADPCM解碼器的工作原理 2429.3.5 正交鏡像濾波器組(quadrature-mirror filter bank) 2449.3.6 G.722自適應(yīng)量化與預(yù)測 251參考文獻(xiàn) 256第10章 語音編碼的方案和標(biāo)準(zhǔn)算法 25710.1 語音編碼標(biāo)準(zhǔn)的發(fā)展概況 25710.2 語音編碼器的屬性 25810.2.1 比特率 25810.2.2 延遲 25810.2.3 復(fù)雜度 25910.2.4 語音質(zhì)量 25910.2.5 規(guī)范和適應(yīng)性的確認(rèn) 26010.3 世界上有哪些標(biāo)準(zhǔn)化實(shí)體,他們是怎樣開展工作的 26110.3.1 國際電信聯(lián)盟(ITU) 26110.3.2 北美的標(biāo)準(zhǔn)化組織 26210.3.3 歐洲電信標(biāo)準(zhǔn)研究所 26210.3.4 日本的RCR 26210.3.5 我國的電信標(biāo)準(zhǔn)化組織 26210.3.6 建立參考條款 26310.3.7 語音編碼器的性能測量 26310.3.8 工作日程 26410.4 現(xiàn)在的語音編碼標(biāo)準(zhǔn) 26410.4.1 ITU公布的具有電話帶寬的語音編碼器 26510.4.2 ITU-T近期發(fā)布的電話帶寬語音編碼器 26610.4.3 ITU 7kHz寬帶語音編碼器 26710.4.4 歐洲的數(shù)字蜂窩電話語音編碼器 26810.4.5 北美的數(shù)字蜂窩語音編碼器 26910.4.6 日本的數(shù)字蜂窩電話編碼器 27010.4.7 國際海事衛(wèi)星4.15kbit/s IMBE編碼器 27110.4.8 用于保密通信的語音編碼標(biāo)準(zhǔn) 27210.5 語音編碼器性能的總結(jié) 27310.6 附加的信息 274參考文獻(xiàn) 274第11章 語音編碼器的質(zhì)量評價(jià) 27711.1 語音質(zhì)量的定義 27711.1.1 對發(fā)音者和語言的依賴 27711.1.2 對信號功率級的依賴 27711.1.3 背景噪聲 27811.1.4 多種編碼的級聯(lián) 27811.1.5 信道誤差所產(chǎn)生的影響 27911.1.6 非語音信號 27911.2 語音質(zhì)量的客觀測量 27911.3 語音質(zhì)量的主觀測量 28011.3.1 絕對等級的評定試驗(yàn)(ACR) 28111.3.2 降低等級的評定試驗(yàn)(DCR) 28111.3.3 診斷測量試驗(yàn)(DAM) 28211.3.4 通話試驗(yàn) 28211.3.5 主觀質(zhì)量的預(yù)測 28211.4 測量語音可懂度和對發(fā)音人的識別能力 28311.4.1 可懂度 28311.4.2 對談話者的辨認(rèn)能力 28311.5 漢語清晰度測量和語音質(zhì)量的診斷 28411.6 檢測語音質(zhì)量的數(shù)據(jù)庫和另外的試驗(yàn)信號 28711.7 典型MOS試驗(yàn)的描述 28811.7.1 試驗(yàn)方法和實(shí)驗(yàn)的設(shè)計(jì) 28811.7.2 語音材料的選擇和處理 28811.7.3 試驗(yàn)結(jié)果 29011.8 確認(rèn)語音編碼器實(shí)現(xiàn)的方法 29111.9 復(fù)雜度和延遲的測量 29211.9.1 復(fù)雜度 29211.9.2 延遲 29311.10 結(jié)論 293參考文獻(xiàn) 293第12章 語音編碼的實(shí)時(shí)實(shí)現(xiàn) 29812.1 引言 29812.2 數(shù)字信號處理器(DSP) 29812.2.1 DSP芯片的發(fā)展概況 29912.2.2 定點(diǎn)實(shí)現(xiàn)的DSP 30012.2.3 浮點(diǎn)實(shí)現(xiàn)的DSP 30412.2.4 TI公司的TMS320 C6000芯片系列 30512.3 實(shí)時(shí)的軟件開發(fā)方法 30812.4 典型的CELP實(shí)現(xiàn)方案 30912.4.1 AT&T的WE-DSP32 30912.4.2 典型的WE-DSP32C基礎(chǔ)硬件 31012.5 DSP的開發(fā)和調(diào)試工具 31212.6 有效的編程技術(shù) 31312.6.1 CELP復(fù)雜性降低的策略 31412.6.2 典型CELP方案中對處理和存儲的要求 317參考文獻(xiàn) 318第13章 系統(tǒng)應(yīng)用中的有關(guān)問題 31913.1 引言 31913.2 回波抵消 32013.2.1 數(shù)字回波抵消器的原理 32113.2.2 回波抵消的數(shù)學(xué)表述 32213.3 語音不連續(xù)的傳輸(DTX) 32413.3.1 聲音激活的檢測 32513.3.2 語音加數(shù)據(jù)的編碼和傳輸 32813.4 傳輸過程中的同步 32913.5 語音數(shù)據(jù)的安全 331參考文獻(xiàn) 333課程習(xí)題與設(shè)計(jì)選題匯集 334附錄 G.729 8kbit/s共軛結(jié)構(gòu)一代數(shù)碼激勵(lì)線性預(yù)測編碼 337本書縮寫字的中英文譯名 370
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載