出版時間:2009-11 出版社:人民郵電 作者:解相吾//解文博 頁數(shù):318
前言
數(shù)字音視頻技術作為核心的新興產業(yè),已經成為當前及今后一段時期提升區(qū)域經濟發(fā)展規(guī)模和檔次的戰(zhàn)略性產業(yè)。 本書從技術和應用兩大方面對信源編碼技術、信道編碼技術、調制技術、存儲技術及網絡傳輸技術進行了系統(tǒng)的闡述,對數(shù)字音視頻技術在消費電子領域、廣播電視領域、多媒體計算機領域及多媒體通信領域的實際應用進行了全面的介紹,讓學生掌握數(shù)字音視頻技術的基本原理,了解數(shù)字音視頻技術的發(fā)展和應用,為學習后續(xù)課程打好基礎。 在編寫過程中,我們遵照循序漸進的原則,結合高職高專實行“雙證制”的需要,采用富有彈性的模塊化結構,對知識與能力進行有機的綜合。內容編排力求由淺人深,通俗易懂,對數(shù)字音視頻領域中所涉及的各種技術和應用進行了詳盡的闡述,并配以豐富的圖表和圖片,以利于學生形象地掌握最基本的原理和相關技術。本書主要有以下特點?! 。?)技術上的先進性。本書在取材上力求反映數(shù)字音視頻技術的最新動態(tài),注意吸收新知識、新理論和新技術的成果,重點講述數(shù)字音視頻領域中的核心技術和主流技術?! 。?)知識上的完整性。數(shù)字音視頻技術課程涉及內容廣泛,單獨講解某種設備和技術難免以偏概全,不利于完整了解整個系統(tǒng)應有的功能。為便于學生理解,本書對數(shù)字音視頻技術的相關設備、基本概念、體系結構和相關性進行了完整描述?! 。?)結構上的系統(tǒng)性?,F(xiàn)實中的數(shù)字音視頻領域規(guī)模龐大,技術復雜,設備種類繁多,必須科學地、有機地組合在一起才能發(fā)揮作用。全書各章由典型設備、基本知識與主要技術、專業(yè)技能實訓三大模塊組成,充分體現(xiàn)“寬基礎、薄理論、強技能”的專業(yè)教學特色?! 。?)突出了實用性。本書結合高職高專的教學特點,強調理論與實際相結合。由于現(xiàn)代產品的集成度很高,在介紹工作原理時,不必一覽無余地對其內部的每一個元器件進行分析。我們只須講解主要芯片、關鍵部件和電路的主要功能就可以了?! 。?)注重能力培養(yǎng)。本書內容較多,涉及面寬,從實用的角度出發(fā),在注意提高學生學習興趣的同時,結合職業(yè)資格考證的需要,精心安排技能實訓項目,讓學生在實踐中學,提高他們解決實際問題和實踐操作的能力?! ∮捎诟餍5膶嶋H情況不同,建議教師采用有所教有所不教和有所學有所不學的策略靈活處理各章內容?! ”緯山庀辔?、解文博編寫。第8章、第9章解文博編寫,其余各章由解相吾編寫,全書由解相吾統(tǒng)稿。徐小英、陳炯堯、吳嘉明、關天軍、陳杰輝、鐘科科、楊遠輝等為本書的資料收集和整理提供了大量的幫助?! ”緯诰帉戇^程中,參考了大量的文獻和資料,書后的參考文獻僅列出其中的一部分,其他出處實難一一指出,在此特向本書所引用資料的作者表示衷心的感謝?! ∮捎诰帉憰r間倉促,編者水平有限,書中疏漏之處在所難免,歡迎廣大讀者批評指正。
內容概要
-------------------------------------------------------------------------------- 本書以數(shù)字音視頻技術為主線,從實際應用出發(fā),結合典型設備,深入淺出地介紹了數(shù)字音視頻技術的基本原理和相關技術。全書共分9章,對數(shù)字音視頻信源編碼技術、信道編碼技術、調制技術、存儲技術及網絡傳輸技術進行了系統(tǒng)闡述;對數(shù)字音視頻技術在消費電子領域、廣播電視領域、多媒體計算機領域及多媒體通信領域的實際應用進行了全面的介紹;精心設計了相關技能訓練項目,是一部體系新穎、內容全面的通用基礎教材。 本書可作為高職院校和其他高等院校電子信息、應用電子、通信技術、廣播電視、多媒體技術等專業(yè)的教材,也可以供相關領域的技術人員參考。
書籍目錄
第1章 概述 1.1 數(shù)字音視頻技術的基本概念與主要特點 1.2 數(shù)字音視頻系統(tǒng)的組成 1.3 數(shù)字音視頻系統(tǒng)的業(yè)務與應用 1.4 數(shù)字音視頻技術的發(fā)展趨勢 技能訓練一:數(shù)碼視聽設備的連接操作 思考與練習 第2章 數(shù)字音頻技術基礎 典型設備:CD機 基本知識與主要技術 2.1 聲學原理 2.1.1 聲音物理特性 2.1.2 人的聽覺特性 2.2 聲音數(shù)字化 2.2.1 數(shù)字化概述 2.2.2 模/數(shù)變換 2.2.3 數(shù)/模變換 2.3 數(shù)字音頻的主要性能參數(shù) 2.4 數(shù)字音頻文件的常見格式 技能訓練二:CD/VCD機芯結構觀察與拆裝 技能訓練三:CD機的電路觀測 思考與練習 第3章 音頻壓縮編解碼 典型設備:MP3播放器 基本知識與主要技術 3.1 音頻壓縮概述 3.1.1 音頻壓縮的可行性 3.1.2 音頻壓縮編碼技術分類 3.2 波形編碼 3.2.1 脈沖編碼調制 3.2.2 差分脈沖編碼調制 3.2.3 自適應差分脈沖編碼調制 3.2.4 增量調制和自適應增量調制 3.2.5 子帶編碼 3.2.6 矢量編碼 3.3 參數(shù)編碼 3.3.1 語音生成模型 3.3.2 線性預測編碼 3.4 混合編碼 3.4.1 多脈沖線性預測編碼 3.4.2 規(guī)則脈沖激勵/長項預測編碼 3.4.3 碼激勵線性預測編碼 3.4.4 矢量和激勵線性預測編碼 3.4.5 多帶激勵語音編碼 3.4.6 混合激勵線性預測編碼 3.5 MPEG音頻編碼 3.5.1 MPEG-1音頻 3.5.2 MPEG-2音頻 3.5.3 MPEG-4音頻 3.5.4 MPEG-7音頻 3.5.5 杜比AC-3 3.6 G.7xx系列編碼標準 技能訓練四:MP3播放器的整機認識與拆裝 技能訓練五:MP3播放器的升級擴容 思考與練習 第4章 數(shù)字視頻編碼基礎 典型設備:DV(數(shù)字攝錄機) 基本知識與主要技術 4.1 光與色 4.1.1 光的特性與度量 4.1.2 色彩 4.2 視覺與圖像 4.2.1 視覺現(xiàn)象 4.2.2 圖像 4.3 視頻 4.3.1 視頻信號的獲取和顯示 4.3.2 視頻信息和信號特點 4.3.3 模擬視頻 4.3.4 數(shù)字視頻 4.4 視頻信號的數(shù)字化 4.4.1 A/D變換器中的舍入法量化 4.4.2 并串型A/D變換器 4.4.3 PCM編碼器 4.4.4 D/A變換器 4.5 視頻編碼 4.5.1 視頻壓縮原理 4.5.2 視頻編碼的方案體系 4.5.3 視頻壓縮編碼的分類 技能訓練六:DV機的視頻采集 思考與練習 第5章 視頻壓縮編碼 典型設備:VCD影碟機 基本知識與主要技術 5.1 預測編碼 5.1.1 預測編碼的基本內容 5.1.2 預測編碼的類型 5.1.3 預測器 5.1.4 后向預測和雙向預測 5.1.5 像素塊預測 5.1.6 量化與編碼 5.1.7 具有運動補償?shù)膸瑑炔濉 ?.2 變換編碼 5.2.1 變換編碼的基本原理 5.2.2 正交變換矩陣 5.2.3 離散余弦變換(DCT) 5.3 統(tǒng)計編碼 5.3.1 霍夫曼編碼 5.3.2 游程編碼 5.3.3 算術編碼 5.4 子帶編碼(SBC) 5.4.1 子帶編碼原理 5.4.2 子帶濾波 5.4.3 二維子帶編碼 5.5 小波變換編碼 5.6 分形編碼 5.6.1 分形的概念 5.6.2 分形編碼原理 5.7 知識(模型)基編碼 5.7.1 基于模型的編碼 5.7.2 語義基圖像編碼 5.7.3 物體基圖像編碼 技能訓練七:VCD機整機電路結構觀測 技能訓練八:VCD機信號檢測與調整 思考與練習 第6章 數(shù)字視頻編碼標準 典型設備:DVD影碟機 基本知識與主要技術 6.1 概述 6.2 ITU-R BT.601數(shù)字視頻標準 6.3 H.26X標準 6.3.1 H.261標準 6.3.2 H.263標準 6.3.3 H.264標準 6.4 H.323可視通信系統(tǒng)標準 6.5 JPEG標準 6.5.1 JPEG 6.5.2 JPEG 2000 6.6 MPEG標準 6.6.1 MPEG-1標準 6.6.2 MPEG-2標準 6.6.3 MPEG-4標準 6.6.4 MPEG-7標準 6.6.5 MPEG-21標準 技能訓練九:DVD機解碼電路的檢測 技能訓練十:DVD機主要信號波形測量 0 思考與練習 第7章 數(shù)字音視頻信號的傳輸技術 第8章 數(shù)字音視頻存儲技術 第9章 數(shù)字音視頻技術的業(yè)務應用 參考文獻
章節(jié)摘錄
語音信號經過高通濾波、低通濾波及加窗處理后提取基音周期的粗估值,然后在粗估值的周圍進行細搜索,找到基音周期的準確值,這樣做可以減小運算量。得到基音周期準確值后,根據(jù)此值計算各帶擬合誤差,判斷各帶是屬于濁音區(qū)還是清音區(qū),并計算出各諧波的譜幅度值。最后,將這些參數(shù)量化編碼,傳送給解碼器。解碼器根據(jù)這些參數(shù),將濁音帶的各諧波采用正弦信號激勵并在時域合成;清音帶則采用白噪聲激勵并在頻域合成,再經過逆FFT變換成時域信號,最后將它們相加,形成完整的合成語音?! BE聲碼器可以在4.8-1.2kbit/s的速率下得到較好的語音質量,而且抗干擾能力較強,噪聲環(huán)境下的語音質量不會嚴重惡化。許多衛(wèi)星移動通信系統(tǒng)使用的都是這種聲碼器?! ?.4.6混合激勵線性預測編碼 混合激勵線性預測編碼(MELP)算法對語音的模式進行兩級分類。首先將語音分為“清”和“濁”兩大類,這里的清音是指不具有周期成分的強清音,其余的均劃為濁音,用總的清/濁音判決表示。其次,把濁音再分為濁音和抖動濁音,用非周期位表示。在對濁音和抖動濁音的處理上,MELP算法利用了MBE算法的分帶思想,在各子帶上對混合比例進行控制。這種方法簡單有效,使用的比特數(shù)也不多。如果使用1bit對每個子帶的混合比例參數(shù)進行編碼,該參數(shù)也就簡化為每個子帶的清/濁音判決信息。另外,在周期脈沖信號源的合成上,MELP算法要對工.PC分析的殘差信號進行傅里葉變換,提取諧波分量,量化后傳到接收端,用于合成周期脈沖激勵。這種方法提高了激勵信號與原始殘差的匹配程度?! ELP的參數(shù)包括工,PC參數(shù)、基音周期、模式分類參數(shù)、分帶混合比例、殘差諧波參數(shù)和增益。如圖3-30所示,在MELP的參數(shù)分析部分,語音信號輸入后要分別進行基音提取、子帶分析、LPC分析和殘差諧波譜計算。MELP算法的語音合成部分仍然采取LPC合成的形式,不同的是激勵信號的合成方式和后處理。
編輯推薦
《數(shù)字音視頻技術》特色: 技術先進,反映數(shù)字音視頻技術最新動態(tài);結構系統(tǒng),體現(xiàn)寬基礎、薄理論、強技能;突出實用,符合高職高?!半p證制”需要。
圖書封面
評論、評分、閱讀與下載