出版時(shí)間:2011-10 出版社:人民郵電出版社 作者:盧官明 ,焦良葆 編著 頁數(shù):316
內(nèi)容概要
本書深入淺出地介紹了多媒體信息處理領(lǐng)域的基本概念、基本原理、關(guān)鍵技術(shù)和典型應(yīng)用。全書共10章,主要包括多媒體信息處理基礎(chǔ)、圖像增強(qiáng)、形態(tài)學(xué)圖像處理、圖像分割、數(shù)字圖像與視頻壓縮編碼原理及相關(guān)標(biāo)準(zhǔn)、數(shù)字音頻編碼技術(shù)及標(biāo)準(zhǔn)、數(shù)字媒體文件格式、數(shù)字水印技術(shù)、基于內(nèi)容的多媒體信息檢索等內(nèi)容。每章都附有小結(jié)與習(xí)題,以指導(dǎo)讀者加深對(duì)本書主要內(nèi)容的理解。
本書取材精選,內(nèi)容新穎,條理清晰,通俗易懂,重點(diǎn)突出,注重實(shí)用。在強(qiáng)調(diào)基本概念、基本原理的同時(shí),注重理論與實(shí)際應(yīng)用相結(jié)合,介紹了相關(guān)領(lǐng)域的最新研究成果及發(fā)展新動(dòng)向。
本書既可作為高等院校電子信息工程、通信工程、電子科學(xué)與技術(shù)、計(jì)算機(jī)應(yīng)用、廣播電視工程等專業(yè)的高年級(jí)本科生或研究生的教材或教學(xué)參考書,也可供從事多媒體信息處理技術(shù)領(lǐng)域工作的研究與開發(fā)人員參考。
書籍目錄
第1章 多媒體信息處理基礎(chǔ)
1.1 多媒體的基本概念
1.1.1 媒體的概念
1.1.2 多媒體與多媒體技術(shù)
1.2 音頻信息處理基礎(chǔ)
1.2.1 聲音的基本特性
1.2.2 聲音的主觀感覺
1.2.3 音頻信號(hào)的數(shù)字化
1.3 圖像信息處理基礎(chǔ)
1.3.1 光的顏色與彩色三要素
1.3.2 三基色原理
1.3.3 幾種典型的顏色空間模型及轉(zhuǎn)換關(guān)系
1.3.4 圖像信號(hào)的數(shù)字化
1.4 視頻信號(hào)的數(shù)字化
1.5 MATLAB在圖像處理中的應(yīng)用
1.5.1 MATLAB簡(jiǎn)介
1.5.2 MATLAB中圖像文件的基本操作
1.5.3 MATLAB編程實(shí)例
1.6 小結(jié)
習(xí)題
第2章 圖像增強(qiáng)
2.1 引言
2.2 圖像的灰度變換
2.2.1 灰度的線性變換
2.2.2 灰度的非線性變換
2.2.3 直方圖修正
2.2.4 直方圖規(guī)定化
2.3 圖像平滑
2.3.1 模板操作和卷積運(yùn)算
2.3.2 鄰域平均法
2.3.3 中值濾波
2.3.4 頻率域低通濾波
2.4 圖像銳化
2.4.1 梯度運(yùn)算(算子)
2.4.2 索貝爾(Sobel)算子
2.4.3 拉普拉斯(Laplacian)算子
2.4.4 頻率域高通濾波
2.5 圖像的同態(tài)濾波
2.6 彩色增強(qiáng)
2.6.1 偽彩色增強(qiáng)
2.6.2 假彩色增強(qiáng)
2.7 MATLAB編程實(shí)例
2.8 小結(jié)
習(xí)題
第3章 形態(tài)學(xué)圖像處理
3.1 引言
3.1.1 數(shù)學(xué)形態(tài)學(xué)的發(fā)展簡(jiǎn)史和基本思想
3.1.2 集合論基礎(chǔ)
3.1.3 數(shù)學(xué)形態(tài)學(xué)中的幾個(gè)基本概念
3.2 二值形態(tài)學(xué)基本運(yùn)算
3.2.1 腐蝕
3.2.2 膨脹
3.2.3 腐蝕運(yùn)算與膨脹運(yùn)算的對(duì)偶性
3.2.4 開運(yùn)算
3.2.5 閉運(yùn)算
3.3 二值圖像的形態(tài)學(xué)處理
3.3.1 邊緣提取
3.3.2 區(qū)域填充
3.3.3 骨架抽取
3.3.4 細(xì)化
3.3.5 粗化
3.3.6 形態(tài)濾波
3.4 灰度形態(tài)學(xué)基本運(yùn)算
3.4.1 灰度腐蝕
3.4.2 灰度膨脹
3.4.3 灰度開運(yùn)算與閉運(yùn)算
3.5 灰度圖像的形態(tài)學(xué)處理
3.5.1 形態(tài)學(xué)梯度
3.5.2 形態(tài)學(xué)平滑濾波
3.5.3 高帽(Top-hat)變換
3.6 MATLAB編程實(shí)例
3.6.1 MATLAB中形態(tài)學(xué)基本運(yùn)算函數(shù)
3.6.2 MATLAB編程實(shí)例
3.7 小結(jié)
習(xí)題
第4章 圖像分割
4.1 圖像分割的概念及分類
4.1.1 圖像分割的概念
4.1.2 圖像分割的依據(jù)和方法分類
4.2 基于灰度閾值化的圖像分割
4.2.1 閾值化分割的原理
4.2.2 全局閾值化分割法
4.2.3 局部閾值化分割法
4.3 基于邊緣檢測(cè)的圖像分割
4.3.1 邊緣檢測(cè)的基本原理和步驟
4.3.2 梯度算子
4.3.3 Laplacian算子和LoG算子
4.3.4 Canny算子
4.3.5 邊緣跟蹤
4.4 基于區(qū)域的圖像分割
4.4.1 區(qū)域生長(zhǎng)法
4.4.2 區(qū)域分裂與合并法
4.5 MATLAB編程實(shí)例
4.6 小結(jié)
習(xí)題
第5章 數(shù)字圖像與視頻壓縮編碼原理
5.1 數(shù)字圖像與視頻壓縮編碼概述
5.1.1 數(shù)字圖像與視頻壓縮的必要性和可能性
5.1.2 數(shù)字圖像與視頻壓縮編碼的主要方法及其分類
5.2 無失真編碼
5.2.1 游程編碼
5.2.2 霍夫曼編碼
5.2.3 算術(shù)編碼
5.3 預(yù)測(cè)編碼
5.3.1 圖像差值信號(hào)的統(tǒng)計(jì)特性
5.3.2 幀內(nèi)預(yù)測(cè)編碼
5.3.3 幀間預(yù)測(cè)編碼
5.4 變換編碼
5.4.1 圖像的頻率域統(tǒng)計(jì)特性
5.4.2 變換編碼的基本原理
5.4.3 正交變換基的選擇
5.4.4 DCT圖像編碼
5.5 MATLAB編程實(shí)例
5.6 小結(jié)
習(xí)題
第6章 數(shù)字圖像與視頻壓縮編碼標(biāo)準(zhǔn)
6.1 靜止圖像編碼標(biāo)準(zhǔn)
6.1.1 JPEG標(biāo)準(zhǔn)概述
6.1.2 JPEG基本編碼系統(tǒng)
6.1.3 基于DCT的漸進(jìn)編碼
6.1.4 分級(jí)編碼
6.1.5 JPEG 2000標(biāo)準(zhǔn)概述
6.1.6 JPEG 2000標(biāo)準(zhǔn)的基本框架
6.1.7 JPEG 2000的主要特點(diǎn)
6.2 數(shù)字視頻編碼的標(biāo)準(zhǔn)化進(jìn)程
6.3 MPEG-1/MPEG-2視頻編碼標(biāo)準(zhǔn)
6.3.1 I幀、P幀和B幀
6.3.2 視頻碼流的分層結(jié)構(gòu)
6.3.3 MPEG-1/MPEG-2視頻編解碼原理
6.3.4 MPEG-2的功能擴(kuò)展
6.4 MPEG-4視頻編碼標(biāo)準(zhǔn)
6.4.1 概述
6.4.2 MPEG-4視頻編碼功能與特點(diǎn)
6.4.3 MPEG-4基于內(nèi)容的視頻編碼
6.5 H.263視頻編碼標(biāo)準(zhǔn)
6.5.1 視頻信源圖像格式
6.5.2 H.263視頻編解碼原理
6.5.3 H.263可選模式
6.5.4 H.263+的可選模式
6.5.5 H.263++的可選模式
6.6 H.264/AVC視頻編碼標(biāo)準(zhǔn)
6.6.1 H.264/AVC編碼器的分層結(jié)構(gòu)
6.6.2 H.264/AVC中的預(yù)測(cè)編碼
6.6.3 整數(shù)變換與量化
6.6.4 基于上下文的自適應(yīng)熵編碼
6.7 AVS視頻編碼標(biāo)準(zhǔn)
6.7.1 AVS-P2
6.7.2 AVS-P2與H.264的比較
6.8 小結(jié)
習(xí)題
第7章 數(shù)字音頻編碼技術(shù)及標(biāo)準(zhǔn)
7.1 數(shù)字音頻壓縮編碼概述
7.1.1 數(shù)字音頻壓縮編碼的機(jī)理
7.1.2 音頻編/解碼器的性能指標(biāo)
7.1.3 數(shù)字音頻編碼技術(shù)的分類
7.1.4 數(shù)字音頻編碼標(biāo)準(zhǔn)概述
7.2 常用數(shù)字音頻編碼技術(shù)
7.2.1 線性預(yù)測(cè)編碼
7.2.2 矢量量化
7.2.3 CELP編碼
7.2.4 子帶編碼
7.3 MPEG-1音頻編碼標(biāo)準(zhǔn)
7.3.1 MPEG-1音頻編碼算法的特點(diǎn)
7.3.2 MPEG-1音頻編碼的基本原理
7.4 MPEG-2 AAC音頻編碼標(biāo)準(zhǔn)
7.4.1 概述
7.4.2 MPEG-2 AAC編碼算法和特點(diǎn)
7.4.3 MPEG-2 AAC的檔次
7.5 中國(guó)制定的音頻編碼標(biāo)準(zhǔn)
7.5.1 AVS音頻立體聲編碼標(biāo)準(zhǔn)
7.5.2 DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)
7.6 小結(jié)
習(xí)題
第8章 數(shù)字媒體文件格式
8.1 資源交換文件格式(RIFF)
8.2 數(shù)字圖像文件格式
8.2.1 位圖和調(diào)色板的概念
8.2.2 圖像文件的一般結(jié)構(gòu)
8.2.3 BMP文件格式
8.2.4 GIF文件格式
8.2.5 JPEG文件交換格式
8.2.6 其他圖像文件格式
8.3 常見的動(dòng)畫文件格式
8.3.1 FLI/FLC文件格式
8.3.2 SWF文件格式
8.4 數(shù)字視頻文件格式
8.4.1 AVI文件格式
8.4.2 MPEG/MPG/DAT/DivX/XviD
8.5 數(shù)字音頻文件格式
8.5.1 WAV文件格式
8.5.2 MPEG音頻(MP1/MP2/MP3/AAC)文件格式
8.5.3 其他音頻文件格式
8.6 流媒體文件格式
8.6.1 Real Media文件格式
8.6.2 ASF文件格式
8.6.3 QuickTime文件格式
8.6.4 FLV文件格式
8.6.5 其他流媒體文件格式
8.7 小結(jié)
習(xí)題
第9章 數(shù)字水印技術(shù)
9.1 數(shù)字水印概述
9.1.1 數(shù)字水印技術(shù)的產(chǎn)生背景和應(yīng)用
9.1.2 數(shù)字水印的基本特征
9.1.3 數(shù)字水印系統(tǒng)的組成
9.1.4 數(shù)字水印的分類
9.2 數(shù)字圖像水印算法
9.2.1 最低有效位方法
9.2.2 基于DCT域的方法
9.3 數(shù)字視頻水印的嵌入和提取方案
9.3.1 基于未壓縮的原始視頻的水印方案
9.3.2 基于視頻編碼的水印方案
9.3.3 基于壓縮視頻碼流的水印方案
9.4 數(shù)字音頻水印算法
9.4.1 最低有效位方法
9.4.2 回聲隱藏方法
9.4.3 相位編碼方法
9.4.4 變換域方法
9.4.5 基于壓縮音頻方法
9.5 MATLAB編程實(shí)例
9.6 小結(jié)
習(xí)題
第10章 基于內(nèi)容的多媒體信息檢索
10.1 基于內(nèi)容檢索技術(shù)概述
10.1.1 多媒體信息的內(nèi)容
10.1.2 內(nèi)容處理技術(shù)
10.1.3 基于內(nèi)容檢索的查詢方式
10.1.4 基于內(nèi)容檢索系統(tǒng)的一般結(jié)構(gòu)
10.1.5 基于內(nèi)容的檢索過程
10.1.6 基于內(nèi)容檢索的特點(diǎn)
10.2 基于內(nèi)容的圖像檢索
10.2.1 基于內(nèi)容的圖像檢索概述
10.2.2 圖像顏色特征的提取與表示
10.2.3 圖像紋理特征的提取與表示
10.2.4 圖像形狀特征的提取與表示
10.2.5 圖像空間關(guān)系特征的提取與表示
10.2.6 圖像的相似性度量
10.2.7 圖像檢索中的相關(guān)反饋機(jī)制
10.3 基于內(nèi)容的視頻檢索
10.3.1 基于內(nèi)容的視頻檢索概述
10.3.2 視頻內(nèi)容的結(jié)構(gòu)化
10.3.3 基于內(nèi)容的視頻檢索工作流程
10.3.4 基于內(nèi)容的視頻檢索系統(tǒng)結(jié)構(gòu)
10.3.5 鏡頭切換的基本概念
10.3.6 鏡頭邊界檢測(cè)
10.3.7 關(guān)鍵幀的提取
10.3.8 鏡頭聚類(場(chǎng)景檢測(cè))
10.4 基于內(nèi)容的音頻檢索
10.4.1 音頻內(nèi)容的特征表示
10.4.2 基于內(nèi)容的音頻檢索概述
10.4.3 基于內(nèi)容的語音檢索
10.4.4 基于內(nèi)容的音樂檢索
10.5 小結(jié)
習(xí)題
參考文獻(xiàn)
編輯推薦
《多媒體信息處理》由盧官明、焦良葆編著,編寫本教材的指導(dǎo)思想是:將音頻、圖像、視頻等媒體信息的處理技術(shù)有機(jī)地整合在一起,揭示其內(nèi)在的聯(lián)系,以便讓學(xué)生在有限的學(xué)習(xí)時(shí)間內(nèi)掌握更系統(tǒng)、更全面的知識(shí),既可作為高等院校電子信息工程、通信工程、電子科學(xué)與技術(shù)、計(jì)算機(jī)應(yīng)用、廣播電視工程等專業(yè)的高年級(jí)本科生或研究生的教材或教學(xué)參考書,也可供從事多媒體信息處理技術(shù)領(lǐng)域工作的研究與開發(fā)人員參考。
圖書封面
評(píng)論、評(píng)分、閱讀與下載