網(wǎng)上多媒體信息分析與檢索

出版時間:2002-9  出版社:清華大學出版社  作者:莊越挺  頁數(shù):364  字數(shù):541000  

內(nèi)容概要

本書較系統(tǒng)地講述了網(wǎng)上多媒體分析與檢索技術。全書共6部分,分18章,分別講述了基本內(nèi)容的圖像檢索、視頻結(jié)構(gòu)化與視頻檢索、基于內(nèi)容的音頻檢索、多媒體融合分析與檢索、網(wǎng)上多媒體信息檢索系統(tǒng)等內(nèi)容,涉及的媒體類型除文本外,還包括圖像、視頻、音頻及三維圖形。本書層次分明,內(nèi)容詳實,理論分析與算法實踐相結(jié)合,力求實用。
本書可作為高等院校計算機科學、圖書情報等專業(yè)的研究生或高年級本科生的技術資料或教學用書,對廣大從事模式識別和多媒體分析等研究、應用和開發(fā)的科技人員也有很大的參考價值。

書籍目錄

第1部分 緒論
第1章 基于文本方式的信息檢索
1.1 布爾模型
1.2 聚類模型
1.3 向量模型
1.4 概率模型
第2章 基于內(nèi)容的多媒體檢索技術
2.1 多媒體分析步驟
2.2 多媒體特征提取
2.3 多媒體數(shù)據(jù)流分割
2.4 多媒體識別分類
第3章 WWW多媒體信息檢索
第2部分 基于內(nèi)容的圖像檢索
第4章 圖像特征的提取與表達
4.1 圖像顏色特征
4.1.1 顏色直方圖
4.1.2 顏色矩
4.1.3 顏色集
4.1.4 顏色聚合向量
4.1.5 顏色相圖
4.2 圖像紋理特征
4.2.1 Tamura紋理特征
4.2.2 自回歸紋理模型
4.2.3 基于小波變換的紋理特征
4.2.4 其他紋理特征
4.3 圖像形狀特征
4.3.1 傅立葉形狀描述符
4.3.2 形狀無關矩
4.3.3 基于內(nèi)角的形狀特征
4.3.4 其他形狀特征
4.4 圖像空間關系特征
4.4.1 基于圖像分割的方法
4.4.2 基于圖像子塊的方法
4.5 圖像高維特征約減和索引
4.5.1 圖像高維特征縮減
4.5.2 圖像高維特征索引
第5章 圖像相似度比較方法
5.1 圖像特征相似度比較
5.1.1 歐拉距離
5.1.2 直方圖相交
5.1.3 二次式距離
5.1.4 馬氏距離
5.1.5 非幾何的相似度方法
5.2 圖像特征性能評價
5.2.1 顏色特征評價
5.2.2 紋理特征評價
第6章 圖像檢索中的相關反饋機制
6.1 相關反饋技術分類
6.2 查詢向量相關反饋
6.2.1 文本檢索中的相關反饋
6.2.2 圖像檢索相關反饋模型
6.3 特征權(quán)重相關反饋
6.3.1 特征權(quán)重相關反饋結(jié)構(gòu)
6.3.2 圖像特征歸一化
6.3.3 圖像特征權(quán)重調(diào)整
6.4 其他圖像相關反饋技術
第7章 圖像檢索的現(xiàn)狀和未來
7.1 現(xiàn)有圖像檢索系統(tǒng)
7.2 圖像檢索未來發(fā)展趨勢
第3部分 視頻結(jié)構(gòu)化與視頻檢索
第8章 視頻內(nèi)容結(jié)構(gòu)化
8.1 視頻鏡頭邊緣檢測
8.1.1 絕對幀間差法
8.1.2 圖像像素差法
8.1.3 圖像數(shù)值差法
8.1.4 顏色直方圖法
8.1.5 壓縮域差法
8.1.6 矩不變量法
8.1.7 邊界跟蹤法
8.1.8 運動矢量法
8.2 鏡頭邊緣閾值確定
8.21 像素點變化閾值
8.2.2 鏡頭切分閾值
8.2.3 鏡頭漸變閾值
8.3 視頻關鍵幀提取
8.3.1 基于鏡頭邊界法
8.3.2 基于顏色特征法
8.3.3 基于運動分析法
8.3.4 基于聚類的關鍵幀提取
8.4 視頻場景構(gòu)造
8.5 新聞類視頻結(jié)構(gòu)化
8.5.1 視頻新聞內(nèi)容分析
8.5.2 現(xiàn)有新聞類分析系統(tǒng)
第9章 視頻檢索和視頻反饋
9.1 視頻檢索
9.2 視頻相關反饋
9.2.1 視頻層次反饋
9.2.2 鏡頭層次的反饋
第10章 視頻檢索技術的現(xiàn)狀和未來
10.1 視頻檢索的應用前景
10.2 現(xiàn)有視頻檢索系統(tǒng)
10.3 視頻檢索發(fā)展趨勢
第4部分 基于內(nèi)容的音頻檢索
第11章 音頻信號特征提取與表達
11.1 音頻時域特征提取
11.1.1 短時平均能量
11.1.2 過零率
11.1.3 線性預測系數(shù)
11.2 音頻頻域特征提取
11.2.1 傅立葉級數(shù)
11.2.2 復數(shù)形式傅立葉級數(shù)
11.2.3 傅立葉積分與連續(xù)頻譜
11.2.4 抽樣定理
11.2.5 連續(xù)信號的濾波與卷積
11.2.6 能譜特征
11.2.7 平均功率與功率譜特征
11.2.8 倒譜特征分析
11.2.9 LPC倒譜和Mel系數(shù)
11.2.10 其他頻域特征
11.3 音頻時頻特征提取
11.3.1 短時傅立葉變換
11.3.2 小波變換
11.3.3 連續(xù)小波變換
11.3.4 離散小波變換
11.3.5 小波特征系數(shù)提取
11.4 音頻例子特征提取
第12章 音頻分割與識別
12.1 音頻分割算法
12.1.1 音頻分層分割
12.1.2 基于壓縮域特征音頻分割
12.1.3 基于模板的音頻分割
12.2 音頻例子識別模型
12.2.1 基于隱馬爾可夫鏈音頻例子識別
12.2.2 基于增量支持向量機的音頻例子識別
12.2.3 基于最近特征線法的音頻例子識別
12.2.4 音頻例子混合識別模型
第13章 基于內(nèi)容的音頻檢索技術
13.1 相似音頻例子檢索
13.1.1 基于分類模型的音頻例子檢索
13.1.2 基于模糊聚類音頻例子檢索與音頻相關反饋
13.2 廣播新聞結(jié)構(gòu)化
13.3 音樂檢索
第14章 音頻檢索的現(xiàn)狀與未來
14.1 音頻檢索的類別
14.2 音頻檢索未來與挑戰(zhàn)
第5部分 多媒體融合分析與檢索
第15章 多媒體融合分析
15.1 多媒質(zhì)特征融合
15.2 單媒質(zhì)交叉索引
15.3 單媒質(zhì)結(jié)果融合
第16章 多媒體融合檢索系統(tǒng)
16.1 文本與視覺信息融合檢索
16.2 結(jié)合文本和視覺的圖像檢索與反饋
16.3 基于多模態(tài)融合的視頻結(jié)構(gòu)化
16.3.1 多模態(tài)信息結(jié)構(gòu)化新聞類視頻
16.3.2 音頻分析技術
16.3.3 視頻中的文本分析
16.4 基于壓縮域音頻特征的足球比賽精彩場景識別提取
16.4.1 足球比賽的聲音特征
16.4.2 思路和實現(xiàn)方法
16.4.3 結(jié)果分析和比較
16.5 基于支持向量機的視頻字幕提取
16.6 基于人臉對象的多媒體內(nèi)容分析
16.7 基于多模態(tài)融合的視頻場景分析
第6部分 網(wǎng)上多媒體信息檢索系統(tǒng)
第17章 面向WWW多媒體檢索系統(tǒng)
17.1 網(wǎng)絡信息收集Web Crawler
17.2 面向WWW的多媒體檢索系統(tǒng)Webscope-CBIR
17.3 網(wǎng)絡智能檢索界面
17.4 個性化WWW檢索
第18章 發(fā)展與挑戰(zhàn)
18.1 數(shù)字化圖書館
18.2 特征維數(shù)約減與變換
18.3 三維多媒體檢索
18.4 基于關鍵塊的圖像檢索
18.5 檢索復雜性度量
18.6 新一代媒體表示對軟件和硬件的影響
18.7 感知界自
18.8 多媒體推理
18.9 結(jié)論
附錄1 音頻處理工具HTK
附錄2 多媒體研究領域資料匯總
參考文獻

圖書封面

評論、評分、閱讀與下載


    網(wǎng)上多媒體信息分析與檢索 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7