出版時(shí)間:2002-9 出版社:清華大學(xué)出版社 作者:莊越挺 頁(yè)數(shù):364 字?jǐn)?shù):541000
內(nèi)容概要
本書(shū)較系統(tǒng)地講述了網(wǎng)上多媒體分析與檢索技術(shù)。全書(shū)共6部分,分18章,分別講述了基本內(nèi)容的圖像檢索、視頻結(jié)構(gòu)化與視頻檢索、基于內(nèi)容的音頻檢索、多媒體融合分析與檢索、網(wǎng)上多媒體信息檢索系統(tǒng)等內(nèi)容,涉及的媒體類(lèi)型除文本外,還包括圖像、視頻、音頻及三維圖形。本書(shū)層次分明,內(nèi)容詳實(shí),理論分析與算法實(shí)踐相結(jié)合,力求實(shí)用。
本書(shū)可作為高等院校計(jì)算機(jī)科學(xué)、圖書(shū)情報(bào)等專(zhuān)業(yè)的研究生或高年級(jí)本科生的技術(shù)資料或教學(xué)用書(shū),對(duì)廣大從事模式識(shí)別和多媒體分析等研究、應(yīng)用和開(kāi)發(fā)的科技人員也有很大的參考價(jià)值。
書(shū)籍目錄
第1部分 緒論
第1章 基于文本方式的信息檢索
1.1 布爾模型
1.2 聚類(lèi)模型
1.3 向量模型
1.4 概率模型
第2章 基于內(nèi)容的多媒體檢索技術(shù)
2.1 多媒體分析步驟
2.2 多媒體特征提取
2.3 多媒體數(shù)據(jù)流分割
2.4 多媒體識(shí)別分類(lèi)
第3章 WWW多媒體信息檢索
第2部分 基于內(nèi)容的圖像檢索
第4章 圖像特征的提取與表達(dá)
4.1 圖像顏色特征
4.1.1 顏色直方圖
4.1.2 顏色矩
4.1.3 顏色集
4.1.4 顏色聚合向量
4.1.5 顏色相圖
4.2 圖像紋理特征
4.2.1 Tamura紋理特征
4.2.2 自回歸紋理模型
4.2.3 基于小波變換的紋理特征
4.2.4 其他紋理特征
4.3 圖像形狀特征
4.3.1 傅立葉形狀描述符
4.3.2 形狀無(wú)關(guān)矩
4.3.3 基于內(nèi)角的形狀特征
4.3.4 其他形狀特征
4.4 圖像空間關(guān)系特征
4.4.1 基于圖像分割的方法
4.4.2 基于圖像子塊的方法
4.5 圖像高維特征約減和索引
4.5.1 圖像高維特征縮減
4.5.2 圖像高維特征索引
第5章 圖像相似度比較方法
5.1 圖像特征相似度比較
5.1.1 歐拉距離
5.1.2 直方圖相交
5.1.3 二次式距離
5.1.4 馬氏距離
5.1.5 非幾何的相似度方法
5.2 圖像特征性能評(píng)價(jià)
5.2.1 顏色特征評(píng)價(jià)
5.2.2 紋理特征評(píng)價(jià)
第6章 圖像檢索中的相關(guān)反饋機(jī)制
6.1 相關(guān)反饋技術(shù)分類(lèi)
6.2 查詢向量相關(guān)反饋
6.2.1 文本檢索中的相關(guān)反饋
6.2.2 圖像檢索相關(guān)反饋模型
6.3 特征權(quán)重相關(guān)反饋
6.3.1 特征權(quán)重相關(guān)反饋結(jié)構(gòu)
6.3.2 圖像特征歸一化
6.3.3 圖像特征權(quán)重調(diào)整
6.4 其他圖像相關(guān)反饋技術(shù)
第7章 圖像檢索的現(xiàn)狀和未來(lái)
7.1 現(xiàn)有圖像檢索系統(tǒng)
7.2 圖像檢索未來(lái)發(fā)展趨勢(shì)
第3部分 視頻結(jié)構(gòu)化與視頻檢索
第8章 視頻內(nèi)容結(jié)構(gòu)化
8.1 視頻鏡頭邊緣檢測(cè)
8.1.1 絕對(duì)幀間差法
8.1.2 圖像像素差法
8.1.3 圖像數(shù)值差法
8.1.4 顏色直方圖法
8.1.5 壓縮域差法
8.1.6 矩不變量法
8.1.7 邊界跟蹤法
8.1.8 運(yùn)動(dòng)矢量法
8.2 鏡頭邊緣閾值確定
8.21 像素點(diǎn)變化閾值
8.2.2 鏡頭切分閾值
8.2.3 鏡頭漸變閾值
8.3 視頻關(guān)鍵幀提取
8.3.1 基于鏡頭邊界法
8.3.2 基于顏色特征法
8.3.3 基于運(yùn)動(dòng)分析法
8.3.4 基于聚類(lèi)的關(guān)鍵幀提取
8.4 視頻場(chǎng)景構(gòu)造
8.5 新聞?lì)愐曨l結(jié)構(gòu)化
8.5.1 視頻新聞內(nèi)容分析
8.5.2 現(xiàn)有新聞?lì)惙治鱿到y(tǒng)
第9章 視頻檢索和視頻反饋
9.1 視頻檢索
9.2 視頻相關(guān)反饋
9.2.1 視頻層次反饋
9.2.2 鏡頭層次的反饋
第10章 視頻檢索技術(shù)的現(xiàn)狀和未來(lái)
10.1 視頻檢索的應(yīng)用前景
10.2 現(xiàn)有視頻檢索系統(tǒng)
10.3 視頻檢索發(fā)展趨勢(shì)
第4部分 基于內(nèi)容的音頻檢索
第11章 音頻信號(hào)特征提取與表達(dá)
11.1 音頻時(shí)域特征提取
11.1.1 短時(shí)平均能量
11.1.2 過(guò)零率
11.1.3 線性預(yù)測(cè)系數(shù)
11.2 音頻頻域特征提取
11.2.1 傅立葉級(jí)數(shù)
11.2.2 復(fù)數(shù)形式傅立葉級(jí)數(shù)
11.2.3 傅立葉積分與連續(xù)頻譜
11.2.4 抽樣定理
11.2.5 連續(xù)信號(hào)的濾波與卷積
11.2.6 能譜特征
11.2.7 平均功率與功率譜特征
11.2.8 倒譜特征分析
11.2.9 LPC倒譜和Mel系數(shù)
11.2.10 其他頻域特征
11.3 音頻時(shí)頻特征提取
11.3.1 短時(shí)傅立葉變換
11.3.2 小波變換
11.3.3 連續(xù)小波變換
11.3.4 離散小波變換
11.3.5 小波特征系數(shù)提取
11.4 音頻例子特征提取
第12章 音頻分割與識(shí)別
12.1 音頻分割算法
12.1.1 音頻分層分割
12.1.2 基于壓縮域特征音頻分割
12.1.3 基于模板的音頻分割
12.2 音頻例子識(shí)別模型
12.2.1 基于隱馬爾可夫鏈音頻例子識(shí)別
12.2.2 基于增量支持向量機(jī)的音頻例子識(shí)別
12.2.3 基于最近特征線法的音頻例子識(shí)別
12.2.4 音頻例子混合識(shí)別模型
第13章 基于內(nèi)容的音頻檢索技術(shù)
13.1 相似音頻例子檢索
13.1.1 基于分類(lèi)模型的音頻例子檢索
13.1.2 基于模糊聚類(lèi)音頻例子檢索與音頻相關(guān)反饋
13.2 廣播新聞結(jié)構(gòu)化
13.3 音樂(lè)檢索
第14章 音頻檢索的現(xiàn)狀與未來(lái)
14.1 音頻檢索的類(lèi)別
14.2 音頻檢索未來(lái)與挑戰(zhàn)
第5部分 多媒體融合分析與檢索
第15章 多媒體融合分析
15.1 多媒質(zhì)特征融合
15.2 單媒質(zhì)交叉索引
15.3 單媒質(zhì)結(jié)果融合
第16章 多媒體融合檢索系統(tǒng)
16.1 文本與視覺(jué)信息融合檢索
16.2 結(jié)合文本和視覺(jué)的圖像檢索與反饋
16.3 基于多模態(tài)融合的視頻結(jié)構(gòu)化
16.3.1 多模態(tài)信息結(jié)構(gòu)化新聞?lì)愐曨l
16.3.2 音頻分析技術(shù)
16.3.3 視頻中的文本分析
16.4 基于壓縮域音頻特征的足球比賽精彩場(chǎng)景識(shí)別提取
16.4.1 足球比賽的聲音特征
16.4.2 思路和實(shí)現(xiàn)方法
16.4.3 結(jié)果分析和比較
16.5 基于支持向量機(jī)的視頻字幕提取
16.6 基于人臉對(duì)象的多媒體內(nèi)容分析
16.7 基于多模態(tài)融合的視頻場(chǎng)景分析
第6部分 網(wǎng)上多媒體信息檢索系統(tǒng)
第17章 面向WWW多媒體檢索系統(tǒng)
17.1 網(wǎng)絡(luò)信息收集Web Crawler
17.2 面向WWW的多媒體檢索系統(tǒng)Webscope-CBIR
17.3 網(wǎng)絡(luò)智能檢索界面
17.4 個(gè)性化WWW檢索
第18章 發(fā)展與挑戰(zhàn)
18.1 數(shù)字化圖書(shū)館
18.2 特征維數(shù)約減與變換
18.3 三維多媒體檢索
18.4 基于關(guān)鍵塊的圖像檢索
18.5 檢索復(fù)雜性度量
18.6 新一代媒體表示對(duì)軟件和硬件的影響
18.7 感知界自
18.8 多媒體推理
18.9 結(jié)論
附錄1 音頻處理工具HTK
附錄2 多媒體研究領(lǐng)域資料匯總
參考文獻(xiàn)
圖書(shū)封面
評(píng)論、評(píng)分、閱讀與下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版