媒體計算與內(nèi)容分析

出版時間:2012-1  出版社:清華大學(xué)出版社  作者:魏維 等編著  
Tag標(biāo)簽:無  

內(nèi)容概要

  媒體計算是指對視頻、音頻、圖像、圖形、文字等各類媒體信息進行內(nèi)容分析的計算理論、算法和應(yīng)用技術(shù),包括各類媒體信息的表示、內(nèi)容分析與識別算法等內(nèi)容。這本本書由魏維和魏敏編著,內(nèi)容覆蓋了媒體內(nèi)容分析與理解相關(guān)的理論和應(yīng)用技術(shù),共分為11章。第1章介紹現(xiàn)有媒體內(nèi)容分析與理解現(xiàn)狀;第2章主要介紹媒體計算理論及模型;第3章介紹了視頻內(nèi)容分析的內(nèi)容(視頻內(nèi)容分析的前處理);第4~6章主要介紹基于統(tǒng)計學(xué)理論的視音頻內(nèi)容分析,包括視覺語義分析與理解、音頻語義分析與理解以及視頻語義分析兩級多模式信息融合;第7~11章介紹基于認知機理,從場景整體語義的角度來理解、標(biāo)注和分析媒體內(nèi)容和語義概念,包括強依賴關(guān)聯(lián)關(guān)系提取、多標(biāo)記語義標(biāo)注、媒體場景顯著計算、媒體語義相似性計算、媒體顯著對象語義本體標(biāo)注方法等內(nèi)容。
  本書集原理、技術(shù)應(yīng)用為一體,同時有實驗分析和原型系統(tǒng)構(gòu)建,是作者多年來從事圖形圖像處理與內(nèi)容分析與理解的相關(guān)科研和承擔(dān)研究生相關(guān)課程教學(xué)工作的積累。本書主要讀者對象為從事圖形圖像處理的研究人員、大專院校計算機專業(yè)及相關(guān)專業(yè)師生、從事媒體信息處理研究與開發(fā)的科研人員和工程技術(shù)人員。

書籍目錄

第1章 緒論
1.1 引言
1.2 媒體視頻語義預(yù)處理
1.3 現(xiàn)有媒體內(nèi)容分析與理解現(xiàn)狀
1.3.1 機器學(xué)習(xí)模式分類方法
1.3.2 統(tǒng)計學(xué)習(xí)方法
1.3.3 基于規(guī)則推理的方法
1.3.4 結(jié)合特定領(lǐng)域特點的方法
1.3.5 結(jié)合語義語境和語義關(guān)系進行內(nèi)容理解的方法
1.3.6 結(jié)合語義知識理解媒體內(nèi)容的方法
1.3.7 其他方法
1.3.8 體育媒體標(biāo)注
1.4 視頻檢索評測
1.5 LSCOM與MediaMill
1.6 本章小結(jié)
第2章 媒體計算理論及模型
2.1 隱馬爾可夫模型
2.1.1 賭場真假骰子例子
2.1.2 模型描述
2.1.3 三個基本問題的解決方法
2.1.4 Baum—Welch重估公式的理論基礎(chǔ)
2.1.5 HMM在語音識別領(lǐng)域的應(yīng)用
2.2 支持向量機
2.2.1 二維平面中的分類實例
2.2.2 VC維
2.2.3 結(jié)構(gòu)風(fēng)險最小化
2.2.4 線性分類
2.2.5 核函數(shù)與支撐向量機
2.2.6 相關(guān)推導(dǎo)與講解
2.3 本體論與知識表示
2.3.1 本體基本理論
2.3.2 Ontology的描述語言
2.3.3 本體構(gòu)建
2.3.4 本體映射
2.3.5 已有的Ontology及其分類
2.3.6 WordNet
2.3.7 WordNet名詞組織形式
2.4 媒體內(nèi)容分析中的腦認知理論
2.4.1 顯著圖
2.4.2 顯著圖自動定位
2.4.3 視覺顯著生理機制
2.4.4 顯著性計算的簡單框架
2.4.5 神經(jīng)中樞與動作關(guān)聯(lián)
2.5 信息理論相似性定義
2.6 本章小結(jié)
第3章 視頻內(nèi)容分析
3.1 引言
3.2 鏡頭檢測分割
3.2.1 基于統(tǒng)計分布的漸變鏡頭檢測與分割
3.2.2 特征提取和測量準(zhǔn)則的建立
3.2.3 漸變鏡頭邊界檢測
3.2.4 實驗與分析
3.3 運動視頻對象分割
3.3.1 全局運動計算與補償
3.3.2 對象分割
3.3.3 實例實驗
3.4 低層特征提取
3.4.1 靜態(tài)可視特征
3.4.2 運動特征
3.4.3 音頻特征
3.4.4 實驗與分析結(jié)果
3.5 本章小結(jié)
第4章 視覺語義分析與理解
4.1 引言
4.2 基于時空注意力模型的視覺語義分析
4.2.1 注意力機制選擇顯著區(qū)域
4.2.2 可視基本對象識別
4.2.3 可視基本對象分類識別的特征選擇
4.2.4 實驗分析
4.3 具有多峰正態(tài)分布屬性的基本可視對象識別
4.3.1 貝葉斯相關(guān)理論及解決思路
4.3.2 定步長組合劃分方法
4.3.3 實驗及計算復(fù)雜度分析
4.3.4 實驗結(jié)論
4.4 高層視覺語義分析.
4.4.1 高層視覺語義模型構(gòu)建
4.4.2 關(guān)鍵幀策略與時間線語義語境約束線索
4.4.3 模型描述
4.4.4 時間語義的可觀察符號
4.4.5 實驗結(jié)果與分析
4.5 本章小結(jié)
第5章 音頻語義分析與理解
5.1 引言
5.2 基本聲音語義分析
5.2.1 模型選擇與描述
5.2.2 基本聲音語義識別系統(tǒng)解決方案
5.2.3 譜特征提取.
5.2.4 基本聲音語義模型訓(xùn)練
5.2.5 基本聲音語義識別
5.2.6 實驗與分析
5.3 音頻高層語義分析
5.3.1 音頻高層語義建模
5.3.2 音頻高層語義提取
5.3.3 實驗與分析
5.4 本章小結(jié)
第6章 視頻語義分析兩級多模式信息融合
6.1 引言
6.2 模式劃分與融合原理
6.3 融合模型與算法
6.4 實驗分析
6.5 本章小結(jié)
第7章 強依賴關(guān)聯(lián)關(guān)系提取
7.1 引言
7.2 強依賴關(guān)聯(lián)語義關(guān)系提取
7.2.1 語義概念間關(guān)聯(lián)關(guān)系形式化描述
7.2.2 視頻語義強依賴關(guān)聯(lián)關(guān)系提取算法
7.3 實驗與分析
7.3.1 視頻鏡頭強關(guān)聯(lián)依賴關(guān)系提取實驗
7.3.2 LSCOM數(shù)據(jù)集中強依賴關(guān)系提取實驗
7.4 本章小結(jié)
第8章 多標(biāo)記語義標(biāo)注
8.1 引言
8.2 多標(biāo)記學(xué)習(xí)研究現(xiàn)狀
8.3 多標(biāo)記學(xué)習(xí)
8.4 多標(biāo)記標(biāo)注方法
8.5 評價指標(biāo)
8.6 實驗與分析
8.7 本章小結(jié)
第9章 媒體場景顯著計算
9.1 引言
9.2 基于場景的顯著計算方法
9.3 靜態(tài)顯著計算
9.3.1 建立多尺度特征空間
9.3.2 提取早期視覺特征圖
9.3.3 顯著圖正規(guī)化處理
9.4 運動對象分割
9.5 動態(tài)顯著圖
9.6 脈沖耦合神經(jīng)網(wǎng)絡(luò)
9.6.1 脈沖耦合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
9.6.2 PCNN參數(shù)確定
9.6.3 PCNN動靜顯著融合
9.7 實驗與分析
9.7.1 場景動靜態(tài)顯著計算實驗
9.7.2 顯著計算對比實驗
9.8 本章小結(jié)
第10章 媒體語義相似性計算
10.1 引言
10.2 媒體語義概念間語義相似性計算
10.2.1 相似度相關(guān)概念
10.2.2 現(xiàn)有語義相似性計算方法
10.2.3 媒體語義相似性計算原理
10.2.4 媒體語義概念相似性度量
10.3 媒體場景語義相似性計算
10.4 實驗與分析
10.4.1 視覺特征直接計算語義相似性實驗
10.4.2 媒體語義相似性計算實驗
10.5 本章小結(jié)
第11章 媒體顯著對象語義本體標(biāo)注方法
11.1 引言
11.2 媒體顯著對象本體語義標(biāo)注
11.3 語義場景分割
11.4 靜態(tài)顯著對象分割
11.4.1 種子區(qū)域生長
11.4.2 注意力種子選擇
11.5 層次本體語義標(biāo)注
11.6 實驗與分析
11.6.1 層次語義標(biāo)簽標(biāo)注實驗
11.6.2 媒體顯著本體語義標(biāo)注實驗
11.7 本章小結(jié)
附錄A圖清單
附錄B表清單
附錄C縮略詞及中英文詞匯對照
參考文獻
后記

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    媒體計算與內(nèi)容分析 PDF格式下載


用戶評論 (總計1條)

 
 

  •   視頻內(nèi)容分析的探索性研究,視覺藝術(shù)定量化的嘗試,很受啟發(fā),值得一讀。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7