視頻對象分割提取的原理與應(yīng)用

出版時間:2009-3  出版社:科學出版社  作者:張兆楊  頁數(shù):214  

內(nèi)容概要

  視頻對象(VideoObject,VO)分割提取是視頻信號處理領(lǐng)域研究的前沿問題之一,在基于對象的視頻編碼、智能視頻監(jiān)控系統(tǒng)、人臉檢測、目標識別、視頻數(shù)據(jù)庫檢索和視頻摘要等領(lǐng)域有著廣泛的應(yīng)用。本書以視頻對象分割技術(shù)原理及應(yīng)用為主線,在介紹它所涉及的圖像、視頻信號處理基礎(chǔ)知識的基礎(chǔ)上,將其劃分為像素域視頻對象分割和壓縮域視頻對象分割方法。對于像素域視頻對象分割,根據(jù)目標應(yīng)用不同將其分為以分割準確度為目標的像素域視頻對象分割方法和以實時應(yīng)用為目標的像素域視頻對象分割方法兩類。對于壓縮域視頻對象分割,圍繞其關(guān)鍵技術(shù)--運動矢量的致密化和準確化,DCT系數(shù)的充分化進行闡述,并將其從傳統(tǒng)的MPEG-1/2壓縮域拓展到最新的視頻編碼標準H.264/AVC。本書對上述不同類型的分割方法,結(jié)合國際上的最新進展和作者多年來的研究成果進行了精辟的分析,由淺入深地給出了研究思路和解決方案及其實現(xiàn)的詳細步驟,并通過實驗給予驗證和性能評價。在此基礎(chǔ)上,示出了典型的應(yīng)用案例。

書籍目錄

前言第1章 視頻對象分割提取概述1.1 視頻對象分割提取的基本概念1.1.1 視頻對象的定義1.1.2 視頻分割與圖像分割的關(guān)系1.2 視頻對象分割方法的分類與應(yīng)用概況1.2.1 分割方法的分類1.2.2 應(yīng)用概況1.3 本書的結(jié)構(gòu)參考文獻第2章 像素域視頻對象分割基礎(chǔ)2.1 圖像的預(yù)處理和后處理技術(shù)2.1.1 圖像的濾波處理2.1.2 梯度算子2.1.3 數(shù)學形態(tài)學預(yù)/后處理2.2 基于空間域的分割2.2.1 基于區(qū)域的分割2.2.2 基于像素聚類的分割2.2.3 基于分水嶺變換的分割2.3 基于時間域的分割2.3.1 光流場法2.3.2 幀差法2.3.3 矢量場估計法2.4 基于時空融合的對象分割2.4.1 基于時空聚類的分割方法2.4.2 基于光流的運動對象分割方法2.4.3 基于對象跟蹤的分割方法2.5 視頻對象分割的性能評價2.5.1 空間準確度評價2.5.2 時間一致性評價參考文獻第3章 以分割準確度為目標的像素域視頻對象分割方法3.1 基于背景記錄和重建的VO自動分割3.1.1 基于背景記錄和變化檢測的V0分割3.1.2 基于背景重建的V0提取3.2 時空融合VO分割的典型方法3.2.1 融入時域信息的分水嶺V0分割的方案組成3.2.2 時間分割3.2.3 空間分割3.2.4 時/空融合分割3.2.5 實驗結(jié)果3.3 存在多個視頻對象時的分割方法3.3.1 基于貝葉斯估計的多視頻對象分割3.3.2 時空曲線演化的多個V0的分割3.4用戶輔助的交互式視頻對象分割3.4.1 智能剪及其改進方法的視頻對象分割與跟蹤3.4.2 基于種子區(qū)域合并的交互式視頻對象分割參考文獻第4章 以實時應(yīng)用為目標的像素域視頻對象分割方法4.1 細胞神經(jīng)網(wǎng)絡(luò)基礎(chǔ)4.1.1 細胞神經(jīng)網(wǎng)絡(luò)模型及其特點和結(jié)構(gòu)4.1.2 細胞神經(jīng)網(wǎng)絡(luò)的開發(fā)工具4.1.3 CNN模板的設(shè)計方法簡介4.1.4 CNN在圖像和視頻處理方面的研究現(xiàn)狀4.2 適合頭肩序列的基于CNN模板的VO分割4.2.1 頭肩序列的特點4.2.2 視頻對象分割算法4.2.3 分割算法的CNN實現(xiàn)及實驗結(jié)果4.3 人臉提取算法CNN實現(xiàn)4.3.1 算法概述4.3.2 模板結(jié)構(gòu)4.3.3 實驗結(jié)果4.4 基于光流和改進分水嶺分割算法的cNN實現(xiàn)4.4.1 以CNN實現(xiàn)算法的方案4.4.2 CNN模板設(shè)計4.4.3 實驗結(jié)果參考文獻第5章 壓縮域視頻對象分割5.1 基于壓縮域視頻對象分割的基本思路5.2 基于H.264壓縮域的視頻對象分割方法5.2.1 運動矢量場歸一化和累積5.2.2 全局運動補償5.2.3 累積運動矢量場分割5.2.4 基于匹配矩陣的時空分割5.2.5 實驗結(jié)果5.3 基于MPEG壓縮域的視頻對象分割方法5.3.1 提取DC+2AC圖的輪廓特征5.3.2 基于運動場的分割5.3.3 時空信息的融合5.3.4 對象邊緣的精細化5.3.5 實驗結(jié)果5.4 MPEG壓縮域視覺關(guān)注度對象分割5.4.1 場景紋理分析5.4.2 I幀運動矢量場處理5.4.3 基于DCT系數(shù)和運動矢量的統(tǒng)計區(qū)域生長5.4.4 關(guān)注度對象提取5.4.5 實驗結(jié)果參考文獻第6章 視頻對象分割技術(shù)的應(yīng)用6.1 基于視頻對象的查詢與檢索系統(tǒng)6.1.1 視頻場景的分割6.1.2 聚類與關(guān)鍵幀的提取6.1.3 視頻檢索數(shù)據(jù)庫的建立6.1.4 基于音頻的瀏覽系統(tǒng)6.2 視頻對象分割在智能監(jiān)控系統(tǒng)中的應(yīng)用6.2.1 智能監(jiān)控系統(tǒng)的組成6.2.2 運動對象檢測6.2.3 基于場景內(nèi)容的查詢6.3 可視化通信中的人臉對象分割技術(shù)6.3.1 基于二叉劃分樹的人臉分割方法6.3.2 人臉分割算法步驟6.4 視頻對象分割在影視資料修復(fù)中的應(yīng)用6.4.1 斑點損傷的修復(fù)算法6.4.2 基于時空結(jié)合的斑點損傷修復(fù)模型6.4.3 斑點修復(fù)的實驗結(jié)果6.5 壓縮視頻中運動交通車輛的檢測6.5.1 視頻對象平面檢測和檢索算法6.5.2 車輛檢測系統(tǒng)的實驗結(jié)果參考文獻

章節(jié)摘錄

  第1章 視頻對象分割提取概述  進入21世紀以來,隨著社會信息化的發(fā)展,人們對多媒體信息的需求不斷增長,其中視覺信息是極其重要的部分。視覺信息中視頻是指一個被觀察系統(tǒng)(如攝像機)所記錄的運動圖像序列,是人類直接從外界獲得的重要動態(tài)信息,但由于其數(shù)據(jù)量十分巨大,為便于傳輸和存儲,需要進行高效的壓縮編碼?! ‖F(xiàn)有的視頻壓縮標準,可分為兩類。第一類壓縮標準以JPEG、MPEG1/2、H.261/3/4等為代表,其主要特點是將像素和像素塊作為基本的編碼單元,這類編碼標準已在如數(shù)字電視、視頻通信和VCD/DVD等方面應(yīng)用成功。以基于對象(內(nèi)容)編碼為特點的第二類壓縮標準MPEG-4除能提供高效的壓縮編碼效率外,還能提供基于對象的交互功能,使用戶能夠訪問(搜索、瀏覽)和操作(剪貼、移動)場景中的各個對象,可更廣泛地延拓應(yīng)用范圍,因此也被稱為第二代編碼標準?! 』趯ο蟮木幋a和交互功能首先需要將場景或視頻序列中的各類對象(如運動的汽車、人等前景對象和靜止的房屋、樹木等背景對象)分割提取出來,但MPEG-4并沒有規(guī)定從視頻序列中分割出此類具有語義意義的視頻對象(videoobject,VO)的方法,而是對用戶開放,其目的是便于用戶針對具體應(yīng)用來設(shè)計特定的視頻對象分割算法。然而,語義視頻對象分割與早期的圖像分割相比更是一項挑戰(zhàn)性的難題,為此自MPEG一4標準誕生后的10年來,國內(nèi)外包括各大公司、高校和各類研究機構(gòu)在內(nèi)的學者和研究人員已進行深入、廣泛的研究。目前,盡管還不很完善,但已進入應(yīng)用階段,而且應(yīng)用領(lǐng)域已遠遠超越了原先僅作為便于高效編碼和對象交互功能的范圍。

圖書封面

評論、評分、閱讀與下載


    視頻對象分割提取的原理與應(yīng)用 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7