視頻對(duì)象分割提取的原理與應(yīng)用

出版時(shí)間：2009-3 出版社：科學(xué)出版社作者：張兆楊頁數(shù)：214

內(nèi)容概要

　　視頻對(duì)象(VideoObject，VO)分割提取是視頻信號(hào)處理領(lǐng)域研究的前沿問題之一，在基于對(duì)象的視頻編碼、智能視頻監(jiān)控系統(tǒng)、人臉檢測(cè)、目標(biāo)識(shí)別、視頻數(shù)據(jù)庫檢索和視頻摘要等領(lǐng)域有著廣泛的應(yīng)用。本書以視頻對(duì)象分割技術(shù)原理及應(yīng)用為主線，在介紹它所涉及的圖像、視頻信號(hào)處理基礎(chǔ)知識(shí)的基礎(chǔ)上，將其劃分為像素域視頻對(duì)象分割和壓縮域視頻對(duì)象分割方法。對(duì)于像素域視頻對(duì)象分割，根據(jù)目標(biāo)應(yīng)用不同將其分為以分割準(zhǔn)確度為目標(biāo)的像素域視頻對(duì)象分割方法和以實(shí)時(shí)應(yīng)用為目標(biāo)的像素域視頻對(duì)象分割方法兩類。對(duì)于壓縮域視頻對(duì)象分割，圍繞其關(guān)鍵技術(shù)--運(yùn)動(dòng)矢量的致密化和準(zhǔn)確化，DCT系數(shù)的充分化進(jìn)行闡述，并將其從傳統(tǒng)的MPEG-1/2壓縮域拓展到最新的視頻編碼標(biāo)準(zhǔn)H.264/AVC。本書對(duì)上述不同類型的分割方法，結(jié)合國際上的最新進(jìn)展和作者多年來的研究成果進(jìn)行了精辟的分析，由淺入深地給出了研究思路和解決方案及其實(shí)現(xiàn)的詳細(xì)步驟，并通過實(shí)驗(yàn)給予驗(yàn)證和性能評(píng)價(jià)。在此基礎(chǔ)上，示出了典型的應(yīng)用案例。

書籍目錄

前言第1章　視頻對(duì)象分割提取概述1.1　視頻對(duì)象分割提取的基本概念1.1.1　視頻對(duì)象的定義1.1.2　視頻分割與圖像分割的關(guān)系1.2　視頻對(duì)象分割方法的分類與應(yīng)用概況1.2.1　分割方法的分類1.2.2　應(yīng)用概況1.3　本書的結(jié)構(gòu)參考文獻(xiàn)第2章　像素域視頻對(duì)象分割基礎(chǔ)2.1　圖像的預(yù)處理和后處理技術(shù)2.1.1　圖像的濾波處理2.1.2　梯度算子2.1.3　數(shù)學(xué)形態(tài)學(xué)預(yù)／后處理2.2　基于空間域的分割2.2.1　基于區(qū)域的分割2.2.2　基于像素聚類的分割2.2.3　基于分水嶺變換的分割2.3　基于時(shí)間域的分割2.3.1　光流場(chǎng)法2.3.2　幀差法2.3.3　矢量場(chǎng)估計(jì)法2.4　基于時(shí)空融合的對(duì)象分割2.4.1　基于時(shí)空聚類的分割方法2.4.2　基于光流的運(yùn)動(dòng)對(duì)象分割方法2.4.3　基于對(duì)象跟蹤的分割方法2.5　視頻對(duì)象分割的性能評(píng)價(jià)2.5.1　空間準(zhǔn)確度評(píng)價(jià)2.5.2　時(shí)間一致性評(píng)價(jià)參考文獻(xiàn)第3章　以分割準(zhǔn)確度為目標(biāo)的像素域視頻對(duì)象分割方法3.1　基于背景記錄和重建的VO自動(dòng)分割3.1.1　基于背景記錄和變化檢測(cè)的V0分割3.1.2　基于背景重建的V0提取3.2　時(shí)空融合VO分割的典型方法3.2.1　融入時(shí)域信息的分水嶺V0分割的方案組成3.2.2　時(shí)間分割3.2.3　空間分割3.2.4　時(shí)／空融合分割3.2.5　實(shí)驗(yàn)結(jié)果3.3　存在多個(gè)視頻對(duì)象時(shí)的分割方法3.3.1　基于貝葉斯估計(jì)的多視頻對(duì)象分割3.3.2　時(shí)空曲線演化的多個(gè)V0的分割3.4用戶輔助的交互式視頻對(duì)象分割3.4.1　智能剪及其改進(jìn)方法的視頻對(duì)象分割與跟蹤3.4.2　基于種子區(qū)域合并的交互式視頻對(duì)象分割參考文獻(xiàn)第4章　以實(shí)時(shí)應(yīng)用為目標(biāo)的像素域視頻對(duì)象分割方法4.1　細(xì)胞神經(jīng)網(wǎng)絡(luò)基礎(chǔ)4.1.1　細(xì)胞神經(jīng)網(wǎng)絡(luò)模型及其特點(diǎn)和結(jié)構(gòu)4.1.2　細(xì)胞神經(jīng)網(wǎng)絡(luò)的開發(fā)工具4.1.3　CNN模板的設(shè)計(jì)方法簡介4.1.4　CNN在圖像和視頻處理方面的研究現(xiàn)狀4.2　適合頭肩序列的基于CNN模板的VO分割4.2.1　頭肩序列的特點(diǎn)4.2.2　視頻對(duì)象分割算法4.2.3　分割算法的CNN實(shí)現(xiàn)及實(shí)驗(yàn)結(jié)果4.3　人臉提取算法CNN實(shí)現(xiàn)4.3.1　算法概述4.3.2　模板結(jié)構(gòu)4.3.3　實(shí)驗(yàn)結(jié)果4.4　基于光流和改進(jìn)分水嶺分割算法的cNN實(shí)現(xiàn)4.4.1　以CNN實(shí)現(xiàn)算法的方案4.4.2　CNN模板設(shè)計(jì)4.4.3　實(shí)驗(yàn)結(jié)果參考文獻(xiàn)第5章　壓縮域視頻對(duì)象分割5.1　基于壓縮域視頻對(duì)象分割的基本思路5.2　基于H.264壓縮域的視頻對(duì)象分割方法5.2.1　運(yùn)動(dòng)矢量場(chǎng)歸一化和累積5.2.2　全局運(yùn)動(dòng)補(bǔ)償5.2.3　累積運(yùn)動(dòng)矢量場(chǎng)分割5.2.4　基于匹配矩陣的時(shí)空分割5.2.5　實(shí)驗(yàn)結(jié)果5.3　基于MPEG壓縮域的視頻對(duì)象分割方法5.3.1　提取DC+2AC圖的輪廓特征5.3.2　基于運(yùn)動(dòng)場(chǎng)的分割5.3.3　時(shí)空信息的融合5.3.4　對(duì)象邊緣的精細(xì)化5.3.5　實(shí)驗(yàn)結(jié)果5.4　MPEG壓縮域視覺關(guān)注度對(duì)象分割5.4.1　場(chǎng)景紋理分析5.4.2　I幀運(yùn)動(dòng)矢量場(chǎng)處理5.4.3　基于DCT系數(shù)和運(yùn)動(dòng)矢量的統(tǒng)計(jì)區(qū)域生長5.4.4　關(guān)注度對(duì)象提取5.4.5　實(shí)驗(yàn)結(jié)果參考文獻(xiàn)第6章　視頻對(duì)象分割技術(shù)的應(yīng)用6.1　基于視頻對(duì)象的查詢與檢索系統(tǒng)6.1.1　視頻場(chǎng)景的分割6.1.2　聚類與關(guān)鍵幀的提取6.1.3　視頻檢索數(shù)據(jù)庫的建立6.1.4　基于音頻的瀏覽系統(tǒng)6.2　視頻對(duì)象分割在智能監(jiān)控系統(tǒng)中的應(yīng)用6.2.1　智能監(jiān)控系統(tǒng)的組成6.2.2　運(yùn)動(dòng)對(duì)象檢測(cè)6.2.3　基于場(chǎng)景內(nèi)容的查詢6.3　可視化通信中的人臉對(duì)象分割技術(shù)6.3.1　基于二叉劃分樹的人臉分割方法6.3.2　人臉分割算法步驟6.4　視頻對(duì)象分割在影視資料修復(fù)中的應(yīng)用6.4.1　斑點(diǎn)損傷的修復(fù)算法6.4.2　基于時(shí)空結(jié)合的斑點(diǎn)損傷修復(fù)模型6.4.3　斑點(diǎn)修復(fù)的實(shí)驗(yàn)結(jié)果6.5　壓縮視頻中運(yùn)動(dòng)交通車輛的檢測(cè)6.5.1　視頻對(duì)象平面檢測(cè)和檢索算法6.5.2　車輛檢測(cè)系統(tǒng)的實(shí)驗(yàn)結(jié)果參考文獻(xiàn)

章節(jié)摘錄

　　第1章　視頻對(duì)象分割提取概述　　進(jìn)入21世紀(jì)以來，隨著社會(huì)信息化的發(fā)展，人們對(duì)多媒體信息的需求不斷增長，其中視覺信息是極其重要的部分。視覺信息中視頻是指一個(gè)被觀察系統(tǒng)（如攝像機(jī)）所記錄的運(yùn)動(dòng)圖像序列，是人類直接從外界獲得的重要?jiǎng)討B(tài)信息，但由于其數(shù)據(jù)量十分巨大，為便于傳輸和存儲(chǔ)，需要進(jìn)行高效的壓縮編碼。　　現(xiàn)有的視頻壓縮標(biāo)準(zhǔn)，可分為兩類。第一類壓縮標(biāo)準(zhǔn)以JPEG、MPEG1／2、H.261／3／4等為代表，其主要特點(diǎn)是將像素和像素塊作為基本的編碼單元，這類編碼標(biāo)準(zhǔn)已在如數(shù)字電視、視頻通信和VCD／DVD等方面應(yīng)用成功。以基于對(duì)象（內(nèi)容）編碼為特點(diǎn)的第二類壓縮標(biāo)準(zhǔn)MPEG-4除能提供高效的壓縮編碼效率外，還能提供基于對(duì)象的交互功能，使用戶能夠訪問（搜索、瀏覽）和操作（剪貼、移動(dòng)）場(chǎng)景中的各個(gè)對(duì)象，可更廣泛地延拓應(yīng)用范圍，因此也被稱為第二代編碼標(biāo)準(zhǔn)。　　基于對(duì)象的編碼和交互功能首先需要將場(chǎng)景或視頻序列中的各類對(duì)象（如運(yùn)動(dòng)的汽車、人等前景對(duì)象和靜止的房屋、樹木等背景對(duì)象）分割提取出來，但MPEG-4并沒有規(guī)定從視頻序列中分割出此類具有語義意義的視頻對(duì)象（videoobject，VO）的方法，而是對(duì)用戶開放，其目的是便于用戶針對(duì)具體應(yīng)用來設(shè)計(jì)特定的視頻對(duì)象分割算法。然而，語義視頻對(duì)象分割與早期的圖像分割相比更是一項(xiàng)挑戰(zhàn)性的難題，為此自MPEG一4標(biāo)準(zhǔn)誕生后的10年來，國內(nèi)外包括各大公司、高校和各類研究機(jī)構(gòu)在內(nèi)的學(xué)者和研究人員已進(jìn)行深入、廣泛的研究。目前，盡管還不很完善，但已進(jìn)入應(yīng)用階段，而且應(yīng)用領(lǐng)域已遠(yuǎn)遠(yuǎn)超越了原先僅作為便于高效編碼和對(duì)象交互功能的范圍。

圖書封面

評(píng)論、評(píng)分、閱讀與下載

還沒讀過(58)
勉強(qiáng)可看(424)
一般般(724)
內(nèi)容豐富(3005)
強(qiáng)力推薦(246)

視頻對(duì)象分割提取的原理與應(yīng)用 PDF格式下載

用戶評(píng)論 (總計(jì)0條)

視頻對(duì)象分割提取的原理與應(yīng)用

用戶評(píng)論 (總計(jì)0條)

推薦圖書

相關(guān)圖書