出版時(shí)間:2012-1 出版社:清華大學(xué)出版社 作者:Richard Szeliski 頁數(shù):全2冊(cè) 字?jǐn)?shù):1020000 譯者:艾海舟,興軍亮
Tag標(biāo)簽:無
內(nèi)容概要
《計(jì)算機(jī)視覺:算法與應(yīng)用》探索了用于分析和解釋圖像的各種常用技術(shù),描述了具有一定挑戰(zhàn)性的視覺應(yīng)用方面的成功實(shí)例,兼顧專業(yè)的醫(yī)學(xué)成像和圖像編輯與拼接之類有趣的大眾應(yīng)用,以便學(xué)生能夠?qū)⑵鋺?yīng)用于自己的照片和視頻,從中獲得成就感和樂趣?!队?jì)算機(jī)視覺:算法與應(yīng)用》從科學(xué)的角度介紹基本的視覺問題,將成像過程的物理模型公式化,然后在此基礎(chǔ)上生成對(duì)場(chǎng)景的逼真描述。作者還運(yùn)用統(tǒng)計(jì)模型來分析和運(yùn)用嚴(yán)格的工程方法來解決這些問題。
《計(jì)算機(jī)視覺:算法與應(yīng)用》作為本科生和研究生“計(jì)算機(jī)視覺”課程的理想教材,適合計(jì)算機(jī)和電子工程專業(yè)學(xué)生使用,重點(diǎn)介紹現(xiàn)實(shí)中行之有效的基本技術(shù),通過大量應(yīng)用和練習(xí)來鼓勵(lì)學(xué)生大膽創(chuàng)新。此外,本書的精心設(shè)計(jì)和編排,使其可以作為計(jì)算機(jī)視覺領(lǐng)域中一本獨(dú)特的基礎(chǔ)技術(shù)參考和最新研究成果文獻(xiàn)。
作者簡(jiǎn)介
Richard
Szeliski博士,計(jì)算機(jī)視覺領(lǐng)域的大師級(jí)人物,Szeliski博士在計(jì)算機(jī)視覺研究方面有25年以上的豐富經(jīng)驗(yàn),先后任職于DEC和微軟研究院1996年,他在微軟研究院任職期間,提出一種基于運(yùn)動(dòng)的全景圖像拼接模型,采用L-M算法,通過求圖像間的幾何變換關(guān)系來進(jìn)行圖像匹配,此方法是圖像拼接領(lǐng)域的經(jīng)典算法,Richard
Szel iski也因此成為圖像拼接領(lǐng)域的奠基人。
艾海舟博士,清華大學(xué)計(jì)算機(jī)系教授,IEEE高級(jí)會(huì)員和IEEE
CS會(huì)員。先后于1985年、1988年和1991年獲得清華大學(xué)工學(xué)學(xué)士、碩士和博士學(xué)位,博士論文榮獲“1992年度清華大學(xué)優(yōu)秀博士論文”獎(jiǎng)1994-1996年,在比利時(shí)布魯塞爾自由大學(xué)做博士后研究。目前,在清華大學(xué)教授“數(shù)字圖像處理”和“計(jì)算機(jī)視覺”課程,研究方向?yàn)橛?jì)算機(jī)視覺與模式識(shí)別。發(fā)表學(xué)術(shù)論文80余篇。
書籍目錄
第1章 概述
1.1 什么是計(jì)算機(jī)視覺?
1.2 簡(jiǎn)史
1.3 本書概述
1.4 課程大綱樣例
1.5 標(biāo)記法說明
1.6 擴(kuò)展閱讀
第2章 圖像形成
2.1 幾何基元和變換
2.1.1 幾何基元
2.1.2 2D變換
2.1.3 3D變換
2.1.4 3D旋轉(zhuǎn)
2.1.5 3D到2D投影
2.1.6 鏡頭畸變
2.2 光度測(cè)定學(xué)的圖像形成
2.2.1 照明
2.2.2 反射和陰影
2.2.3 光學(xué)
2.3 數(shù)字?jǐn)z像機(jī)
2.3.1 采樣與混疊
2.3.2 色彩
2.3.3 壓縮
2.4 補(bǔ)充閱讀
2.5 習(xí)題
第3章 圖像處理
3.1 點(diǎn)算子
3.1.1 像素變換
3.1.2 彩色變換
3.1.3 合成與摳圖
3.1.4 直方圖均衡化
3.1.5 應(yīng)用:色調(diào)調(diào)整
3.2 線性濾波
3.2.1 可分離的濾波
3.2.2 線性濾波示例
3.2.3 帶通和導(dǎo)向?yàn)V波器
3.3 更多的鄰域算子
3.3.1 非線性濾波
3.3.2 形態(tài)學(xué)
3.3.3 距離變換
3.3.4 連通量
3.4 傅里葉變換
3.4.1 傅里葉變換對(duì)
3.4.2 二維傅里葉變換
3.4.3 維納濾波
3.4.4 應(yīng)用:銳化,模糊和去噪
3.5 金字塔與小波
3.5.1 插值
3.5.2 降采樣
3.5.3 多分辨率表達(dá)
3.5.4 小波
3.5.5 應(yīng)用:圖像融合
3.6 幾何變換
3.6.1 參數(shù)化變換
3.6.2 基于網(wǎng)格的卷繞
3.6.3 應(yīng)用:基于特征的變形
3.7 全局優(yōu)化
3.7.1 正則化
3.7.2 馬爾科夫隨機(jī)場(chǎng)
3.7.3 應(yīng)用:圖像的恢復(fù)
3.8 補(bǔ)充閱讀
3.9 習(xí)題
第4章 特征檢測(cè)與匹配
4.1 點(diǎn)和塊
4.1.1 特征檢測(cè)器
4.1.2 特征描述子
4.1.3 特征匹配
4.1.4 特征跟蹤
4.1.5 應(yīng)用:表演驅(qū)動(dòng)的動(dòng)畫
4.2 邊緣
4.2.1 邊緣檢測(cè)
4.2.2 邊緣連接
4.2.3 應(yīng)用:邊緣編輯和增強(qiáng)
4.3 線條
4.3.1 逐次近似
4.3.2 Hough變換
4.3.3 消失點(diǎn)
4.3.4 應(yīng)用:矩形檢測(cè)
4.4 擴(kuò)展閱讀
4.5 習(xí)題
第5章 分割
5.1 活動(dòng)輪廓
5.1.1 蛇行
5.1.2 動(dòng)態(tài)蛇行和CONDENSATION
5.1.3 剪刀
5.1.4 水平集
5.1.5 應(yīng)用:輪廓跟蹤和轉(zhuǎn)描機(jī)
5.2 分裂與歸并
5.2.1 分水嶺
5.2.2 區(qū)域分裂(區(qū)分式聚類)
5.2.3 區(qū)域歸并(凝聚式聚類)
5.2.4 基于圖的分割
5.2.5 概率聚集
5.3 均值移位和模態(tài)發(fā)現(xiàn)
5.3.1 k-均值和高斯混合
5.3.2 均值移位
5.4 規(guī)范圖割
5.5 圖割和基于能量的方法
5.6 補(bǔ)充閱讀
5.7 習(xí)題
第6章 基于特征的配準(zhǔn)
6.1 基于2D和3D特征的配準(zhǔn)
6.1.1 使用最小二乘的2D配準(zhǔn)
6.1.2 應(yīng)用:全景圖
6.1.3 迭代算法
6.1.4 魯棒最小二乘和RANSAC
6.1.5 3D配準(zhǔn)
6.2 姿態(tài)估計(jì)
6.2.1 線性算法
6.2.2 迭代算法
6.2.3 應(yīng)用:增強(qiáng)現(xiàn)實(shí)
6.3 幾何內(nèi)參數(shù)標(biāo)定
6.3.1 標(biāo)定模式
6.3.2 消失點(diǎn)
6.3.3 應(yīng)用:?jiǎn)我晥D測(cè)量學(xué)
6.3.4 旋轉(zhuǎn)運(yùn)動(dòng)
6.3.5 徑向畸變
6.4 補(bǔ)充閱讀
6.5 習(xí)題
第7章 由運(yùn)動(dòng)到結(jié)構(gòu)
7.1 三角測(cè)量
7.2 二視圖由運(yùn)動(dòng)到結(jié)構(gòu)
7.2.1 投影(未標(biāo)定的)重建
7.2.2 自標(biāo)定
7.2.3 應(yīng)用:視圖變形
7.3 因子分解
7.3.1 透視與投影因子分解
7.3.2 應(yīng)用:稀疏3D模型提取
……
第8章 稠密運(yùn)動(dòng)估計(jì)
第9章 圖像拼接
第10章 計(jì)算攝影學(xué)
第11章 立體視覺對(duì)應(yīng)
第12章 3D重建
第13章 基于圖像的繪制
第14章 識(shí)別
第15章 結(jié)語
附錄A 線性代數(shù)與數(shù)值方法
附錄B 貝葉斯建模與推斷
附錄C 補(bǔ)充材料
詞匯表
章節(jié)摘錄
版權(quán)頁: 插圖: 特征匹配驗(yàn)證和緊致化 一旦我們得到一些假設(shè)的(推斷的)匹配,往往可以用幾何配準(zhǔn)來驗(yàn)證哪些匹配是“內(nèi)點(diǎn)”(inlier),哪些是“外點(diǎn)”(outlier)。比如,如果我們預(yù)計(jì)出整個(gè)圖像在匹配視角上平移或者旋轉(zhuǎn)了,我們可以擬合出一個(gè)全局幾何變換并僅保留那些與估計(jì)出來的變換足夠接近的特征。這個(gè)選擇一小部分種子匹配然后驗(yàn)證更大集合的過程叫“隨機(jī)采樣”(random sampling)或者RANSAC(6.1.4節(jié))。一旦建立初始的對(duì)應(yīng)集合,一些系統(tǒng)就尋找額外的對(duì)應(yīng),比如,通過在極線上(11.1節(jié))尋找額外的對(duì)應(yīng)或者基于全局變換在估計(jì)位置的附近區(qū)域?qū)ふ覍?duì)應(yīng)。這些主題將在6.1,11.2,和14.3.1節(jié)中進(jìn)一步討論。 4.1.4特征跟蹤 在所有候選圖像中獨(dú)立地尋找特征然后將它們進(jìn)行匹配,另一種替代策略是,在第一幅圖像中尋找可能的特征位置集合,然后在后續(xù)的圖像中搜索它們的對(duì)應(yīng)位置。這類“這類”先檢測(cè)后跟蹤”(detect and track)的方法在視頻跟蹤應(yīng)用中使用得非常廣泛,這里,所期望的相鄰幀之間的運(yùn)動(dòng)和表觀的變形比較小。選擇好特征來跟蹤的過程和選擇好特征來進(jìn)行更一般的識(shí)別應(yīng)用緊密相關(guān)。在實(shí)際中,那些在兩個(gè)方向上梯度值均大的區(qū)域,也就是,自相關(guān)矩陣擁有大的特征值的區(qū)域(4.8),提供了可用于尋找對(duì)應(yīng)的穩(wěn)定的位置(Shi and Tomasi 1994)。 在后續(xù)的幀中,搜索那些平方差小的對(duì)應(yīng)圖像塊區(qū)域(4.1)通常很高效。但是,如果圖像的光照發(fā)生了變化,明確地補(bǔ)償這些變化(8.9)或者使用規(guī)范化互相關(guān)(normalized cross—correlation)(8.11)就可能很有用。如果搜索范圍很大,使用一種分層搜索策略常常更有效,它使用低分辨率下的匹配來提供較好的初始猜測(cè)值,因此加速了搜索過程(8.1.1節(jié))。這種策略的替代策略包括了解被跟蹤塊的表觀應(yīng)該是什么,然后在預(yù)測(cè)的位置附近搜索它(Avidan 2001;Jurie and Dhome 2002:Williams,Blake,and Cipolla 2003)。這些主題都將在8.1.3節(jié)中詳細(xì)描述。 如果特征需要在較長(zhǎng)的圖像序列中進(jìn)行跟蹤,它們的表觀就會(huì)發(fā)生較大的變化。這樣就需要決定是繼續(xù)使用最初檢測(cè)到的圖像塊(特征)進(jìn)行匹配,還是在后續(xù)幀的匹配位置上重新采樣特征。
編輯推薦
《計(jì)算機(jī)視覺:算法與應(yīng)用》編輯推薦:作為人,我們可以輕松感知周圍的三維世界相比之下,不管計(jì)算機(jī)視覺在近年來已經(jīng)取得多么令人矚目的成果,但要讓計(jì)算機(jī)能像兩歲小孩那樣解釋和理解圖像,卻仍然是一個(gè)遙不可及的夢(mèng)想。為什么計(jì)算機(jī)視覺會(huì)成為如此富有挑戰(zhàn)性的難題?它當(dāng)前發(fā)展到了哪個(gè)階段?圍繞著這些問題,《計(jì)算機(jī)視覺——算法與應(yīng)用》探索了用于分析和解釋圖像的各種常用方法,描述了42個(gè)成功的視覺應(yīng)用實(shí)例,既有醫(yī)學(xué)成像之類的專業(yè)應(yīng)用,又有圖像編輯和拼接之類有趣的大眾應(yīng)用。這種精心的編排和設(shè)計(jì)有利于學(xué)生將這些看似高深的技術(shù)應(yīng)用于自己的照片和視頻.從而在趣味橫生的動(dòng)手實(shí)踐中獲得成就感?!队?jì)算機(jī)視覺:算法與應(yīng)用》主題和特色:編排結(jié)構(gòu)有利于活躍課堂氣氛,適合面向項(xiàng)目的課程,針對(duì)各種特定課程提供了《計(jì)算機(jī)視覺:算法與應(yīng)用》使用提示。各章末尾的習(xí)題著重強(qiáng)調(diào)對(duì)算法的測(cè)試,重點(diǎn)包含大量針對(duì)小型期中課題的建議。附錄中提供額外的補(bǔ)充材料和更詳細(xì)的數(shù)學(xué)知識(shí)介紹,包括線性代數(shù)、數(shù)值方法和貝葉斯估計(jì)理論。完整的參考文獻(xiàn)和各章的補(bǔ)充閱讀,全面覆蓋各個(gè)子領(lǐng)域的最新研究進(jìn)展和成果。配套網(wǎng)站提供豐富的課程補(bǔ)充材料。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載