出版時間:2008-3 出版社:科學出版社 作者:吳福朝 頁數(shù):374 字數(shù):572000
Tag標簽:無
前言
計算機視覺的研究目標是使計算機具有從二維圖像認知三維現(xiàn)實環(huán)境的能力,這種能力不僅使計算機能感知三維物體的結構與運動信息,而且能對它們進行識別與理解。自20世紀80年代初形成的Marr計算框架,以及隨后發(fā)展的其他計算理論框架,使得人們相信通過計算手段能實現(xiàn)從二維圖像對三維現(xiàn)實世界的感知。為適應不同計算理論框架和增強計算機視覺系統(tǒng)魯棒性的需要,研究人員通過堅持不懈的努力,引進了眾多數(shù)學方法和相應的計算方法。這些數(shù)學方法涉及代數(shù)學、幾何學、分析學、概率論以及眾多應用數(shù)學分支,這對初學者和從事多年研究的人員都感到非常困惑,真的需要這么多復雜的數(shù)學來解決計算機視覺問題嗎?是數(shù)學的無能還是我們沒有發(fā)現(xiàn)能解決計算機視覺問題的一種“好數(shù)學”?這正是計算機視覺的魅力所在,它吸引著眾多學者在該領域進行探索與研究?! ∪绻坝嬎隳軐崿F(xiàn)從二維圖像對三維現(xiàn)實世界的感知”是正確的話,則不論使用什么數(shù)學方法其目的都是為了做兩件事情,即為計算機視覺問題建立數(shù)學模型和模型估計與選擇。在建立模型過程中,需要反映計算機視覺的數(shù)學理論和需要描述模型的數(shù)學工具與方法;在模型估計與選擇中,需要數(shù)學計算技術,包括數(shù)值計算與統(tǒng)計計算。本書從以上提出的3個需要出發(fā),介紹三維計算機視覺所涉及的基本數(shù)學理論與方法。 本書由以下3篇構成: 第一篇:射影幾何。它是三維計算機視覺的數(shù)學理論基礎,主要內容包括:平面與空間射影幾何,攝像機幾何,兩視點幾何,自標定理論和三維重構理論?! 〉诙壕仃嚺c張量。它是描述三維計算機視覺模型的基本數(shù)學工具,同時也是模型估計線性算法的數(shù)學基礎,主要內容包括:矩陣分解,矩陣分析,張量代數(shù),運動與結構,多視點張量?! 〉谌耗P凸烙?。模型估計是三維計算機視覺的基本問題。本篇描述模型估計與選擇的基本數(shù)學理論與方法,主要內容包括:迭代優(yōu)化理論,參數(shù)估計理論,視覺模型估計的代數(shù)方法、幾何方法、魯棒方法與統(tǒng)計方法,以及模型選擇的數(shù)學方法?! ∩鲜?篇所涉及的數(shù)學內容是相對獨立的,但計算機視覺將它們組成一個有機的整體。
內容概要
本書由射影幾何、矩陣與張量、模型估計3篇組成,它們是三維計算機視覺所涉及的基本數(shù)學理論與方法。射影幾何學是三維計算機視覺的數(shù)學基礎,本書著重介紹射影幾何學及其在視覺中的應用,主要內容包括:平面與空間射影幾何,攝像機幾何,兩視點幾何,自標定技術和三維重構理論。矩陣與張量是描述和解決三維計算機視覺問題的必要數(shù)學工具,本書著重介紹與視覺有關的矩陣和張量理論及其應用,主要內容包括:矩陣分解,矩陣分析,張量代數(shù),運動與結構,多視點張量。模型估計是三維計算機視覺的基本問題,通常涉及變換或某種數(shù)學量的估計,本書著重介紹與視覺估計有關的數(shù)學理論與方法,主要內容包括:迭代優(yōu)化理論,參數(shù)估計理論,視覺估計的代數(shù)方法、幾何方法、魯棒方法和貝葉斯方法?! ”緯勺鳛榇髮W高年級本科生、研究生的教材。相關領域的研究人員也可以參考。
書籍目錄
第一篇 射影幾何 第1章 平面射影幾何 1.1 射影平面 1.1.1 射影平面 1.1.2 叉積 1.1.3 交比 1.2 二次曲線 1.2.1 矩陣表示 1.2.2 切點與切線 1.2.3 配極對應 1.2.4 對偶二次曲線 1.2.5 圓環(huán)點及其對偶 1.3 二維射影變換 1.3.1 二維射影變換 1.3. 2直線與二次曲線的變換規(guī)則 1.4 變換群與不變量 1.4.1 等距變換群 1.4.2 相似變換群 1.4.3 仿射變換群 1.4.4 射影變換群 第2章 空間射影幾何 2.1 射影空間 2.1.1 空間點 2.1.2 空間平面 2.1.3 空間直線 2.1.4 共線平面束的交比 2.2 三維射影變換 2.2.1 三維射影變換 2.2.2 平面與直線的變換規(guī)則 2.3 二次曲面與變換規(guī)則 2.3.1 基本性質 2.3.2 二次曲面的對偶 2.3.3 絕對二次曲線與絕對二次曲面 2.4 變換群與不變量 2.4.1 仿射變換群 2.4.2 相似變換群 2.4.3 等距變換群 2.4.4 二次曲面的分類 2.5 射影坐標系與射影坐標變換 第3章 攝像機幾何 3.1 攝像機模型 3.1.1 攝像機模型 3.1.2 攝像機矩陣的元素 3.1.3 攝像機矩陣估計 3.1.4 歐氏空間與射影空間 3.2 投影與反投影 3.2.1 空間點 3.2.2 空間直線 3.2.3 空間平面 3.2.4 二次曲線 3.2.5 二次曲面 3.3 恢復平面景物的結構 3.3.1 仿射結構 3.3.2 相似結構 3.3.3 絕對歐氏結構 第4章 兩視點幾何 4.1 基本矩陣 4.1.1 極幾何 4.1.2 基本矩陣 4.1.3 幾何解釋 4.2 單應矩陣 4.2.1 單應矩陣 4.2.2 與基本矩陣的關系 4.2.3 不動點與不動線 4.3 基本矩陣估計 4.3.1 8一點算法 4.3.2 最小點對應算法 4.4 恢復攝像機矩陣 4.4.1 射影相關 4.4.2 射影意義下的攝像機矩陣 …… 第5章 自標定理論 第6章 三維重構理論第二篇 矩陣與張量 第7章 正交對角化 第8章 矩陣分解 第9章 矩陣分析 第10章 張量代數(shù) 第11章 運動與結構 第12章 多視點張量第三篇 模型估計 第13章 迭代優(yōu)化 第14章 參數(shù)估計 第15章 代數(shù)方法 第16章 幾何方法 第17章 魯棒方法 第18章 模型選擇參考文獻
章節(jié)摘錄
第3章 攝像機幾何 三維計算機視覺的主要任務是利用三維物體的二維圖像所包含的信息,獲取三維物體的空間位置與形狀等幾何信息,并在此基礎上識別三維物體。圖像上每一點的亮度與物體某個表面點的反射光的強度有關,而圖像點在圖像平面上的位置僅與攝像機與空間物體的相對方位和攝像機的內部結構有關,攝像機的內部結構是由攝像機的內部參數(shù)所決定的。為了描述攝像機的成像幾何關系,需要對攝像機進行數(shù)學建模。本章所介紹的攝像機模型是計算機視覺中廣泛使用的針孔模型,通常也稱為線性模型。這種模型在數(shù)學上是三維空間到二維平面的中心投影,由一個3×4矩陣來描述,可以說這種模型是一個(退化的)射影變換,因此通常又稱它為射影攝像機。在本章,利用前兩章的射影幾何知識,給出攝像機關于空間點、直線、平面、二次曲線和二次曲面的投影性質,以及圖像平面點、直線與二次曲線的反投影性質。這些投影與反投影性質,是從圖像恢復物體三維幾何結構的基礎,尤其是絕對二次曲線與絕對二次曲面的投影性質。從本章可以看出,攝像機關于空間平面的投影是平面到平面的一個二維中心投影變換,因此可以使用第一章所介紹的二維射影變換的知識從平面景物圖像恢復它的幾何結構。對于空間物體,由于攝像機將三維物體表面投影到二維平面上,是一個(退化的)射影變換,因此不可能從三維物體的單幅圖像恢復其三維結構。能否從多幅圖像恢復物體的三維結構?這是三維計算機視覺中三維重構問題,將在第6章討論。 3.1 攝像機模型 3.1.1 攝像機模型 1.基本模型 攝像機的基本成像模型,通常稱為基本針孔模型,由三維空間到平面的中心投影變換所給出。令空間點Oc是投影中心,它到平面丌的距離為/。空間點Xc在平面X上的投影(或像)m真是以點oc為端點并經過點xc的射線與平面丌的交點,如圖3.1.1 (a)所示。平面,r稱為攝像機的像平面,點0稱為攝像機中心(或光心),f稱為攝像機的焦距,以點Oc為端點且垂直于像平面的射線稱為光軸或主軸,主軸與像平面的交點p稱為攝像機的主點。
編輯推薦
《計算機視覺中的數(shù)學方法》可作為大學高年級本科生、研究生的教材。相關領域的研究人員也可以參考。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載