出版時間:2010-4 出版社:人民郵電 作者:張錚//王艷平//薛桂香 頁數(shù):544
Tag標(biāo)簽:無
前言
圖像處理與機器視覺是當(dāng)前計算機科學(xué)的一個熱門研究方向,它應(yīng)用廣泛,發(fā)展前景樂觀。近年來,伴隨著人工智能、模式識別學(xué)科以及人機智能接口技術(shù)的飛速發(fā)展,機器視覺的研究正在不斷升溫——從日常生活中與我們息息相關(guān)的光學(xué)字符識別(OCR)和汽車自動駕駛,到醫(yī)學(xué)應(yīng)用中的病灶檢測與分析,再到未來人機智能交互領(lǐng)域中的人臉識別,情感計算,等等。而圖像處理是機器視覺研究中必不可少的圖像預(yù)處理環(huán)節(jié),是我們需要掌握的首要技術(shù)。和圖像相關(guān)的東西往往容易引起計算機初學(xué)者的興趣,我在讀大學(xué)本科的時候就覺得能讓計算機理解所“看”到的東西是一件非常神秘和令人興奮的事情;但同時它的理論性較強,門檻較高,在各個高校中,這門課程大多也是作為計算機專業(yè)研究生的選修課程。要理解該領(lǐng)域的知識,讀者需要具有一定的數(shù)學(xué)基礎(chǔ),除此之外還涉及到信號處理、統(tǒng)計分析、模式識別和機器學(xué)習(xí)等專業(yè)領(lǐng)域知識,因此令很多人望而卻步。其實“難以理解”關(guān)鍵在于缺乏必要的先序知識,這才是難以跨越的鴻溝。我們在撰寫本書過程中,對于可能造成理解困難的地方,均盡可能地給出了必要的先序知識,深入淺出,盡量定性地進(jìn)行描述;對于那些并不一目了然的結(jié)論均給出了思路和解釋,必要的還在附錄中提供了證明;對于某些非常專業(yè)已經(jīng)超過本書討論范圍的相關(guān)知識則在最后給出了參考文獻(xiàn),供有興趣的讀者進(jìn)一步學(xué)習(xí)和研究。本書的宗旨是在向讀者介紹知識的同時,培養(yǎng)讀者的思維方法,使讀者知其然還要知其所以然,并在解決實際問題中能有自己的想法。
內(nèi)容概要
本書將理論知識、科學(xué)研究和工程實踐有機結(jié)合起來,介紹了數(shù)字圖像處理和識別技術(shù)的方方面面,內(nèi)容包括圖像的點運算、幾何變換、空域和頻域濾波、圖像復(fù)原、形態(tài)學(xué)處理、圖像分割以及圖像特征提取。本書還對于機器視覺進(jìn)行了前導(dǎo)性的探究,重點介紹了兩種在工程技術(shù)領(lǐng)域非常流行的分類技術(shù)——人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(SVM),并在配套給出的識別案例中直擊光學(xué)字符識別(OCR)和人臉識別兩大熱點問題。 全書結(jié)構(gòu)緊湊,內(nèi)容深入淺出,講解圖文并茂,適合于計算機、通信和自動化等相關(guān)專業(yè)的本科生、研究生以及工作在圖像處理和識別領(lǐng)域一線的廣大工程技術(shù)人員閱讀。
書籍目錄
第0章 數(shù)字圖像處理概述 0.1 數(shù)字圖像 0.1.1 什么是數(shù)字圖像 0.1.2 數(shù)字圖像的顯示 0.1.3 數(shù)字圖像的分類 0.1.4 數(shù)字圖像的實質(zhì) 0.1.5 數(shù)字圖像的表示 0.1.6 圖像的空間和灰度級分辨率 0.2 數(shù)字圖像處理與識別 0.2.1 從圖像處理到圖像識別 0.2.2 什么是機器視覺 0.2.3 數(shù)字圖像處理和識別的應(yīng)用實例 0.3 數(shù)字圖像處理的預(yù)備知識 0.3.1 鄰接性、連通性、區(qū)域和邊界 0.3.2 距離度量的幾種方法 0.3.3 基本的圖像操作 第1章 MATLAB圖像處理編程基礎(chǔ) 1.1 Matlab操作簡介 1.1.1 Matlab軟件環(huán)境 1.1.2 文件操作 1.1.3 在線幫助的使用 1.1.4 變量的使用 1.1.5 矩陣的使用 1.1.6 細(xì)胞數(shù)組(Cell Array)和結(jié)構(gòu)體(Structure) 1.1.7 關(guān)系運算與邏輯運算 1.1.8 常用圖像處理數(shù)學(xué)函數(shù) 1.1.9 Matlab程序流程控制 1.1.10 M文件編寫 1.1.11 Matlab函數(shù)編寫 1.2 Matlab圖像類型及其存儲方式 1.3 Matlab的圖像轉(zhuǎn)換 1.4 讀取和寫入圖像文件 1.5 圖像的顯示 第2章 Visual C++圖像處理編程基礎(chǔ) 2.1 位圖文件及其C++操作 2.1.1 設(shè)備無關(guān)位圖 2.1.2 BMP圖像文件數(shù)據(jù)結(jié)構(gòu) 2.2 認(rèn)識CImg類 2.2.1 主要成員函數(shù)列表 2.2.2 公有成員 2.3 CImg類基礎(chǔ)操作 2.3.1 加載和寫入圖像 2.3.2 獲得圖像基本信息 2.3.3 檢驗有效性 2.3.4 按像素操作 2.3.5 改變圖像大小 2.3.6 重載的運算符 2.3.7 在屏幕上繪制位圖圖像 2.3.8 新建圖像 2.3.9 圖像類型的判斷與轉(zhuǎn)化 2.4 DIPDemo工程 2.4.1 DIPDemo主界面 2.4.2 圖像操作和處理類——CImg和CImgProcess 2.4.3 文檔類——CDIPDemoDoc 2.4.4 視圖類——CDIPDemoView 2.5 CImg應(yīng)用示例 2.5.1 打開圖像 2.5.2 清空圖像 2.5.3 像素初始化方法 2.5.4 保存圖像 第3章 圖像的點運算 3.1 灰度直方圖 3.1.1 理論基礎(chǔ) 3.1.2 Matlab實現(xiàn) 3.1.3 Visual C++實現(xiàn) 3.2 灰度的線性變換 3.2.1 理論基礎(chǔ) 3.2.2 Matlab實現(xiàn) 3.2.3 Visual C++實現(xiàn) 3.3 灰度對數(shù)變換 3.3.1 理論基礎(chǔ) 3.3.2 Matlab實現(xiàn) 3.3.3 Visual C++實現(xiàn) 3.4 伽瑪變換 3.4.1 理論基礎(chǔ) 3.4.2 Matlab實現(xiàn) 3.4.3 Visual C++實現(xiàn) 3.5 灰度閾值變換 3.5.1 理論基礎(chǔ) 3.5.2 Matlab實現(xiàn) 3.5.3 Visual C++實現(xiàn) 3.6 分段線性變換 3.6.1 理論基礎(chǔ) 3.6.2 Matlab實現(xiàn) 3.6.3 Visual C++實現(xiàn) 3.7 直方圖均衡化 3.7.1 理論基礎(chǔ) 3.7.2 Matlab實現(xiàn) 3.7.3 Visual C++實現(xiàn) 3.8 直方圖規(guī)定化(匹配) 3.8.1 理論基礎(chǔ) 3.8.2 Matlab實現(xiàn) 3.8.3 Visual C++實現(xiàn) 第4章 圖像的幾何變換 第5章 空間域圖像增強 第6章 頻率域圖像增強 第7章 彩色圖像處理 第8章 形態(tài)學(xué)圖像處理 第9章 圖像分割 第10章 特征提取 第11章 圖像識別初步 第12章 人工神經(jīng)網(wǎng)絡(luò) 第13章 支持向量機
章節(jié)摘錄
插圖:圖像的空間和灰度級分辨率1.圖像的空間分辨率(SpatialResolution)圖像的空間分辨率是指圖像中每單位長度所包含的像素或點的數(shù)目,常以像素/英寸(pixelsperinch,ppi)為單位來表示。如72ppi表示圖像中每英寸包含72個像素或點。分辨率越高,圖像越清晰,圖像文件所需的磁盤空間也越大,編輯和處理所需的時間也越長。像素越小,單位長度所包含的像素數(shù)據(jù)就越多,分辨率也就越高,但同樣物理大小范圍內(nèi)所對應(yīng)圖像的尺寸也會越大,存儲圖像所需要的字節(jié)數(shù)也越多,因而,在圖像的放大縮小算法中,放大是對圖像的過采樣,縮小則是對圖像的欠采樣,這些內(nèi)容會在“4.5節(jié)圖像縮放”中進(jìn)一步介紹。通常在沒有必要對涉及像素的物理分辨率進(jìn)行實際度量時,通常會稱一幅大小為MXN的數(shù)字圖像的空間分辨率為MXN像素。圖0.3給出了同一幅圖像在不同的空間分辨率下呈現(xiàn)出的不同效果。當(dāng)高分辨率下的圖像以低分辨率表示時,在同等的顯示或打印輸出條件下,圖像的尺寸會變小,細(xì)節(jié)變得不明顯;當(dāng)將低分辨率下的圖像放大時,則會導(dǎo)致圖像的細(xì)節(jié)仍然模糊,只是尺寸變大。這是因為縮小的圖像已經(jīng)丟失了大量的信息,在放大圖像時只能通過復(fù)制行列的插值方法來確定新增像素的取值。
編輯推薦
《數(shù)字圖像處理與機器視覺:Visual C++與Matlab實現(xiàn)》:各種標(biāo)準(zhǔn)圖像處理算法(Matlab/Visual C++)汽車牌照的投影失真校正(Matlab/Visual C++)頂帽變換(Matlab/Visual C++)主成份分析(Matlab)LBP特征提取(Matlab)基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)字識別系統(tǒng)(visual C++)基于支持向量機的人臉識別系統(tǒng)(Matlab)為想要了解數(shù)字圖像處理與機器視覺領(lǐng)域的讀者提供了一條扎實的進(jìn)階之路,從基本的圖像處理算法,到投影校正、頂帽變換等高級應(yīng)用,再到特征提取、分類器設(shè)計,以及像光學(xué)字符識別、人臉識別等綜合案例,一步步地引導(dǎo)讀者從閱讀中獲得知識,于實踐中升華感悟。Matoab與Visusl C++兩種語言描述的無縫連接,體現(xiàn)出科學(xué)研究和工程實踐在圖像處理與機器視覺領(lǐng)域的完美結(jié)合。從實踐所需的理論,理論指導(dǎo)的實踐以及理論與實踐的結(jié)合3個層次展開每一部分內(nèi)容,做到有的放矢。理論翔實,拒絕知識斷層,同時又不偏執(zhí)于理論本身,理論知識以說明實際問題為目的,定量解釋與定性描述恰當(dāng)融合。應(yīng)用案例豐富,不僅給出詳盡的實現(xiàn)代碼,更揭示出背后的設(shè)計思想,注重思維歷練,讓您知其然,更知其所以然。內(nèi)容具有一定深度,這不是一本在2個月后就會失去價值的應(yīng)用程序參考,相反她讓你每次欣賞時都能得到新的享受。Matlab與VisualC++兩種語言描述的無縫連接,體現(xiàn)出科學(xué)研究和工程實踐在圖像處理與機器視覺領(lǐng)域的完美結(jié)合。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載