出版時間:2010-8 出版社:清華大學出版社 作者:張學工 頁數(shù):237
Tag標簽:無
前言
張學工教授長期從事模式識別課程的教學和科研工作,取得了優(yōu)異的成績,積累了豐富的經(jīng)驗。他還是國內(nèi)首先著文介紹和翻譯Vapnik統(tǒng)計學習理論著作的作者,這為他編寫新一版的《模式識別》教材打下了堅實的基礎(chǔ)。新版的《模式識別》取材更加精煉,安排更加符合學生學習的規(guī)律,特別是把傳統(tǒng)的統(tǒng)計模式識別方法與人工神經(jīng)網(wǎng)絡(luò)和支持向量機有機地結(jié)合起來,使學生能夠更好地掌握三者的內(nèi)在聯(lián)系,進一步理解學習樣本集對于設(shè)計模式識別系統(tǒng)的重要性,對于以后在實際應用中確定合適的方法有很好的指導意義。模式識別學科的發(fā)展和模式識別在各個學科的應用研究緊密聯(lián)系在一起。張學工教授多年從事地震勘探信號識別和生物信息學領(lǐng)域的科研工作,對模式識別方法的實際應用有深入的研究,部分的研究成果在本書中有所反映,這使得本書在理論聯(lián)系實際方面比原有版本有很大的改進。我相信本書的出版不僅能提高國內(nèi)模式識別課程教學水平,而且對廣大科技工作者更好地把模式識別方法應用于研究工作中也會起到很好的推動作用。
內(nèi)容概要
本書是清華大學自動化系國家精品課程“模式識別基礎(chǔ)”的教材,是在《模式識別》第一版和第二版基礎(chǔ)上重寫而成的。本教材系統(tǒng)地討論了模式識別的基本概念和代表性方法,包括監(jiān)督模式識別中的貝葉斯決策理論、概率密度函數(shù)的估計、線性判別函數(shù)、非線性判別函數(shù)、近鄰法、特征選擇與提取的典型方法以及非監(jiān)督模式識別中的基于模型的方法、混合密度估計、動態(tài)聚類方法、分級聚類方法等,并在相應章節(jié)包括了人工神經(jīng)網(wǎng)絡(luò)、支持向量機、決策樹與隨機森林、羅杰斯特回歸、Boosting方法、模糊模式識別等較新進入模式識別領(lǐng)域的內(nèi)容。整體內(nèi)容安排力求系統(tǒng)性和實用性,并覆蓋部分當前研究前沿?! ”緯梢宰鳛楦叩仍盒W詣踊?、計算機等相關(guān)專業(yè)高年級本科生和研究生學習模式識別的教材,也可以供計算機信息處理、生物信息學、數(shù)據(jù)挖掘、統(tǒng)計等各領(lǐng)域中從事模式識別相關(guān)工作的廣大科技人員和高校師生參考。
作者簡介
張學工,1994年于清華大學模式識別與智能系統(tǒng)專業(yè)獲工學博士學位,現(xiàn)任清華大學自動化系教授。主要從事機器學習的理論、方法與應用研究和生物信息學研究。
書籍目錄
第1章 概論 1.1 模式與模式識別 1.2 模式識別的主要方法 1.3 監(jiān)督模式識別與非監(jiān)督模式識別 1.4 模式識別系統(tǒng)舉例 1.5 模式識別系統(tǒng)的典型構(gòu)成 1.6 本書的主要內(nèi)容第2章 統(tǒng)計決策方法 2.1 引言: 一個簡單的例子 2.2 最小錯誤率貝葉斯決策 2.3 最小風險貝葉斯決策 2.4 兩類錯誤率、Neyman?Pearson決策與ROC曲線 2.5 正態(tài)分布時的統(tǒng)計決策 2.5.1 正態(tài)分布及其性質(zhì)回顧 2.5.2 正態(tài)分布概率模型下的最小錯誤率貝葉斯決策 2.6 錯誤率的計算 2.6.1 正態(tài)分布且各類協(xié)方差矩陣相等情況下錯誤率的計算 2.6.2 高維獨立隨機變量時錯誤率的估計 2.7 離散概率模型下的統(tǒng)計決策舉例 2.8 小結(jié)與討論第3章 概率密度函數(shù)的估計 3.1 引言 3.2 最大似然估計 3.2.1 最大似然估計的基本原理 3.2.2 最大似然估計的求解 3.2.3 正態(tài)分布下的最大似然估計 3.3 貝葉斯估計與貝葉斯學習 3.3.1 貝葉斯估計 3.3.2 貝葉斯學習 3.3.3 正態(tài)分布時的貝葉斯估計 3.3.4 其他分布的情況 3.4 概率密度估計的非參數(shù)方法 3.4.1 非參數(shù)估計的基本原理與直方圖方法 3.4.2 kN近鄰估計方法 3.4.3 Parzen窗法 3.5 討論第4章 線性分類器 4.1 引言 4.2 線性判別函數(shù)的基本概念 4.3 Fisher線性判別分析 4.4 感知器 4.5 最小平方誤差判別 4.6 最優(yōu)分類超平面與線性支持向量機 4.6.1 最優(yōu)分類超平面 4.6.2 大間隔與推廣能力 4.6.3 線性不可分情況 4.7 多類線性分類器 4.7.1 多個兩類分類器的組合 4.7.2 多類線性判別函數(shù) 4.8 小結(jié)與討論第5章 非線性分類器 5.1 引言 5.2 分段線性判別函數(shù) 5.2.1 分段線性距離分類器 5.2.2 一般的分段線性判別函數(shù) 5.3 二次判別函數(shù) 5.4 多層感知器神經(jīng)網(wǎng)絡(luò) 5.4.1 神經(jīng)元與感知器 5.4.2 用多個感知器實現(xiàn)非線性分類 5.4.3 采用反向傳播算法的多層感知器 5.4.4 多層感知器網(wǎng)絡(luò)用于模式識別 5.4.5 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇 5.4.6 前饋神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)模式識別方法的關(guān)系 5.4.7 人工神經(jīng)網(wǎng)絡(luò)的一般知識 5.5 支持向量機 5.5.1 廣義線性判別函數(shù) 5.5.2 核函數(shù)變換與支持向量機 5.5.3 支持向量機應用舉例 5.5.4 支持向量機的實現(xiàn)算法 5.5.5 多類支持向量機 5.5.6 用于函數(shù)擬合的支持向量機 5.6 核函數(shù)機器 5.6.1 大間隔機器與核函數(shù)機器 5.6.2 核Fisher判別 5.7 小結(jié)與討論第6章 其他分類方法 6.1 近鄰法 6.1.1 最近鄰法 6.1.2 k-近鄰法 6.1.3 近鄰法的快速算法 6.1.4 剪輯近鄰法 6.1.5 壓縮近鄰法 6.2 決策樹與隨機森林 6.2.1 非數(shù)值特征 6.2.2 決策樹 6.2.3 過學習與決策樹的剪枝 6.2.4 隨機森林 6.3 羅杰斯特回歸 6.4 Boosting方法 6.5 討論第7章 特征選擇 7.1 引言 7.2 特征的評價準則 7.2.1 基于類內(nèi)類間距離的可分性判據(jù) 7.2.2 基于概率分布的可分性判據(jù) 7.2.3 基于熵的可分性判據(jù) 7.2.4 利用統(tǒng)計檢驗作為可分性判據(jù) 7.3 特征選擇的最優(yōu)算法 7.4 特征選擇的次優(yōu)算法 7.5 特征選擇的遺傳算法 7.6 以分類性能為準則的特征選擇方法 7.7 討論第8章 特征提取 8.1 引言 8.2 基于類別可分性判據(jù)的特征提取 8.3 主成分分析方法 8.4 Karhunen?Loève變換 8.4.1 K-L變換的基本原理 8.4.2 用于監(jiān)督模式識別的K-L變換 8.5 K-L變換在人臉識別中的應用舉例 8.6 高維數(shù)據(jù)的低維顯示 8.7 多維尺度法 8.7.1 MDS的基本概念 8.7.2 古典尺度法 8.7.3 度量型MDS 8.7.4 非度量型MDS 8.7.5 MDS在模式識別中的應用 8.8 非線性變換方法簡介 8.8.1 核主成分分析(KPCA) 8.8.2 IsoMap方法和LLE方法 8.9 討論第9章 非監(jiān)督模式識別 9.1 引言 9.2 基于模型的方法 9.3 混合模型的估計 9.3.1 非監(jiān)督最大似然估計 9.3.2 正態(tài)分布情況下的非監(jiān)督參數(shù)估計 9.4 動態(tài)聚類算法 9.4.1 C均值算法 9.4.2 ISODATA方法 9.4.3 基于樣本與核的相似性度量的動態(tài)聚類算法 9.5 模糊聚類方法 9.5.1 模糊集的基本知識 9.5.2 模糊C均值算法 9.5.3 改進的模糊C均值算法 9.6 分級聚類方法 9.7 自組織映射神經(jīng)網(wǎng)絡(luò) 9.7.1 SOM網(wǎng)絡(luò)結(jié)構(gòu) 9.7.2 SOM學習算法和自組織特性 9.7.3 SOM用于模式識別 9.8 討論第10章 模式識別系統(tǒng)的評價 10.1 監(jiān)督模式識別方法的錯誤率估計 10.1.1 訓練錯誤率 10.1.2 測試錯誤率 10.1.3 交叉驗證 10.1.4 自舉法與.632估計 10.2 有限樣本下錯誤率的區(qū)間估計問題 10.2.1 問題的提出 10.2.2 用擾動重采樣估計SVM錯誤率的置信區(qū)間 10.3 特征提取與選擇對分類器性能估計的影響 10.4 從分類的顯著性推斷特征與類別的關(guān)系 10.5 非監(jiān)督模式識別系統(tǒng)性能的評價 10.6 討論索引參考文獻
章節(jié)摘錄
插圖:對樣本的識別由一個分類器來實現(xiàn)。語音識別最常用的分類器是建立在語音的一種概率模型——隱馬爾可夫模型上的。分類器有兩個工作階段:設(shè)計階段與決策階段。在設(shè)計階段,用大量已知的語音信號來確定分類器模型中的一系列參數(shù),這一過程稱作訓練,這種語音訓練樣本集通常被稱作語料庫。在決策階段,未知的語音信號經(jīng)過與設(shè)計階段同樣的預處理后進入訓練好的分類器,分類器給出對語音的識別結(jié)果。對于普通用戶來說,所購買的語音識別系統(tǒng)已經(jīng)是經(jīng)過訓練之后的,有些產(chǎn)品提供了讓用戶再用自己的口音對分類器進行一定的再訓練的功能。與其他模式識別系統(tǒng)不同的是,一段自然的語音是由一系列連續(xù)的音素構(gòu)成的,而不是一個個相互獨立的因素,因此,在語音識別系統(tǒng)中并不是單獨對每一個音素樣本進行分類,而是用一個更高一層的隱馬爾可夫模型把相鄰的音素聯(lián)合起來考慮。在對音素識別的基礎(chǔ)上還要對一定的語言模型進行后處理才能最終識別出語音的內(nèi)容。根據(jù)所針對的應用場景,目前存在的語音識別系統(tǒng)有多種類型:從對說話人的要求考慮可分為特定人和非特定人系統(tǒng),從識別內(nèi)容考慮可分為孤立詞識別和連續(xù)語音識別、命令及小詞匯量識別和大詞匯量識別、規(guī)范語言識別和口語識別,從識別的速度考慮還可分為聽寫和自然語速的語音識別等。其中,非特定人、小詞匯量的識別已經(jīng)有很多實際應用,最常見的比如自動語音識別的電話總機、航空公司等的語音識別自動電話服務等專用系統(tǒng);目前市場上常見的語音識別軟件或者某些操作系統(tǒng)中內(nèi)嵌的語音識別軟件多是針對規(guī)范文本的聽寫識別的,已經(jīng)能夠達到相當準確的識別率,用戶經(jīng)過一定的適應就可以利用語音識別軟件進行文本錄入;但是,在復雜環(huán)境下口語化語言的自動識別目前仍然遠遠沒有達到實用水平。
編輯推薦
《模式識別(第3版)》:國家精品課程教材·新編《信息、控制與系列》系列教材
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載