出版時(shí)間:2010-8 出版社:清華大學(xué)出版社 作者:張學(xué)工 頁(yè)數(shù):237
Tag標(biāo)簽:無(wú)
前言
張學(xué)工教授長(zhǎng)期從事模式識(shí)別課程的教學(xué)和科研工作,取得了優(yōu)異的成績(jī),積累了豐富的經(jīng)驗(yàn)。他還是國(guó)內(nèi)首先著文介紹和翻譯Vapnik統(tǒng)計(jì)學(xué)習(xí)理論著作的作者,這為他編寫(xiě)新一版的《模式識(shí)別》教材打下了堅(jiān)實(shí)的基礎(chǔ)。新版的《模式識(shí)別》取材更加精煉,安排更加符合學(xué)生學(xué)習(xí)的規(guī)律,特別是把傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別方法與人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)有機(jī)地結(jié)合起來(lái),使學(xué)生能夠更好地掌握三者的內(nèi)在聯(lián)系,進(jìn)一步理解學(xué)習(xí)樣本集對(duì)于設(shè)計(jì)模式識(shí)別系統(tǒng)的重要性,對(duì)于以后在實(shí)際應(yīng)用中確定合適的方法有很好的指導(dǎo)意義。模式識(shí)別學(xué)科的發(fā)展和模式識(shí)別在各個(gè)學(xué)科的應(yīng)用研究緊密聯(lián)系在一起。張學(xué)工教授多年從事地震勘探信號(hào)識(shí)別和生物信息學(xué)領(lǐng)域的科研工作,對(duì)模式識(shí)別方法的實(shí)際應(yīng)用有深入的研究,部分的研究成果在本書(shū)中有所反映,這使得本書(shū)在理論聯(lián)系實(shí)際方面比原有版本有很大的改進(jìn)。我相信本書(shū)的出版不僅能提高國(guó)內(nèi)模式識(shí)別課程教學(xué)水平,而且對(duì)廣大科技工作者更好地把模式識(shí)別方法應(yīng)用于研究工作中也會(huì)起到很好的推動(dòng)作用。
內(nèi)容概要
本書(shū)是清華大學(xué)自動(dòng)化系國(guó)家精品課程“模式識(shí)別基礎(chǔ)”的教材,是在《模式識(shí)別》第一版和第二版基礎(chǔ)上重寫(xiě)而成的。本教材系統(tǒng)地討論了模式識(shí)別的基本概念和代表性方法,包括監(jiān)督模式識(shí)別中的貝葉斯決策理論、概率密度函數(shù)的估計(jì)、線性判別函數(shù)、非線性判別函數(shù)、近鄰法、特征選擇與提取的典型方法以及非監(jiān)督模式識(shí)別中的基于模型的方法、混合密度估計(jì)、動(dòng)態(tài)聚類方法、分級(jí)聚類方法等,并在相應(yīng)章節(jié)包括了人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹(shù)與隨機(jī)森林、羅杰斯特回歸、Boosting方法、模糊模式識(shí)別等較新進(jìn)入模式識(shí)別領(lǐng)域的內(nèi)容。整體內(nèi)容安排力求系統(tǒng)性和實(shí)用性,并覆蓋部分當(dāng)前研究前沿?! ”緯?shū)可以作為高等院校自動(dòng)化、計(jì)算機(jī)等相關(guān)專業(yè)高年級(jí)本科生和研究生學(xué)習(xí)模式識(shí)別的教材,也可以供計(jì)算機(jī)信息處理、生物信息學(xué)、數(shù)據(jù)挖掘、統(tǒng)計(jì)等各領(lǐng)域中從事模式識(shí)別相關(guān)工作的廣大科技人員和高校師生參考。
作者簡(jiǎn)介
張學(xué)工,1994年于清華大學(xué)模式識(shí)別與智能系統(tǒng)專業(yè)獲工學(xué)博士學(xué)位,現(xiàn)任清華大學(xué)自動(dòng)化系教授。主要從事機(jī)器學(xué)習(xí)的理論、方法與應(yīng)用研究和生物信息學(xué)研究。
書(shū)籍目錄
第1章 概論 1.1 模式與模式識(shí)別 1.2 模式識(shí)別的主要方法 1.3 監(jiān)督模式識(shí)別與非監(jiān)督模式識(shí)別 1.4 模式識(shí)別系統(tǒng)舉例 1.5 模式識(shí)別系統(tǒng)的典型構(gòu)成 1.6 本書(shū)的主要內(nèi)容第2章 統(tǒng)計(jì)決策方法 2.1 引言: 一個(gè)簡(jiǎn)單的例子 2.2 最小錯(cuò)誤率貝葉斯決策 2.3 最小風(fēng)險(xiǎn)貝葉斯決策 2.4 兩類錯(cuò)誤率、Neyman?Pearson決策與ROC曲線 2.5 正態(tài)分布時(shí)的統(tǒng)計(jì)決策 2.5.1 正態(tài)分布及其性質(zhì)回顧 2.5.2 正態(tài)分布概率模型下的最小錯(cuò)誤率貝葉斯決策 2.6 錯(cuò)誤率的計(jì)算 2.6.1 正態(tài)分布且各類協(xié)方差矩陣相等情況下錯(cuò)誤率的計(jì)算 2.6.2 高維獨(dú)立隨機(jī)變量時(shí)錯(cuò)誤率的估計(jì) 2.7 離散概率模型下的統(tǒng)計(jì)決策舉例 2.8 小結(jié)與討論第3章 概率密度函數(shù)的估計(jì) 3.1 引言 3.2 最大似然估計(jì) 3.2.1 最大似然估計(jì)的基本原理 3.2.2 最大似然估計(jì)的求解 3.2.3 正態(tài)分布下的最大似然估計(jì) 3.3 貝葉斯估計(jì)與貝葉斯學(xué)習(xí) 3.3.1 貝葉斯估計(jì) 3.3.2 貝葉斯學(xué)習(xí) 3.3.3 正態(tài)分布時(shí)的貝葉斯估計(jì) 3.3.4 其他分布的情況 3.4 概率密度估計(jì)的非參數(shù)方法 3.4.1 非參數(shù)估計(jì)的基本原理與直方圖方法 3.4.2 kN近鄰估計(jì)方法 3.4.3 Parzen窗法 3.5 討論第4章 線性分類器 4.1 引言 4.2 線性判別函數(shù)的基本概念 4.3 Fisher線性判別分析 4.4 感知器 4.5 最小平方誤差判別 4.6 最優(yōu)分類超平面與線性支持向量機(jī) 4.6.1 最優(yōu)分類超平面 4.6.2 大間隔與推廣能力 4.6.3 線性不可分情況 4.7 多類線性分類器 4.7.1 多個(gè)兩類分類器的組合 4.7.2 多類線性判別函數(shù) 4.8 小結(jié)與討論第5章 非線性分類器 5.1 引言 5.2 分段線性判別函數(shù) 5.2.1 分段線性距離分類器 5.2.2 一般的分段線性判別函數(shù) 5.3 二次判別函數(shù) 5.4 多層感知器神經(jīng)網(wǎng)絡(luò) 5.4.1 神經(jīng)元與感知器 5.4.2 用多個(gè)感知器實(shí)現(xiàn)非線性分類 5.4.3 采用反向傳播算法的多層感知器 5.4.4 多層感知器網(wǎng)絡(luò)用于模式識(shí)別 5.4.5 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇 5.4.6 前饋神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)模式識(shí)別方法的關(guān)系 5.4.7 人工神經(jīng)網(wǎng)絡(luò)的一般知識(shí) 5.5 支持向量機(jī) 5.5.1 廣義線性判別函數(shù) 5.5.2 核函數(shù)變換與支持向量機(jī) 5.5.3 支持向量機(jī)應(yīng)用舉例 5.5.4 支持向量機(jī)的實(shí)現(xiàn)算法 5.5.5 多類支持向量機(jī) 5.5.6 用于函數(shù)擬合的支持向量機(jī) 5.6 核函數(shù)機(jī)器 5.6.1 大間隔機(jī)器與核函數(shù)機(jī)器 5.6.2 核Fisher判別 5.7 小結(jié)與討論第6章 其他分類方法 6.1 近鄰法 6.1.1 最近鄰法 6.1.2 k-近鄰法 6.1.3 近鄰法的快速算法 6.1.4 剪輯近鄰法 6.1.5 壓縮近鄰法 6.2 決策樹(shù)與隨機(jī)森林 6.2.1 非數(shù)值特征 6.2.2 決策樹(shù) 6.2.3 過(guò)學(xué)習(xí)與決策樹(shù)的剪枝 6.2.4 隨機(jī)森林 6.3 羅杰斯特回歸 6.4 Boosting方法 6.5 討論第7章 特征選擇 7.1 引言 7.2 特征的評(píng)價(jià)準(zhǔn)則 7.2.1 基于類內(nèi)類間距離的可分性判據(jù) 7.2.2 基于概率分布的可分性判據(jù) 7.2.3 基于熵的可分性判據(jù) 7.2.4 利用統(tǒng)計(jì)檢驗(yàn)作為可分性判據(jù) 7.3 特征選擇的最優(yōu)算法 7.4 特征選擇的次優(yōu)算法 7.5 特征選擇的遺傳算法 7.6 以分類性能為準(zhǔn)則的特征選擇方法 7.7 討論第8章 特征提取 8.1 引言 8.2 基于類別可分性判據(jù)的特征提取 8.3 主成分分析方法 8.4 Karhunen?Loève變換 8.4.1 K-L變換的基本原理 8.4.2 用于監(jiān)督模式識(shí)別的K-L變換 8.5 K-L變換在人臉識(shí)別中的應(yīng)用舉例 8.6 高維數(shù)據(jù)的低維顯示 8.7 多維尺度法 8.7.1 MDS的基本概念 8.7.2 古典尺度法 8.7.3 度量型MDS 8.7.4 非度量型MDS 8.7.5 MDS在模式識(shí)別中的應(yīng)用 8.8 非線性變換方法簡(jiǎn)介 8.8.1 核主成分分析(KPCA) 8.8.2 IsoMap方法和LLE方法 8.9 討論第9章 非監(jiān)督模式識(shí)別 9.1 引言 9.2 基于模型的方法 9.3 混合模型的估計(jì) 9.3.1 非監(jiān)督最大似然估計(jì) 9.3.2 正態(tài)分布情況下的非監(jiān)督參數(shù)估計(jì) 9.4 動(dòng)態(tài)聚類算法 9.4.1 C均值算法 9.4.2 ISODATA方法 9.4.3 基于樣本與核的相似性度量的動(dòng)態(tài)聚類算法 9.5 模糊聚類方法 9.5.1 模糊集的基本知識(shí) 9.5.2 模糊C均值算法 9.5.3 改進(jìn)的模糊C均值算法 9.6 分級(jí)聚類方法 9.7 自組織映射神經(jīng)網(wǎng)絡(luò) 9.7.1 SOM網(wǎng)絡(luò)結(jié)構(gòu) 9.7.2 SOM學(xué)習(xí)算法和自組織特性 9.7.3 SOM用于模式識(shí)別 9.8 討論第10章 模式識(shí)別系統(tǒng)的評(píng)價(jià) 10.1 監(jiān)督模式識(shí)別方法的錯(cuò)誤率估計(jì) 10.1.1 訓(xùn)練錯(cuò)誤率 10.1.2 測(cè)試錯(cuò)誤率 10.1.3 交叉驗(yàn)證 10.1.4 自舉法與.632估計(jì) 10.2 有限樣本下錯(cuò)誤率的區(qū)間估計(jì)問(wèn)題 10.2.1 問(wèn)題的提出 10.2.2 用擾動(dòng)重采樣估計(jì)SVM錯(cuò)誤率的置信區(qū)間 10.3 特征提取與選擇對(duì)分類器性能估計(jì)的影響 10.4 從分類的顯著性推斷特征與類別的關(guān)系 10.5 非監(jiān)督模式識(shí)別系統(tǒng)性能的評(píng)價(jià) 10.6 討論索引參考文獻(xiàn)
章節(jié)摘錄
插圖:對(duì)樣本的識(shí)別由一個(gè)分類器來(lái)實(shí)現(xiàn)。語(yǔ)音識(shí)別最常用的分類器是建立在語(yǔ)音的一種概率模型——隱馬爾可夫模型上的。分類器有兩個(gè)工作階段:設(shè)計(jì)階段與決策階段。在設(shè)計(jì)階段,用大量已知的語(yǔ)音信號(hào)來(lái)確定分類器模型中的一系列參數(shù),這一過(guò)程稱作訓(xùn)練,這種語(yǔ)音訓(xùn)練樣本集通常被稱作語(yǔ)料庫(kù)。在決策階段,未知的語(yǔ)音信號(hào)經(jīng)過(guò)與設(shè)計(jì)階段同樣的預(yù)處理后進(jìn)入訓(xùn)練好的分類器,分類器給出對(duì)語(yǔ)音的識(shí)別結(jié)果。對(duì)于普通用戶來(lái)說(shuō),所購(gòu)買的語(yǔ)音識(shí)別系統(tǒng)已經(jīng)是經(jīng)過(guò)訓(xùn)練之后的,有些產(chǎn)品提供了讓用戶再用自己的口音對(duì)分類器進(jìn)行一定的再訓(xùn)練的功能。與其他模式識(shí)別系統(tǒng)不同的是,一段自然的語(yǔ)音是由一系列連續(xù)的音素構(gòu)成的,而不是一個(gè)個(gè)相互獨(dú)立的因素,因此,在語(yǔ)音識(shí)別系統(tǒng)中并不是單獨(dú)對(duì)每一個(gè)音素樣本進(jìn)行分類,而是用一個(gè)更高一層的隱馬爾可夫模型把相鄰的音素聯(lián)合起來(lái)考慮。在對(duì)音素識(shí)別的基礎(chǔ)上還要對(duì)一定的語(yǔ)言模型進(jìn)行后處理才能最終識(shí)別出語(yǔ)音的內(nèi)容。根據(jù)所針對(duì)的應(yīng)用場(chǎng)景,目前存在的語(yǔ)音識(shí)別系統(tǒng)有多種類型:從對(duì)說(shuō)話人的要求考慮可分為特定人和非特定人系統(tǒng),從識(shí)別內(nèi)容考慮可分為孤立詞識(shí)別和連續(xù)語(yǔ)音識(shí)別、命令及小詞匯量識(shí)別和大詞匯量識(shí)別、規(guī)范語(yǔ)言識(shí)別和口語(yǔ)識(shí)別,從識(shí)別的速度考慮還可分為聽(tīng)寫(xiě)和自然語(yǔ)速的語(yǔ)音識(shí)別等。其中,非特定人、小詞匯量的識(shí)別已經(jīng)有很多實(shí)際應(yīng)用,最常見(jiàn)的比如自動(dòng)語(yǔ)音識(shí)別的電話總機(jī)、航空公司等的語(yǔ)音識(shí)別自動(dòng)電話服務(wù)等專用系統(tǒng);目前市場(chǎng)上常見(jiàn)的語(yǔ)音識(shí)別軟件或者某些操作系統(tǒng)中內(nèi)嵌的語(yǔ)音識(shí)別軟件多是針對(duì)規(guī)范文本的聽(tīng)寫(xiě)識(shí)別的,已經(jīng)能夠達(dá)到相當(dāng)準(zhǔn)確的識(shí)別率,用戶經(jīng)過(guò)一定的適應(yīng)就可以利用語(yǔ)音識(shí)別軟件進(jìn)行文本錄入;但是,在復(fù)雜環(huán)境下口語(yǔ)化語(yǔ)言的自動(dòng)識(shí)別目前仍然遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到實(shí)用水平。
編輯推薦
《模式識(shí)別(第3版)》:國(guó)家精品課程教材·新編《信息、控制與系列》系列教材
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版