出版時(shí)間:2009-8 出版社:科學(xué) 作者:王雪松//程玉虎 頁數(shù):177
Tag標(biāo)簽:無
前言
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域最早研究的內(nèi)容之一,也是最體現(xiàn)智能特征的研究方向之一,不僅具有深刻的理論內(nèi)涵,而且是現(xiàn)代社會中人們獲取和處理知識的重要技術(shù)手段。隨著機(jī)器學(xué)習(xí)研究的不斷深入和計(jì)算機(jī)技術(shù)的長足進(jìn)步,已經(jīng)設(shè)計(jì)出不少具有優(yōu)良性能的機(jī)器學(xué)習(xí)系統(tǒng)并投入實(shí)際應(yīng)用。機(jī)器學(xué)習(xí)已經(jīng)成為當(dāng)今人工智能中最受關(guān)注的領(lǐng)域之一。該書是作者近年來在國家自然科學(xué)基金、教育部“新世紀(jì)優(yōu)秀人才支持計(jì)劃”、江蘇省自然科學(xué)基金以及教育部高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金項(xiàng)目的資助下,取得的一系列關(guān)于機(jī)器學(xué)習(xí)研究成果的結(jié)晶,不僅對已有研究成果做了全面總結(jié),也是對當(dāng)前機(jī)器學(xué)習(xí)研究成果的重要補(bǔ)充。書中全面、系統(tǒng)地介紹了機(jī)器學(xué)習(xí)的基本概念、發(fā)展歷史、分類及部分機(jī)器學(xué)習(xí)的主要策略等,并重點(diǎn)圍繞當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)問題展開討論,包括:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)控制中的應(yīng)用、大規(guī)?;蜻B續(xù)空間下的強(qiáng)化學(xué)習(xí)以及分布估計(jì)優(yōu)化算法等。此外,為理論聯(lián)系實(shí)際和便于讀者理解算法思想,書中還介紹了機(jī)器學(xué)習(xí)方法的若干典型應(yīng)用,如機(jī)械手軌跡跟蹤控制、小車爬山最短時(shí)間控制、倒立擺平衡控制、小船過河控制、機(jī)器人迷宮行走以及復(fù)雜數(shù)值函數(shù)優(yōu)化問題等。該書體現(xiàn)的學(xué)術(shù)思想新穎且內(nèi)容廣泛,理論聯(lián)系實(shí)際,寫作結(jié)構(gòu)清晰,邏輯性強(qiáng),闡述嚴(yán)謹(jǐn)。相信該書的出版一定能進(jìn)一步推動和促進(jìn)機(jī)器學(xué)習(xí)領(lǐng)域的研究與發(fā)展,為廣大有意致力于機(jī)器學(xué)習(xí)研究與應(yīng)用的人們提供一本難得的參考書。
內(nèi)容概要
機(jī)器學(xué)習(xí)的研究不僅是人工智能領(lǐng)域的核心問題,而且已成為近年來計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域中最活躍的研究分支之一。 本書主要圍繞基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和進(jìn)化學(xué)習(xí)三個方面闡述機(jī)器學(xué)習(xí)理論、方法及其應(yīng)用,共三部分13章。第一部分是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)中的控制,包括基于時(shí)間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制,基于徑向基函數(shù)網(wǎng)絡(luò)的機(jī)械手迭代學(xué)習(xí)控制,自適應(yīng)T_S型模糊徑向基函數(shù)網(wǎng)絡(luò)等。第二部分是強(qiáng)化學(xué)習(xí)的大規(guī)?;蜻B續(xù)空間表示問題,包括基于強(qiáng)化學(xué)習(xí)的白適應(yīng)PID控制,基于動態(tài)回歸網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)控制,基于自適應(yīng)模糊徑向基函數(shù)網(wǎng)絡(luò)、支持向量機(jī)和高斯過程的連續(xù)空間強(qiáng)化學(xué)習(xí),基于圖上測地高斯基函數(shù)的策略迭代強(qiáng)化學(xué)習(xí)等。第三部分則是對分布估計(jì)優(yōu)化算法進(jìn)行研究,包括多目標(biāo)優(yōu)化問題的差分進(jìn)化一分布估計(jì)算法,基于細(xì)菌覓食行為的分布估計(jì)算法在預(yù)測控制中的應(yīng)用,一種多樣性保持的分布估計(jì)算法及其在支持向量機(jī)參數(shù)選擇問題中的應(yīng)用等。為便于應(yīng)用本書闡述的算法,書后附有部分機(jī)器學(xué)習(xí)算法MATLAB源程序。 本書可供理工科高等院校計(jì)算機(jī)科學(xué)、信息科學(xué)、人工智能和自動化技術(shù)及相關(guān)專業(yè)的教師及研究生閱讀,也可供自然科學(xué)和工程技術(shù)領(lǐng)域中的研究人員參考。
書籍目錄
《智能科學(xué)技術(shù)著作叢書》序序前言第1章 機(jī)器學(xué)習(xí)概述 1.1 機(jī)器學(xué)習(xí)的概念 1.2 機(jī)器學(xué)習(xí)的發(fā)展歷史 1.3 機(jī)器學(xué)習(xí)的分類 1.3.1 基于學(xué)習(xí)策略的分類 1.3.2 基于學(xué)習(xí)方法的分類 1.3.3 基于學(xué)習(xí)方式的分類 1.3.4 基于數(shù)據(jù)形式的分類 1.3.5 基于學(xué)習(xí)目標(biāo)的分類 1.4 機(jī)器學(xué)習(xí)的主要策略 1.4.1 基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí) 1.4.2 進(jìn)化學(xué)習(xí) 1.4.3 強(qiáng)化學(xué)習(xí) 1.5 本書主要內(nèi)容及安排 1.6 本章小結(jié) 參考文獻(xiàn)第2章 基于時(shí)間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制 2.1 方法的提出 2.2 基于時(shí)間差分的Elman網(wǎng)絡(luò)預(yù)測控制 2.2.1 Elman網(wǎng)絡(luò)預(yù)測模型 2.2.2 反饋校正模型 2.2.3 參考軌跡 2.2.4 滾動優(yōu)化算法 2.3 仿真研究 2.3.1 預(yù)測仿真 2.3.2 跟蹤仿真 2.4 本章小結(jié) 參考文獻(xiàn)第3章 基于徑向基函數(shù)網(wǎng)絡(luò)的機(jī)械手迭代學(xué)習(xí)控制 3.1 機(jī)械手迭代學(xué)習(xí)控制 3.2 基于RBF網(wǎng)絡(luò)的迭代學(xué)習(xí)控制 3.2.1 選取查詢點(diǎn)的k個最接近樣例 3.2.2 利用RBF網(wǎng)絡(luò)擬合k個數(shù)據(jù)點(diǎn) 3.2.3 預(yù)測查詢點(diǎn)的控制輸入 3.3 仿真研究 3.4 本章小結(jié) 參考文獻(xiàn)第4章 自適應(yīng)T-S型模糊徑向基函數(shù)網(wǎng)絡(luò) 4.1 RBF網(wǎng)絡(luò)和模糊推理系統(tǒng)的功能等價(jià)性 4.2 自適應(yīng)T-S型FRBF網(wǎng)絡(luò)結(jié)構(gòu) 4.3 自適應(yīng)T-S型FRBF網(wǎng)絡(luò)學(xué)習(xí) 4.3.1 網(wǎng)絡(luò)學(xué)習(xí)動態(tài) 4.3.2 網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí) 4.3.3 網(wǎng)絡(luò)參數(shù)學(xué)習(xí) 4.3.4 算法步驟 4.4 仿真研究 4.5 本章小結(jié) 參考文獻(xiàn)第5章 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)PID控制 5.1 Actor-Critic學(xué)習(xí) 5.2 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)PID控制 5.2.1 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)PID控制結(jié)構(gòu) 5.2.2 基于RBF網(wǎng)絡(luò)的Actor-Critic學(xué)習(xí) 5.3 控制器設(shè)計(jì)步驟 5.4 仿真研究 5.5 本章小結(jié) 參考文獻(xiàn)第6章 基于動態(tài)回歸網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)控制 6.1 Q學(xué)習(xí) 6.2 基于Elman網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)控制 6.2.1 基于Elman網(wǎng)絡(luò)的Q學(xué)習(xí) 6.2.2 Elman網(wǎng)絡(luò)學(xué)習(xí)算法 6.2.3 基于Elman網(wǎng)絡(luò)的Q學(xué)習(xí)方法步驟 6.3 仿真研究 6.4 本章小結(jié) 參考文獻(xiàn)第7章 基于自適應(yīng)FRBF網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí) 7.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Actor-Qitic學(xué)習(xí) 7.1.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Actorcritic學(xué)習(xí)結(jié)構(gòu) 7.1.2 自適應(yīng)FRBF網(wǎng)絡(luò)的學(xué)習(xí) 7.1.3 算法步驟 7.1.4 仿真研究 7.2 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Q學(xué)習(xí) 7.2.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Q學(xué)習(xí)結(jié)構(gòu) 7.2.2 自適應(yīng)FRBF網(wǎng)絡(luò)的學(xué)習(xí) 7.2.3 算法步驟 7.2.4 仿真研究 7.3 本章小結(jié) 參考文獻(xiàn)第8章 基于支持向量機(jī)的強(qiáng)化學(xué)習(xí) 8.1 SVM 8.1.1 機(jī)器學(xué)習(xí) 8.1.2 核學(xué)習(xí) 8.1.3 SVM的思想 8.1.4 SVM的重要概念 8.2 基于SVM的強(qiáng)化學(xué)習(xí) 8.2.1 基于SVM的Q學(xué)習(xí)結(jié)構(gòu) 8.2.2 基于滾動時(shí)間窗機(jī)制的SVM 8.2.3 算法步驟 8.2.4 仿真研究 8.3 基于協(xié)同最小二乘SVM的強(qiáng)化學(xué)習(xí) 8.3.1 基于協(xié)同最小二乘SVM的Q學(xué)習(xí) 8.3.2 LS-SVRM逼近狀態(tài)一動作對到值函數(shù)的映射關(guān)系 8.3.3 LS-SVCM逼近狀態(tài)空間到動作空間的映射關(guān)系 8.3.4 仿真研究 8.4 本章小結(jié) 參考文獻(xiàn)第9章 基于高斯過程分類器的強(qiáng)化學(xué)習(xí) 9.1 基于高斯過程分類器的強(qiáng)化學(xué)習(xí) 9.2 在線高斯過程分類器學(xué)習(xí) 9.3 算法步驟 9.4 仿真研究 9.5 本章小結(jié) 參考文獻(xiàn)第10章 基于圖上測地高斯基函數(shù)的策略迭代強(qiáng)化學(xué)習(xí) 10.1 環(huán)境的圖論描述 10.2 測地高斯基函數(shù) 10.3 遞歸最小二乘策略迭代 10.4 算法步驟 10.5 仿真研究 10.6 本章小結(jié) 參考文獻(xiàn)第11章 多目標(biāo)優(yōu)化問題的差分進(jìn)化一分布估計(jì)算法 11.1 多目標(biāo)優(yōu)化 11.2 多目標(biāo)優(yōu)化的差分進(jìn)化一分布估計(jì)算法 11.2.1 多目標(biāo)優(yōu)化的DE-EDA混合算法步驟 11.2.2 多目標(biāo)優(yōu)化的DE子代生成策略 11.2.3 多目標(biāo)優(yōu)化的EDA子代生成策略 11.3 實(shí)例研究 11.4 本章小結(jié) 參考文獻(xiàn)第12章 基于細(xì)菌覓食行為的分布估計(jì)算法在預(yù)測控制中的應(yīng)用 12.1 方法的提出 12.2 基于改進(jìn)分布估汁算法的預(yù)測控制 12.2.1 預(yù)測模型 12.2.2 反饋校正模型 12.2.3 基于改進(jìn)分布估計(jì)算法的滾動優(yōu)化 12.3 實(shí)驗(yàn)分析 12.3.1 Benchmark函數(shù)實(shí)驗(yàn) 12.3.2 預(yù)測控制的曲線跟蹤實(shí)驗(yàn) 12.4 本章小結(jié) 參考文獻(xiàn)第13章 一種多樣性保持的分布估計(jì)算法 13.1 混沌模型 13.2 多樣性保持分布估計(jì)算法 13.3 Benchmark函數(shù)實(shí)驗(yàn) 13.4 在支持向量機(jī)參數(shù)選擇中的應(yīng)用 13.4.1 算法步驟 13.4.2 Chebyshev混沌時(shí)間序列預(yù)測 13.5 本章小結(jié) 參考文獻(xiàn)附錄 部分機(jī)器學(xué)習(xí)算法MATLAB源程序 程序1 第11章 多目標(biāo)差分進(jìn)化-分布估計(jì)算法MATLAB源程序 程序2 第12章 基于細(xì)菌覓食行為的分布估計(jì)算法部分MATLAB源程序 程序3 第13章 一種多樣性保持的分布估計(jì)算法部分MATLAB程序
章節(jié)摘錄
插圖:第2章 基于時(shí)間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制預(yù)測控制是20世紀(jì)70年代中后期在歐美工業(yè)領(lǐng)域內(nèi)出現(xiàn)的,它是在新型計(jì)算機(jī)控制算法基礎(chǔ)上發(fā)展起來的,是一種基于模型的先進(jìn)控制技術(shù),亦稱為模型預(yù)測控制(model predictive control,MPC)。預(yù)測控制技術(shù)的產(chǎn)生有著深刻的實(shí)際背景,這主要是由于被控對象日益復(fù)雜,一般的控制理論對信息描述的要求和優(yōu)化模式都難以滿足復(fù)雜工業(yè)過程的要求,而預(yù)測控制對模型的要求低,能兼顧被控對象的非線性、時(shí)變性因素及干擾的影響,不但跟蹤性能好,而且對模型失配有較強(qiáng)的魯棒性。因此,預(yù)測控制作為一種面向復(fù)雜系統(tǒng)的控制策略,一開始就受到國內(nèi)外控制界眾多學(xué)者的重視,并在理論研究和實(shí)際應(yīng)用方面取得了不少成果。在過去的幾十年里,非線性預(yù)測控制已經(jīng)被成功地應(yīng)用于石油、化工以及電力等工業(yè)過程控制中,這些過程具有較強(qiáng)的非線性,用一般線性控制模型和方法難以得到良好的控制品質(zhì)。預(yù)測控制的基本思想是充分利用過去時(shí)刻的輸入、輸出信息建立預(yù)測模型,然后利用預(yù)測模型對系統(tǒng)未來的輸出做出預(yù)測,從而通過長時(shí)域的優(yōu)化獲得最優(yōu)的控制量,實(shí)現(xiàn)對被控對象的有效控制。它的主要特點(diǎn)是:預(yù)測模型的多樣性,滾動優(yōu)化的時(shí)序性,在線校正的適應(yīng)性以及工業(yè)過程的實(shí)用性。目前,預(yù)測控制對于控制變化比較緩慢的生產(chǎn)過程或?qū)ο?,一般均能取得很好的效果,但是,對于機(jī)電類快變過程的快速跟蹤控制問題,如機(jī)器人、火炮或雷達(dá)的目標(biāo)跟蹤和冶金軋制過程等,由于控制算法過于復(fù)雜,運(yùn)算量大,往往難以在線實(shí)時(shí)控制。因此,有必要尋找一種算法簡單、控制迅速有效的預(yù)測控制方法。
編輯推薦
《機(jī)器學(xué)習(xí)理論、方法及應(yīng)用》主要圍繞當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)問題展開討論,體現(xiàn)的學(xué)術(shù)思想新穎且內(nèi)容廣泛。在詳細(xì)闡述機(jī)器學(xué)習(xí)理論與新方法的同時(shí),強(qiáng)調(diào)理論聯(lián)系實(shí)際,給出了機(jī)器學(xué)習(xí)方法在機(jī)械手軌跡跟蹤控制、小車爬山最短時(shí)間控制、倒立擺平衡控制、小船過河控制、機(jī)器人迷宮行走以及復(fù)雜數(shù)值函數(shù)優(yōu)化等方面的具體應(yīng)用,通過實(shí)例說明原理,富有啟發(fā)性。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
機(jī)器學(xué)習(xí)理論、方法及應(yīng)用 PDF格式下載