出版時間:2009-8 出版社:科學(xué) 作者:王雪松//程玉虎 頁數(shù):177
Tag標(biāo)簽:無
前言
機器學(xué)習(xí)是人工智能領(lǐng)域最早研究的內(nèi)容之一,也是最體現(xiàn)智能特征的研究方向之一,不僅具有深刻的理論內(nèi)涵,而且是現(xiàn)代社會中人們獲取和處理知識的重要技術(shù)手段。隨著機器學(xué)習(xí)研究的不斷深入和計算機技術(shù)的長足進步,已經(jīng)設(shè)計出不少具有優(yōu)良性能的機器學(xué)習(xí)系統(tǒng)并投入實際應(yīng)用。機器學(xué)習(xí)已經(jīng)成為當(dāng)今人工智能中最受關(guān)注的領(lǐng)域之一。該書是作者近年來在國家自然科學(xué)基金、教育部“新世紀(jì)優(yōu)秀人才支持計劃”、江蘇省自然科學(xué)基金以及教育部高等學(xué)校博士學(xué)科點專項科研基金項目的資助下,取得的一系列關(guān)于機器學(xué)習(xí)研究成果的結(jié)晶,不僅對已有研究成果做了全面總結(jié),也是對當(dāng)前機器學(xué)習(xí)研究成果的重要補充。書中全面、系統(tǒng)地介紹了機器學(xué)習(xí)的基本概念、發(fā)展歷史、分類及部分機器學(xué)習(xí)的主要策略等,并重點圍繞當(dāng)前機器學(xué)習(xí)領(lǐng)域的熱點問題展開討論,包括:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)控制中的應(yīng)用、大規(guī)模或連續(xù)空間下的強化學(xué)習(xí)以及分布估計優(yōu)化算法等。此外,為理論聯(lián)系實際和便于讀者理解算法思想,書中還介紹了機器學(xué)習(xí)方法的若干典型應(yīng)用,如機械手軌跡跟蹤控制、小車爬山最短時間控制、倒立擺平衡控制、小船過河控制、機器人迷宮行走以及復(fù)雜數(shù)值函數(shù)優(yōu)化問題等。該書體現(xiàn)的學(xué)術(shù)思想新穎且內(nèi)容廣泛,理論聯(lián)系實際,寫作結(jié)構(gòu)清晰,邏輯性強,闡述嚴(yán)謹(jǐn)。相信該書的出版一定能進一步推動和促進機器學(xué)習(xí)領(lǐng)域的研究與發(fā)展,為廣大有意致力于機器學(xué)習(xí)研究與應(yīng)用的人們提供一本難得的參考書。
內(nèi)容概要
機器學(xué)習(xí)的研究不僅是人工智能領(lǐng)域的核心問題,而且已成為近年來計算機科學(xué)與技術(shù)領(lǐng)域中最活躍的研究分支之一。 本書主要圍繞基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)、強化學(xué)習(xí)和進化學(xué)習(xí)三個方面闡述機器學(xué)習(xí)理論、方法及其應(yīng)用,共三部分13章。第一部分是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)及其在復(fù)雜非線性系統(tǒng)中的控制,包括基于時間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制,基于徑向基函數(shù)網(wǎng)絡(luò)的機械手迭代學(xué)習(xí)控制,自適應(yīng)T_S型模糊徑向基函數(shù)網(wǎng)絡(luò)等。第二部分是強化學(xué)習(xí)的大規(guī)?;蜻B續(xù)空間表示問題,包括基于強化學(xué)習(xí)的白適應(yīng)PID控制,基于動態(tài)回歸網(wǎng)絡(luò)的強化學(xué)習(xí)控制,基于自適應(yīng)模糊徑向基函數(shù)網(wǎng)絡(luò)、支持向量機和高斯過程的連續(xù)空間強化學(xué)習(xí),基于圖上測地高斯基函數(shù)的策略迭代強化學(xué)習(xí)等。第三部分則是對分布估計優(yōu)化算法進行研究,包括多目標(biāo)優(yōu)化問題的差分進化一分布估計算法,基于細菌覓食行為的分布估計算法在預(yù)測控制中的應(yīng)用,一種多樣性保持的分布估計算法及其在支持向量機參數(shù)選擇問題中的應(yīng)用等。為便于應(yīng)用本書闡述的算法,書后附有部分機器學(xué)習(xí)算法MATLAB源程序。 本書可供理工科高等院校計算機科學(xué)、信息科學(xué)、人工智能和自動化技術(shù)及相關(guān)專業(yè)的教師及研究生閱讀,也可供自然科學(xué)和工程技術(shù)領(lǐng)域中的研究人員參考。
書籍目錄
《智能科學(xué)技術(shù)著作叢書》序序前言第1章 機器學(xué)習(xí)概述 1.1 機器學(xué)習(xí)的概念 1.2 機器學(xué)習(xí)的發(fā)展歷史 1.3 機器學(xué)習(xí)的分類 1.3.1 基于學(xué)習(xí)策略的分類 1.3.2 基于學(xué)習(xí)方法的分類 1.3.3 基于學(xué)習(xí)方式的分類 1.3.4 基于數(shù)據(jù)形式的分類 1.3.5 基于學(xué)習(xí)目標(biāo)的分類 1.4 機器學(xué)習(xí)的主要策略 1.4.1 基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí) 1.4.2 進化學(xué)習(xí) 1.4.3 強化學(xué)習(xí) 1.5 本書主要內(nèi)容及安排 1.6 本章小結(jié) 參考文獻第2章 基于時間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制 2.1 方法的提出 2.2 基于時間差分的Elman網(wǎng)絡(luò)預(yù)測控制 2.2.1 Elman網(wǎng)絡(luò)預(yù)測模型 2.2.2 反饋校正模型 2.2.3 參考軌跡 2.2.4 滾動優(yōu)化算法 2.3 仿真研究 2.3.1 預(yù)測仿真 2.3.2 跟蹤仿真 2.4 本章小結(jié) 參考文獻第3章 基于徑向基函數(shù)網(wǎng)絡(luò)的機械手迭代學(xué)習(xí)控制 3.1 機械手迭代學(xué)習(xí)控制 3.2 基于RBF網(wǎng)絡(luò)的迭代學(xué)習(xí)控制 3.2.1 選取查詢點的k個最接近樣例 3.2.2 利用RBF網(wǎng)絡(luò)擬合k個數(shù)據(jù)點 3.2.3 預(yù)測查詢點的控制輸入 3.3 仿真研究 3.4 本章小結(jié) 參考文獻第4章 自適應(yīng)T-S型模糊徑向基函數(shù)網(wǎng)絡(luò) 4.1 RBF網(wǎng)絡(luò)和模糊推理系統(tǒng)的功能等價性 4.2 自適應(yīng)T-S型FRBF網(wǎng)絡(luò)結(jié)構(gòu) 4.3 自適應(yīng)T-S型FRBF網(wǎng)絡(luò)學(xué)習(xí) 4.3.1 網(wǎng)絡(luò)學(xué)習(xí)動態(tài) 4.3.2 網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí) 4.3.3 網(wǎng)絡(luò)參數(shù)學(xué)習(xí) 4.3.4 算法步驟 4.4 仿真研究 4.5 本章小結(jié) 參考文獻第5章 基于強化學(xué)習(xí)的自適應(yīng)PID控制 5.1 Actor-Critic學(xué)習(xí) 5.2 基于強化學(xué)習(xí)的自適應(yīng)PID控制 5.2.1 基于強化學(xué)習(xí)的自適應(yīng)PID控制結(jié)構(gòu) 5.2.2 基于RBF網(wǎng)絡(luò)的Actor-Critic學(xué)習(xí) 5.3 控制器設(shè)計步驟 5.4 仿真研究 5.5 本章小結(jié) 參考文獻第6章 基于動態(tài)回歸網(wǎng)絡(luò)的強化學(xué)習(xí)控制 6.1 Q學(xué)習(xí) 6.2 基于Elman網(wǎng)絡(luò)的強化學(xué)習(xí)控制 6.2.1 基于Elman網(wǎng)絡(luò)的Q學(xué)習(xí) 6.2.2 Elman網(wǎng)絡(luò)學(xué)習(xí)算法 6.2.3 基于Elman網(wǎng)絡(luò)的Q學(xué)習(xí)方法步驟 6.3 仿真研究 6.4 本章小結(jié) 參考文獻第7章 基于自適應(yīng)FRBF網(wǎng)絡(luò)的強化學(xué)習(xí) 7.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Actor-Qitic學(xué)習(xí) 7.1.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Actorcritic學(xué)習(xí)結(jié)構(gòu) 7.1.2 自適應(yīng)FRBF網(wǎng)絡(luò)的學(xué)習(xí) 7.1.3 算法步驟 7.1.4 仿真研究 7.2 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Q學(xué)習(xí) 7.2.1 基于自適應(yīng)FRBF網(wǎng)絡(luò)的Q學(xué)習(xí)結(jié)構(gòu) 7.2.2 自適應(yīng)FRBF網(wǎng)絡(luò)的學(xué)習(xí) 7.2.3 算法步驟 7.2.4 仿真研究 7.3 本章小結(jié) 參考文獻第8章 基于支持向量機的強化學(xué)習(xí) 8.1 SVM 8.1.1 機器學(xué)習(xí) 8.1.2 核學(xué)習(xí) 8.1.3 SVM的思想 8.1.4 SVM的重要概念 8.2 基于SVM的強化學(xué)習(xí) 8.2.1 基于SVM的Q學(xué)習(xí)結(jié)構(gòu) 8.2.2 基于滾動時間窗機制的SVM 8.2.3 算法步驟 8.2.4 仿真研究 8.3 基于協(xié)同最小二乘SVM的強化學(xué)習(xí) 8.3.1 基于協(xié)同最小二乘SVM的Q學(xué)習(xí) 8.3.2 LS-SVRM逼近狀態(tài)一動作對到值函數(shù)的映射關(guān)系 8.3.3 LS-SVCM逼近狀態(tài)空間到動作空間的映射關(guān)系 8.3.4 仿真研究 8.4 本章小結(jié) 參考文獻第9章 基于高斯過程分類器的強化學(xué)習(xí) 9.1 基于高斯過程分類器的強化學(xué)習(xí) 9.2 在線高斯過程分類器學(xué)習(xí) 9.3 算法步驟 9.4 仿真研究 9.5 本章小結(jié) 參考文獻第10章 基于圖上測地高斯基函數(shù)的策略迭代強化學(xué)習(xí) 10.1 環(huán)境的圖論描述 10.2 測地高斯基函數(shù) 10.3 遞歸最小二乘策略迭代 10.4 算法步驟 10.5 仿真研究 10.6 本章小結(jié) 參考文獻第11章 多目標(biāo)優(yōu)化問題的差分進化一分布估計算法 11.1 多目標(biāo)優(yōu)化 11.2 多目標(biāo)優(yōu)化的差分進化一分布估計算法 11.2.1 多目標(biāo)優(yōu)化的DE-EDA混合算法步驟 11.2.2 多目標(biāo)優(yōu)化的DE子代生成策略 11.2.3 多目標(biāo)優(yōu)化的EDA子代生成策略 11.3 實例研究 11.4 本章小結(jié) 參考文獻第12章 基于細菌覓食行為的分布估計算法在預(yù)測控制中的應(yīng)用 12.1 方法的提出 12.2 基于改進分布估汁算法的預(yù)測控制 12.2.1 預(yù)測模型 12.2.2 反饋校正模型 12.2.3 基于改進分布估計算法的滾動優(yōu)化 12.3 實驗分析 12.3.1 Benchmark函數(shù)實驗 12.3.2 預(yù)測控制的曲線跟蹤實驗 12.4 本章小結(jié) 參考文獻第13章 一種多樣性保持的分布估計算法 13.1 混沌模型 13.2 多樣性保持分布估計算法 13.3 Benchmark函數(shù)實驗 13.4 在支持向量機參數(shù)選擇中的應(yīng)用 13.4.1 算法步驟 13.4.2 Chebyshev混沌時間序列預(yù)測 13.5 本章小結(jié) 參考文獻附錄 部分機器學(xué)習(xí)算法MATLAB源程序 程序1 第11章 多目標(biāo)差分進化-分布估計算法MATLAB源程序 程序2 第12章 基于細菌覓食行為的分布估計算法部分MATLAB源程序 程序3 第13章 一種多樣性保持的分布估計算法部分MATLAB程序
章節(jié)摘錄
插圖:第2章 基于時間差分的神經(jīng)網(wǎng)絡(luò)預(yù)測控制預(yù)測控制是20世紀(jì)70年代中后期在歐美工業(yè)領(lǐng)域內(nèi)出現(xiàn)的,它是在新型計算機控制算法基礎(chǔ)上發(fā)展起來的,是一種基于模型的先進控制技術(shù),亦稱為模型預(yù)測控制(model predictive control,MPC)。預(yù)測控制技術(shù)的產(chǎn)生有著深刻的實際背景,這主要是由于被控對象日益復(fù)雜,一般的控制理論對信息描述的要求和優(yōu)化模式都難以滿足復(fù)雜工業(yè)過程的要求,而預(yù)測控制對模型的要求低,能兼顧被控對象的非線性、時變性因素及干擾的影響,不但跟蹤性能好,而且對模型失配有較強的魯棒性。因此,預(yù)測控制作為一種面向復(fù)雜系統(tǒng)的控制策略,一開始就受到國內(nèi)外控制界眾多學(xué)者的重視,并在理論研究和實際應(yīng)用方面取得了不少成果。在過去的幾十年里,非線性預(yù)測控制已經(jīng)被成功地應(yīng)用于石油、化工以及電力等工業(yè)過程控制中,這些過程具有較強的非線性,用一般線性控制模型和方法難以得到良好的控制品質(zhì)。預(yù)測控制的基本思想是充分利用過去時刻的輸入、輸出信息建立預(yù)測模型,然后利用預(yù)測模型對系統(tǒng)未來的輸出做出預(yù)測,從而通過長時域的優(yōu)化獲得最優(yōu)的控制量,實現(xiàn)對被控對象的有效控制。它的主要特點是:預(yù)測模型的多樣性,滾動優(yōu)化的時序性,在線校正的適應(yīng)性以及工業(yè)過程的實用性。目前,預(yù)測控制對于控制變化比較緩慢的生產(chǎn)過程或?qū)ο?,一般均能取得很好的效果,但是,對于機電類快變過程的快速跟蹤控制問題,如機器人、火炮或雷達的目標(biāo)跟蹤和冶金軋制過程等,由于控制算法過于復(fù)雜,運算量大,往往難以在線實時控制。因此,有必要尋找一種算法簡單、控制迅速有效的預(yù)測控制方法。
編輯推薦
《機器學(xué)習(xí)理論、方法及應(yīng)用》主要圍繞當(dāng)前機器學(xué)習(xí)領(lǐng)域的熱點問題展開討論,體現(xiàn)的學(xué)術(shù)思想新穎且內(nèi)容廣泛。在詳細闡述機器學(xué)習(xí)理論與新方法的同時,強調(diào)理論聯(lián)系實際,給出了機器學(xué)習(xí)方法在機械手軌跡跟蹤控制、小車爬山最短時間控制、倒立擺平衡控制、小船過河控制、機器人迷宮行走以及復(fù)雜數(shù)值函數(shù)優(yōu)化等方面的具體應(yīng)用,通過實例說明原理,富有啟發(fā)性。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
機器學(xué)習(xí)理論、方法及應(yīng)用 PDF格式下載