馬爾可夫決策過程引論

出版時間:2000-7  出版社:西安電子科技大學(xué)出版社  作者:胡奇英  頁數(shù):273  
Tag標(biāo)簽:無  

內(nèi)容概要

  馬爾可夫決策過程是研究隨機(jī)環(huán)境下多階段決策過程優(yōu)化問題的理論工具,在過去的幾十年中,隨著生態(tài)科學(xué)、經(jīng)濟(jì)理論、通訊工程以及眾多學(xué)科中需要考慮不確定因素和序列決策問題的大量新模型的涌現(xiàn),進(jìn)一步刺激了馬爾可夫決策過程在理論上和應(yīng)用領(lǐng)域中長足發(fā)展。本書從簡單的例子開始,介紹了馬爾可夫決策過程的基本概念、決策過程以及一些常用的基本理論。還介紹了多種最優(yōu)準(zhǔn)則,包括有限階段準(zhǔn)則、折扣準(zhǔn)則、平均準(zhǔn)則、權(quán)重報(bào)酬準(zhǔn)則、概率準(zhǔn)則等。從模型角度考慮了有限狀態(tài)空間、可數(shù)狀態(tài)空間和一般Borel狀態(tài)空間;從決策時間上來說,考慮了離散時間、連續(xù)時間和半馬氏決策時刻問題。本文還介紹了大量的應(yīng)用實(shí)例以及建模方法。本書可作為高年級大學(xué)和研究生教材,也可作為運(yùn)籌學(xué)、管理科學(xué)、信息科學(xué)、系統(tǒng)科學(xué)以及計(jì)算機(jī)科學(xué)和工程領(lǐng)域的學(xué)者和技術(shù)人員的參考書。

書籍目錄

序言一些常用的符號和縮第1章 引論1.1 序列決策模型1.2 馬氏決策過程的例子1.3 馬氏決策過程的定義與記號1.4 馬氏決策過程的起源和發(fā)展第2章 有限階段模型2.1 最優(yōu)準(zhǔn)則2.2 有限階段的策略迭代和最優(yōu)方程2.3 最優(yōu)策略的存在性和算法2.4 兩個例子2.5 單調(diào)策略的最優(yōu)性第3章 無限階段折扣模型3.1 最優(yōu)準(zhǔn)則3.2 最優(yōu)方程3.3 最優(yōu)策略的存在性3.4 策略迭代算法3.5 值迭代算法3.6 改進(jìn)的策略迭代算法3.7 線性規(guī)劃算法3.8 可數(shù)狀態(tài)與行動的模型3.9 最優(yōu)單調(diào)策略3.10 最優(yōu)策略的結(jié)構(gòu)第4章 無限階段平均模型4.1 最優(yōu)準(zhǔn)則4.2 最優(yōu)平穩(wěn)策略的存在性4.3 平穩(wěn)策略的一些特征4.4 最優(yōu)方程與策略迭代算法4.5 單鏈時的情形4.6 多鏈時的情形第5章 權(quán)重準(zhǔn)則模型與概率準(zhǔn)則模型5.1 折扣權(quán)重模型5.2 折扣與平均權(quán)重模型5.3 MDP的百分比與目標(biāo)水平5.4 風(fēng)險概率準(zhǔn)則模型第6章 連續(xù)時間與半馬氏模型6.1 連續(xù)時間折扣MDP6.2 連續(xù)時間平均MDP6.3 折扣半馬氏模型6.4 平均半馬氏模型6.5 服務(wù)率受控的一個排隊(duì)模型第7章 空集裝箱調(diào)配問題7.1 單港口的問題與建模7.2 無限階段折扣準(zhǔn)則7.3 無限階段平均準(zhǔn)則7.4 數(shù)值例子7.5 多港口空集裝箱的調(diào)配問題第8章 人力資源模型8.1 問題8.2 數(shù)學(xué)模型8.3 相關(guān)參數(shù)分析8.4 數(shù)例參考文獻(xiàn)索引

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    馬爾可夫決策過程引論 PDF格式下載


用戶評論 (總計(jì)0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7