本書對增強學習與近似動態(tài)規(guī)劃的理論、算法及應用進行了深入研究和論述。主要內容包括:求解Markov鏈學習預測問題的時域差值學習算法和理論,求解連續(xù)空間Markov決策問題的梯度增強學習算法以及進化一梯度混合增強學習算法,基于核的近似動態(tài)規(guī)劃算法,增強學習在移動機器人導航與控制中的應用等。本書是作者在多個國家自然科學基金
本書在哈爾濱工業(yè)大學“自動控制原理”課程歷屆教材的基礎上編寫,并進行了四次修訂。內容包括系統(tǒng)的數(shù)學模型、時域分析法、根軌跡法、頻率特性法、典型非線性環(huán)節(jié)、計算機控制系統(tǒng)、現(xiàn)代控制理論基礎。最后按照全書內容逐章介紹MATLAB的應用,包括系統(tǒng)分析、設計和仿真框圖等。