基于ADP的在線學習算法及其在熱軋活套中的應用研究.pdf_第1頁
已閱讀1頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本文討論研究了自適應動態(tài)規(guī)劃ADP(Adaptive dynamic programming)這一基于強化學習和動態(tài)規(guī)劃的通用學習控制系統(tǒng)算法。自適應動態(tài)規(guī)劃ADP是一個非常有前途的研究領域,它是自適應控制、認知科學、神經(jīng)系統(tǒng)科學、心理學等多學科交叉融合的產(chǎn)物,可以實現(xiàn)系統(tǒng)的在線學習和最優(yōu)控制。
  在過去的數(shù)十年間,ADP理論算法研究發(fā)展很快并走出實驗室在軍事、工業(yè)上取得成功應用,顯示出其卓越的最優(yōu)控制性能。但是目前的有關ADP

2、的應用研究都是集中在多變量輸入單變量輸出(MISO)的梯度下降尋優(yōu)的控制系統(tǒng)。熱軋中厚板帶鋼生產(chǎn)線是一個多變量的復雜的控制系統(tǒng),活套控制系統(tǒng)是熱軋帶鋼生產(chǎn)線中一個重要的部分,是實現(xiàn)中厚板帶鋼熱連軋的關鍵設備?;钐卓刂葡到y(tǒng)也是集中了電氣傳動技術、計算機技術、液壓伺服控制系統(tǒng)、自動控制技術等技術的綜合產(chǎn)物,所以對活套控制技術進行研究,從而提高熱軋中厚板帶鋼的產(chǎn)量和質量指標是很有意義的?;钐卓刂葡到y(tǒng)主要分為對活套高度的控制和帶鋼張力的控制兩個

3、方面,其控制目的就是想讓活套的高度和熱軋帶鋼的張力兩者能夠維持在相應設定值上。因為它是一個雙輸入雙輸出的多變量強耦合系統(tǒng)。常規(guī)是將活套高度控制和活套張力控制分別當作兩個獨立的子系統(tǒng),將耦合視為擾動進行控制效果不是很理想。而自適應動態(tài)規(guī)劃(ADP)是一種更為通用且具有在線學習的控制算法,解決此類問題有著巨大的潛力。本文在對自適應動態(tài)規(guī)劃(ADP)研究的基礎上,主要工作如下:(1)論文在經(jīng)典執(zhí)行器-評價器結構的ADHDP算法基礎上對ANN網(wǎng)

4、絡及其權值更新算法做了改進,將其從僅適用MISO系統(tǒng)對象推廣到適用于MIMO系統(tǒng),這是一種更為通用、更實用的在線學習控制模型(GMIMO);(2)對熱軋中厚板帶鋼控制系統(tǒng)中的關鍵設備液壓活套的控制模型進行研究并建立液壓活套控制數(shù)學模型和仿真模型;(3)將改進型的MIMO ADHDP算法成功應用于活套的高度和張力多變量控制,并用MATLAB仿真軟件進行仿真。ADP在線學習算法有效的克服動態(tài)規(guī)劃的“維數(shù)災難”問題,和實際物理模型的“模型災難

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論