近似動(dòng)態(tài)規(guī)劃的非線性多輸入多輸出與優(yōu)化控制研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-05 格式：pdf 頁(yè)數(shù)：153 大?。?.40MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

近似動(dòng)態(tài)規(guī)劃的非線性多輸入多輸出與優(yōu)化控制研究.pdf_第1頁(yè)

已閱讀1頁(yè)，還剩152頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近似動(dòng)態(tài)規(guī)劃是近年來(lái)發(fā)展起來(lái)的一種優(yōu)化控制方法。它采用動(dòng)態(tài)規(guī)劃的基本理論，吸取了強(qiáng)化學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)仿真等領(lǐng)域的理論與成果，成功地解決了動(dòng)態(tài)規(guī)劃的“維數(shù)災(zāi)”問題，特別適用于以某一性能指標(biāo)最小化為目標(biāo)的優(yōu)化控制問題。2007年，IEEE協(xié)會(huì)在夏威夷召開了第一屆以近似動(dòng)態(tài)規(guī)劃與強(qiáng)化學(xué)習(xí)為主題的國(guó)際會(huì)議，宣告了近似動(dòng)態(tài)規(guī)劃的重要地位。目前，近似動(dòng)態(tài)規(guī)劃已經(jīng)在一些領(lǐng)域中獲得了成功的應(yīng)用，并有三種主要類型。其中，執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃是

2、應(yīng)用最為廣泛的一種，因?yàn)樗恍枰豢貙?duì)象的數(shù)學(xué)模型。然而無(wú)論在理論還是應(yīng)用上，近似動(dòng)態(tài)規(guī)劃都還不夠完善，特別是在非線性多輸入多輸出系統(tǒng)的控制問題上研究得更少，而實(shí)際系統(tǒng)又多為非線性多輸入多輸出形式，所以這是應(yīng)用近似動(dòng)態(tài)規(guī)劃之前，必須深入研究的一個(gè)重要課題。
　　本文的主要目的是研究非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃推導(dǎo)的數(shù)學(xué)基礎(chǔ)；根據(jù)實(shí)際對(duì)象歸納出四種典型的非線性多輸入多輸出形式，對(duì)應(yīng)系統(tǒng)地提出四種非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)

3、規(guī)劃及其在線學(xué)習(xí)算法；并證明其穩(wěn)定與收斂性能；最后分別采用實(shí)時(shí)仿真與實(shí)驗(yàn)，研究了推導(dǎo)與證明過程的正確性、以及這四種方法的優(yōu)化控制應(yīng)用。
　　本文采用數(shù)學(xué)推導(dǎo)證明、數(shù)值仿真與實(shí)驗(yàn)相結(jié)合的方法來(lái)研究非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃?；诜醋C法證明了復(fù)合矩陣/向量函數(shù)的求導(dǎo)不一定滿足鏈?zhǔn)椒▌t，并研究出其數(shù)學(xué)解決方法；從而構(gòu)建與推導(dǎo)出四種非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃及其在線學(xué)習(xí)算法；采用李雅譜諾夫穩(wěn)定性理論證明了這些方法的穩(wěn)定與

4、收斂性能；仿真與實(shí)驗(yàn)充分考慮了這些方法的特點(diǎn)，能實(shí)時(shí)實(shí)驗(yàn)這些方法的控制應(yīng)用及性能指標(biāo)。
　　對(duì)非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃推導(dǎo)的數(shù)學(xué)基礎(chǔ)研究表明，除兩種特殊情況以外，復(fù)合矩陣/向量函數(shù)的求導(dǎo)不一定滿足鏈?zhǔn)椒▌t。因此在非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃學(xué)習(xí)算法的推導(dǎo)過程中僅采用標(biāo)量對(duì)標(biāo)量的求導(dǎo)，以確保其具有嚴(yán)密的數(shù)學(xué)基礎(chǔ)。
　　對(duì)四種典型系統(tǒng)的非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃及其在線學(xué)習(xí)算法的研究表明，根據(jù)上述數(shù)學(xué)解決方

5、法，以標(biāo)準(zhǔn)執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃的網(wǎng)絡(luò)結(jié)構(gòu)及其學(xué)習(xí)算法為基礎(chǔ)：
　　(1)將標(biāo)準(zhǔn)近似動(dòng)態(tài)規(guī)劃的執(zhí)行網(wǎng)絡(luò)輸出層擴(kuò)展為多輸出，可推出執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃。該方法的計(jì)算量較小，適用于各執(zhí)行輸出屬于同一數(shù)量級(jí)，而各輸入變量之間不具有函數(shù)關(guān)系的場(chǎng)合。
　　(2)將標(biāo)準(zhǔn)近似動(dòng)態(tài)規(guī)劃的執(zhí)行網(wǎng)絡(luò)根據(jù)控制變量的數(shù)目復(fù)制為多份，多份執(zhí)行網(wǎng)絡(luò)組成并聯(lián)結(jié)構(gòu)，可推出子網(wǎng)方法的非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)

6、劃。該方法能解決多輸出變量不屬于同一數(shù)量級(jí)或者數(shù)值差別較大的問題，但增加了一些計(jì)算量。子網(wǎng)方法的多個(gè)執(zhí)行網(wǎng)絡(luò)應(yīng)當(dāng)在同一時(shí)間步長(zhǎng)內(nèi)學(xué)習(xí)和更新權(quán)值，以防止學(xué)習(xí)算法的混疊。
　　(3)將標(biāo)準(zhǔn)近似動(dòng)態(tài)規(guī)劃的執(zhí)行網(wǎng)絡(luò)根據(jù)控制變量的數(shù)目復(fù)制為多份，多份執(zhí)行網(wǎng)絡(luò)組成串聯(lián)結(jié)構(gòu)，可推出級(jí)聯(lián)執(zhí)行網(wǎng)絡(luò)方法的非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃。該方法適用于多輸入變量之間具有函數(shù)關(guān)系的場(chǎng)合，同時(shí)該方法也利用此函數(shù)關(guān)系來(lái)簡(jiǎn)化控制器的設(shè)計(jì)。由于誤差的反向

7、傳播，其前級(jí)執(zhí)行網(wǎng)絡(luò)的權(quán)值更新計(jì)算要比后級(jí)執(zhí)行網(wǎng)絡(luò)的復(fù)雜得多，但本質(zhì)上可以等效于訓(xùn)練一個(gè)多層神經(jīng)網(wǎng)絡(luò)的權(quán)值。
　　(4)上述三種方法之中的任意兩種或三種相組合，可得到組合方法的非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃，用于控制更加復(fù)雜的對(duì)象。上述四種方法的前向計(jì)算與在線學(xué)習(xí)算法均不同于標(biāo)準(zhǔn)近似動(dòng)態(tài)規(guī)劃的，需采用本文提出的前向計(jì)算與在線學(xué)習(xí)算法來(lái)求解。
　　對(duì)非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃的穩(wěn)定與收斂性能研究表明，采用李雅普諾

8、夫直接法可以證明出以平方加權(quán)和以及二次型形式定義的效用函數(shù)，其非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃具有李雅普諾夫意義下的穩(wěn)定性，即是收斂的。從而第一次從效用函數(shù)的角度證明了非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃的穩(wěn)定與收斂性能，同時(shí)也為效用函數(shù)的設(shè)計(jì)提供了依據(jù)。
　　對(duì)非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃的仿真控制研究表明，所推導(dǎo)出的執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法、子網(wǎng)方法以及級(jí)聯(lián)執(zhí)行網(wǎng)絡(luò)方法能有效地仿真控制發(fā)動(dòng)機(jī)怠速缸平衡或飛行器的縱向俯仰角

9、度，從而證明了這些方法的可行性，以及其前向計(jì)算與在線學(xué)習(xí)算法推導(dǎo)的正確性。其中，執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法在優(yōu)化發(fā)動(dòng)機(jī)怠速缸平衡的控制時(shí)不需要檢測(cè)轉(zhuǎn)速波動(dòng)來(lái)自哪一缸，就能智能地補(bǔ)償由于器件差異、老化或燃燒情況等導(dǎo)致的一個(gè)發(fā)動(dòng)機(jī)循環(huán)上轉(zhuǎn)速的波動(dòng)；并且在相同迭代次數(shù)時(shí)，執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的控制速度最快，它可能比現(xiàn)有發(fā)表結(jié)果的收斂速度都要快兩倍，其控制精度也比子網(wǎng)方法的高。子網(wǎng)方法的評(píng)價(jià)網(wǎng)絡(luò)誤差收斂有一個(gè)明顯的長(zhǎng)時(shí)間振蕩過程，而執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的則沒有。

10、子網(wǎng)方法的評(píng)價(jià)與執(zhí)行網(wǎng)絡(luò)誤差收斂到極小值的逼近過程也比執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的長(zhǎng)，相應(yīng)其達(dá)到控制過程最終穩(wěn)定的迭代次數(shù)也要多幾倍。對(duì)于每100次隨機(jī)初始化權(quán)值的迭代訓(xùn)練，執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的控制成功率約為10％，而子網(wǎng)方法的控制成功率約為19%。
　　非線性多輸入多輸出近似動(dòng)態(tài)規(guī)劃的實(shí)驗(yàn)研究也表明，執(zhí)行網(wǎng)絡(luò)擴(kuò)展方法的近似動(dòng)態(tài)規(guī)劃控制器不需要檢測(cè)轉(zhuǎn)速波動(dòng)來(lái)自哪一缸，就能智能地調(diào)節(jié)四個(gè)缸的噴油量來(lái)補(bǔ)償不平衡的燃燒與器件差異等，從而改善WAPS

11、柴油機(jī)怠速缸平衡控制效果，證明了近似動(dòng)態(tài)規(guī)劃控制器在實(shí)際工業(yè)中也具有一定的控制效果。并且借鑒了基于dSPACE的V實(shí)驗(yàn)?zāi)Ｊ剑捎肧imulink建模代替了控制方法的編程，從而加速和簡(jiǎn)化了實(shí)驗(yàn)流程，縮短了實(shí)驗(yàn)周期，同時(shí)為新控制功能的設(shè)計(jì)提供了圖形化的接口。因此本實(shí)驗(yàn)也為柴油機(jī)怠速缸平衡智能優(yōu)化控制增添了新的內(nèi)容。
　　總之，本文所提出的四種非線性多輸入多輸出執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃方法幾乎可用來(lái)求解所有非線性多輸入多輸出系統(tǒng)的近似動(dòng)態(tài)

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

近似動(dòng)態(tài)規(guī)劃的非線性多輸入多輸出與優(yōu)化控制研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

近似動(dòng)態(tài)規(guī)劃的非線性多輸入多輸出與優(yōu)化控制研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載