ppt第六章動(dòng)態(tài)規(guī)劃

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-06 格式：ppt 頁(yè)數(shù)：71 大?。?.25MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁(yè)，還剩70頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、6.1 多級(jí)決策的例子——最短時(shí)間問(wèn)題6.2 最優(yōu)性原理6.3 用動(dòng)態(tài)規(guī)劃解資源分配問(wèn)題6.4 用動(dòng)態(tài)規(guī)劃求離散最優(yōu)控制6.5 連續(xù)系統(tǒng)的動(dòng)態(tài)規(guī)劃6.6 動(dòng)態(tài)規(guī)劃與極小值原理6.7 小結(jié),第六章動(dòng)態(tài)規(guī)劃,動(dòng)態(tài)規(guī)劃是貝爾曼(Bellman)在五十年代為解決多級(jí)決策過(guò)程而提出來(lái)的。它可以解決很多領(lǐng)域中的問(wèn)題，如生產(chǎn)過(guò)程的決策，收益和投資問(wèn)題，有多級(jí)反應(yīng)器的化工裝置的設(shè)計(jì)，多級(jí)軋鋼機(jī)的最速軋制問(wèn)題，資源分配、機(jī)

2、器負(fù)荷分配、生產(chǎn)計(jì)劃編制，特別是控制工程問(wèn)題。,,,它和極小值原理一樣，可解決控制變量受約束的最優(yōu)控制問(wèn)題，而且在這兩種方法之間存在某種內(nèi)在的聯(lián)系。動(dòng)態(tài)規(guī)劃的中心思想是利用所謂“最優(yōu)性原理”，把一個(gè) 級(jí)決策過(guò)程化為個(gè)單級(jí)決策過(guò)程，從而使問(wèn)題簡(jiǎn)單。,6.1 多級(jí)決策的例子——最短時(shí)間問(wèn)題,,,,圖6-1 按最短時(shí)間的路徑選擇,（一）窮舉法,,,,從走到一共有六條路線(xiàn)，每條路線(xiàn)由四段組成。這六

3、條路線(xiàn)和對(duì)應(yīng)的行車(chē)時(shí)間如下,路線(xiàn) 行車(chē)時(shí)間（小時(shí)） 13 11 14 13

4、12 9,,,,,,,,顯然最優(yōu)路線(xiàn)是，它所花時(shí)間為9小時(shí)。,這里每條路線(xiàn)由四段組成，也可以說(shuō)是四級(jí)決策。為了計(jì)算每條路線(xiàn)所花時(shí)間，要做三次加法運(yùn)算，為了計(jì)算六條路線(xiàn)所花的時(shí)間要作3×6=18次運(yùn)算。這種方法稱(chēng)為“窮舉法”。顯然當(dāng)段數(shù)很多時(shí)，計(jì)算量是很大的。這種方法的特點(diǎn)是從起點(diǎn)站往前進(jìn)行，而且把這四級(jí)決策一起考

5、慮。應(yīng)注意從到下一站所花的時(shí)間為1，而到所花時(shí)間為3，但最優(yōu)路線(xiàn)卻不經(jīng)過(guò) 。這說(shuō)明只看下一步的“眼前利益”來(lái)作決策是沒(méi)有意義的。,,,,,（二）動(dòng)態(tài)規(guī)劃法,為將問(wèn)題表達(dá)得清楚，引進(jìn)下面的術(shù)語(yǔ)。,,,,,,令表示由某點(diǎn) 到終點(diǎn)的段數(shù)（如到為2段）。,,,令表示當(dāng)前所處點(diǎn)的位置（如），稱(chēng)為狀態(tài)變量。,令為決策（控制）變量，它表示當(dāng)

6、處在位置而還有段要走時(shí)，所要選取的下一點(diǎn)。例如，從出發(fā)，下一點(diǎn)為時(shí)，則表示為。,,,,,,,,令表示從點(diǎn) 到點(diǎn) 的時(shí)間。例如，從到的時(shí)間為,,,有了這些術(shù)語(yǔ)后，就可用動(dòng)態(tài)規(guī)劃來(lái)解這個(gè)例子。從最后一段出發(fā)進(jìn)行計(jì)算，并將計(jì)算出的最短時(shí)間用括號(hào)表示在相應(yīng)的點(diǎn) 處（見(jiàn)圖

7、6-1）。,1 （倒數(shù)第一段）,,,,考慮從和到的路線(xiàn)，由定義可知，最短時(shí)間分別為,,,n=1,2（倒數(shù)第二段）,,,,,,,,,,考慮從、或到的路線(xiàn)。由到有兩種路線(xiàn)：，。兩種路線(xiàn)中的最短時(shí)間由下式確定：,,最優(yōu)決策為。,,,,,由到

8、只有一種路線(xiàn) ，其時(shí)間為,,,,3（倒數(shù)第三段）,,,,考慮從B1或B2到E的路線(xiàn)。B1到E有兩種路線(xiàn)：和。最短時(shí)間為,,,最優(yōu)決策,,,從B2到E有兩種路線(xiàn)：和。最短時(shí)間為,,,最優(yōu)決策為。,4（倒數(shù)第四段）,,,,,從到的路線(xiàn)有兩種：和。最短時(shí)間為：,,,最優(yōu)決策為

9、。,,至此求出了A到E的最短時(shí)間為9，最優(yōu)路線(xiàn)為。在圖6-1中用粗線(xiàn)表示。這里，為決定最優(yōu)路線(xiàn)進(jìn)行了10次加法，比窮舉法的18次少了8次。當(dāng)段數(shù)n更多時(shí)，節(jié)省計(jì)算將會(huì)更多。,,,,,,從上面解題過(guò)程可見(jiàn)，動(dòng)態(tài)規(guī)劃解題的兩個(gè)特點(diǎn)：它是從最后一級(jí)往后倒著計(jì)算的；它把一個(gè) 級(jí)決策問(wèn)題（這里是決定一整條路線(xiàn)）化為個(gè)單級(jí)決策問(wèn)題，即把一個(gè)復(fù)雜問(wèn)題化為多個(gè)簡(jiǎn)單問(wèn)題來(lái)求解。我

10、們可看出階段與階段有下面的關(guān)系（）,,（6-1）,,,（表示最后一級(jí)）,,,,,(6-1)式稱(chēng)為函數(shù)方程，從(6-1)式可見(jiàn),在選擇了決策后有兩個(gè)影響，其一是直接影響下一段的時(shí)間（眼前利益），其二是影響以后段的最短時(shí)間（未來(lái)利益）。因此動(dòng)態(tài)規(guī)劃方法可以說(shuō)是把眼前利益和未來(lái)利益區(qū)分開(kāi)來(lái)又結(jié)合

11、起來(lái)考慮的一種優(yōu)化方法。這些特點(diǎn)都是由動(dòng)態(tài)規(guī)劃法的基本原理——最優(yōu)性原理所決定的。,6.2 最優(yōu)性原理,貝爾曼的最優(yōu)性原理可敘述如下：“一個(gè)多級(jí)決策問(wèn)題的最優(yōu)決策具有這樣的性質(zhì)：當(dāng)把其中任何一級(jí)及其狀態(tài)作為初始級(jí)和初始狀態(tài)時(shí)，則不管初始狀態(tài)是什么，達(dá)到這個(gè)初始狀態(tài)的決策是什么，余下的決策對(duì)此初始狀態(tài)必定構(gòu)成最優(yōu)策略。”,,,,,,,,,,,以上面的最短時(shí)間問(wèn)題為例，如把當(dāng)作初始狀態(tài)，則余下的決策 2E對(duì) 來(lái)講是最優(yōu)

12、策略；如把當(dāng)初始狀態(tài)，則余下的決策對(duì) 來(lái)講也構(gòu)成最優(yōu)策略。一般來(lái)說(shuō)，如果一個(gè)最優(yōu)過(guò)程用狀態(tài) 來(lái)表示，最優(yōu)決策為，則對(duì)狀態(tài) 來(lái)講，必定是最優(yōu)的，這可用圖6-2來(lái)表示。,,圖6-2 最優(yōu)性原理示意圖,,,在多數(shù)實(shí)際問(wèn)題中，級(jí)決策的性能指標(biāo) 取如下形式,,,,,,,是由某級(jí)狀態(tài)和決策決定的性能函數(shù)，要求尋找決策

13、使J取極小值。,最優(yōu)性原理可表示為,,（6-2）,,,,,,根據(jù)上式就可證明最優(yōu)性原理的正確性。若以為初態(tài)時(shí)，余下的決策不是最優(yōu)的，那么就存在另一決策序列所決定的指標(biāo)值，于是,,,這與是極小值發(fā)生矛

14、盾，所以余下的決策必須是最優(yōu)的。,,,,（6-1）式的函數(shù)方程與（6-2）式所表示的最優(yōu)性原理是一致的，只是表示方法不同。（6-1）式中的下標(biāo)n表示離終點(diǎn)的級(jí)數(shù)，（6-2）式中的下標(biāo) 表示離起點(diǎn)的級(jí)數(shù)。兩式的對(duì)照留給讀者去做。,,（6-3）,,由上式可見(jiàn)，最優(yōu)化的過(guò)程是從最里面的方括號(hào)開(kāi)始向外擴(kuò)展的，即尋找最優(yōu)控制的次序是

15、。因此根據(jù)最優(yōu)性原理，動(dòng)態(tài)規(guī)劃是從最后一級(jí)倒退計(jì)算的。,將（6-2）式進(jìn)一步分解為,6.3 用動(dòng)態(tài)規(guī)劃解資源分配問(wèn)題,,,,,,,,我們提到過(guò)，動(dòng)態(tài)規(guī)劃的應(yīng)用范圍是非常廣的。這里介紹用動(dòng)態(tài)規(guī)劃解決資源分配問(wèn)題。假定有種資源用來(lái)生產(chǎn) 種產(chǎn)品（資源可以指工人、機(jī)床、資金等，每種資源的總數(shù)為）。如果生產(chǎn)第種產(chǎn)品時(shí)投入的各種資源量為

16、則可以得到的收益為，它是所分配的資源量的函數(shù)，可寫(xiě)成。現(xiàn)在問(wèn)應(yīng)如何分配這些資源到各個(gè)產(chǎn)品上，使得所有產(chǎn)品的總收益為最大？,,,（6-4）,取最大，其中滿(mǎn)足約束,,,（6-5）,,,（6-6）,寫(xiě)成數(shù)學(xué)形式，即要使,,,,,上面的問(wèn)題可以用動(dòng)態(tài)規(guī)劃求解。為了說(shuō)明問(wèn)題簡(jiǎn)單起見(jiàn)，這里只考慮單資源分配問(wèn)題，即如何將一種資源分配給種產(chǎn)品，使總收益最大。

17、設(shè)這種資源的總數(shù)為，分配給第種產(chǎn)品的數(shù)量為，則性能指標(biāo)為,,,（6-7）,取最大，約束條件是,,,（6-8）,,,,,,為了用動(dòng)態(tài)規(guī)劃求解，引進(jìn)一個(gè)函數(shù) ，它表示將資源量分配給第1至第種產(chǎn)品時(shí)所能得到的最大收益。顯然表示將總資源分配到所有種產(chǎn)品上所得到的最大收益，即,,,（6-9）,容易看出，函數(shù) 有下列

18、性質(zhì),,,即沒(méi)有資源投入時(shí)收益為零。,,,這表明將資源量只用于生產(chǎn)一種產(chǎn)品時(shí)的總收益，就是這種產(chǎn)品本身收益。,即不生產(chǎn)產(chǎn)品時(shí)收益為零。,這些性質(zhì)構(gòu)成了以后解題的邊界的條件。,,,,,,,,,,,,,,,,如果把種產(chǎn)品的資源分配看成是步?jīng)Q策，則表示步?jīng)Q策的指標(biāo)最優(yōu)值，表示用決策量時(shí)第

19、步的指標(biāo)值，表示余下步?jīng)Q策的指標(biāo)最優(yōu)值，根據(jù)最優(yōu)性原理（對(duì)照（6-2）式），則有,,（6-10）,,,,,,,這表明若在第1至種產(chǎn)品上的最優(yōu)分配為，則一定是資源量在前 -1種產(chǎn)品上的最優(yōu)分配。,例1-1,,,,,解由邊界條件知 ?，F(xiàn)在慮，它表示用1個(gè)單元資源

20、分配到2個(gè)產(chǎn)品上的最大收益。表示投入第2個(gè)產(chǎn)品的資源，則可取值1或0，對(duì)應(yīng)地將有下表。,,,,,,,,,,,根據(jù)（6-10）式可得,,同理，當(dāng)可取值3，2，1，0時(shí)可求得,,再考慮3個(gè)產(chǎn)品的資源分配，可得這三個(gè)產(chǎn)品投入資源的單元數(shù)為1，2，3，4時(shí)的，最優(yōu)值如下,,,即把一個(gè)單元的資源分配給第三種產(chǎn)品，把三個(gè)單元的資源分配給第一種產(chǎn)品，第二種產(chǎn)品不分配資源，這時(shí)總收益達(dá)最大值28。,可見(jiàn),6.4 用動(dòng)態(tài)規(guī)劃

21、求離散最優(yōu)控制,離散系統(tǒng)的狀態(tài)方程為,,,（6-11）,性能指標(biāo)為,,（6-12）,例6-2,系統(tǒng)方程為,,,給定（6-13）,,（6-14）,,要求用動(dòng)態(tài)規(guī)劃尋找最優(yōu)控制序列使J最小。,,,,求使最小，得,,這個(gè)結(jié)果與例5-4用離散極小值原理求解結(jié)果完全一樣。,于是最優(yōu)性能指標(biāo)與最優(yōu)狀態(tài)轉(zhuǎn)移為,6.5 連續(xù)系統(tǒng)的動(dòng)態(tài)規(guī)劃,設(shè)系統(tǒng)的狀態(tài)方程和性能指標(biāo)為,,,,,,,,受約束，可

22、寫(xiě)成為某一閉集。要尋找滿(mǎn)足此約束且使最小的最優(yōu)控制。,,（6-21）,,顯然滿(mǎn)足終端條件,,,,,,通常假定對(duì) 及的二階偏導(dǎo)數(shù)存在且有界。,,（6-23）,根據(jù)最優(yōu)性原理，從也應(yīng)是最優(yōu)過(guò)程。,,,因故,,這樣，式（6-23）可寫(xiě)

23、成,,（6-24）,,,,,從上式兩端消去，除以，再令，可得,,（6-25）,引用以前使用過(guò)的哈密頓函數(shù),（6-26）,（6-27）,則（6-25）可寫(xiě)成,（6-28）,（6-25）或（6-28）稱(chēng)為哈密頓—雅可比—貝爾曼方程，邊界條件是（6-22）式。哈密頓—雅可比—貝爾曼方程在理論上很有價(jià)值，但它是的一階偏微分方程并帶有取極小的運(yùn)算，因此求解是非常困難的，一般情況得不到解析解，只能用

24、計(jì)算機(jī)求數(shù)值解。對(duì)于線(xiàn)性二次問(wèn)題，可以得到解析解，而且求解結(jié)果與用極小值原理或變分法所得結(jié)果相同。這時(shí)，哈密頓——雅可比——貝爾曼方程可歸結(jié)為黎卡提方程。在實(shí)際計(jì)算線(xiàn)性二次問(wèn)題時(shí)，一般用直接求解黎卡提方程來(lái)求最優(yōu)控制。,,6.6 動(dòng)態(tài)規(guī)劃與極小值原理,動(dòng)態(tài)規(guī)劃和極小值原理是最優(yōu)控制理論的兩大基石，它們都可以解決有約束的最優(yōu)控制問(wèn)題，雖然在形式上和解題方法上不同，但卻存在著內(nèi)在的聯(lián)系。下面我們從動(dòng)態(tài)規(guī)劃來(lái)推演極小值原理，不過(guò)要說(shuō)明這種推

25、演是基于最優(yōu)指標(biāo)對(duì)和兩次連續(xù)可微這個(gè)條件的。,于是最優(yōu)性能指標(biāo)與最優(yōu)狀態(tài)轉(zhuǎn)移為,,,（6-29）,,要求確定使性能指標(biāo),,（6-30）,,極小。其中，固定，自由，可以有約束，也可以沒(méi)有。,,,1、（狀態(tài)方程）（6-31）,,2、（協(xié)態(tài)方程）（6-32）,,3、（邊界方程）

26、（6-33）,,4、（橫截條件）（6-34）,,5、（極值條件）（6-35）,,用動(dòng)態(tài)規(guī)劃求解的結(jié)果已在上節(jié)中得到，現(xiàn)在歸納一下：在動(dòng)態(tài)規(guī)劃中協(xié)態(tài)變量滿(mǎn)足,,,,哈密頓—雅可比—貝爾曼方程（6-28）本身說(shuō)明了哈密頓函數(shù)在最優(yōu)控制上取極值的條件，故等同于上面極小值原理所得的條件5，不過(guò)（6-28）還多給出了一

27、點(diǎn)信息，即。,下面由動(dòng)態(tài)規(guī)劃法來(lái)推出協(xié)態(tài)方程。,由（6-27）,,,,因假設(shè)對(duì)兩次連續(xù)可微，因此上式成立，且可交換求導(dǎo)次序，得,,即協(xié)態(tài)方程（6-32）（因都是最優(yōu)解條件。故省去*號(hào)）。由（6-22）和（6-27）再來(lái)推橫截條件,,,,6.7 小結(jié),1. 動(dòng)態(tài)規(guī)劃是把多級(jí)決策問(wèn)題化為多個(gè)單級(jí)決策問(wèn)題來(lái)求解的，而單級(jí)問(wèn)題比多級(jí)問(wèn)題容易處理得多。這種把一個(gè)復(fù)雜的特定問(wèn)題化為（又可稱(chēng)為嵌入）一系列性質(zhì)

28、相似的易于求解的問(wèn)題的做法稱(chēng)為“不變嵌入”法。,2. 動(dòng)態(tài)規(guī)劃的基礎(chǔ)是最優(yōu)性原理。這個(gè)原理告訴我們：在多級(jí)最優(yōu)決策中，不管初始狀態(tài)是什么，余下的決策對(duì)此狀態(tài)必定構(gòu)成最優(yōu)決策。根據(jù)這個(gè)原理，動(dòng)態(tài)規(guī)劃解決多級(jí)決策問(wèn)題（包括離散系統(tǒng)最優(yōu)控制）是從最后一級(jí)開(kāi)始倒向計(jì)算的。,,,3. 連續(xù)系統(tǒng)的動(dòng)態(tài)規(guī)劃可導(dǎo)出哈密頓——雅可比——貝爾曼方程，這個(gè)方程一般只能有數(shù)值解。從它可推演出極小值原理，不過(guò)要假定 , 二次連

眾賞文庫(kù)> 全部分類(lèi)> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論

 聯(lián)系客服

本站為文檔C2C交易模式，即用戶(hù)上傳的文檔直接被用戶(hù)下載，本站只是中間服務(wù)平臺(tái)，本站所有文檔下載所得的收益歸上傳人(含作者)所有。眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知眾賞文庫(kù)，我們立即給予刪除！

備案號(hào): 經(jīng)營(yíng)許可證編號(hào):浙ICP備20018660號(hào)

/ 71

  0
 分享

復(fù)制分享文檔地址

http://facezit.com/shtml/view-6627870.html

復(fù)制

下載本文檔

ppt第六章動(dòng)態(tài)規(guī)劃

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載