版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、規(guī)劃是人工智能研究的一個(gè)重要領(lǐng)域,特別是動(dòng)態(tài)不確定環(huán)境 (如真實(shí)世界)中的規(guī)劃問(wèn)題,具有重要的理論意義和極其廣泛的應(yīng)用背景。 部分可觀察的馬爾可夫決策過(guò)程(Partially Observable Markov DecisionProcesses POMDP)對(duì)不確定環(huán)境中的連續(xù)決策進(jìn)行了抽象建模。當(dāng)前用 POMDP來(lái)解決不確定環(huán)境下的規(guī)劃問(wèn)題已經(jīng)成為人工智能研究中的一個(gè)非常重要的研究領(lǐng)域。然而大部分的現(xiàn)實(shí)應(yīng)用都有很大的狀態(tài)空間
2、和觀察空間,求解大規(guī)模的有限階段POMDP的最佳策略是PSPACE-complete難的。本文通過(guò)對(duì)POMDP 模型及已有求解方式的研究,針對(duì)動(dòng)態(tài)不確定環(huán)境下的規(guī)劃問(wèn)題提出一種實(shí)時(shí)在線的POMDP求解方法,并將 POMDF,應(yīng)用于 RoboCup2D 守門(mén)員決策。本文的主要工作包括以下幾點(diǎn): ●介紹POMDP模型,分析已有的POMDP求解算法。 ●通過(guò)對(duì)POMDP模型以及現(xiàn)有技術(shù)的分析,針對(duì)大規(guī)模POMDP求解難的問(wèn)題,
3、提出一種因子化的基于啟發(fā)式搜索的實(shí)時(shí)求解算法FRTHS,該算法采用因子化的狀態(tài)表示以降低維度災(zāi)難對(duì)計(jì)算復(fù)雜度的影響,用啟發(fā)式搜索逐步擴(kuò)展與或策略樹(shù)和反向更新值函數(shù)的方法求解當(dāng)前信念狀態(tài)下最優(yōu)動(dòng)作。另外通過(guò)引入開(kāi)關(guān)變量大大提高了搜索速度。 ●討論了基于FRTHS求解算法的POMDP模型的應(yīng)用范圍,由于在線決策建立在離線計(jì)算的結(jié)果之上,且在實(shí)時(shí)決策時(shí)加入對(duì)決策時(shí)間的考慮,F(xiàn)RTHS能很好的適應(yīng)高度實(shí)時(shí)的不確定環(huán)境。在傳統(tǒng)的格子世界追
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種同調(diào)邊緣學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 一種機(jī)動(dòng)目標(biāo)跟蹤濾波算法及其應(yīng)用研究.pdf
- 實(shí)用POMDP近似求解算法的研究.pdf
- 一種改進(jìn)的求解TSP算法.pdf
- 一種改進(jìn)的遺傳算法及其在TSP求解中的應(yīng)用.pdf
- 一種最優(yōu)化問(wèn)題求解算法的研究.pdf
- 一種求解互補(bǔ)問(wèn)題的光滑算法.pdf
- 一種新的博弈樹(shù)搜索算法及其應(yīng)用研究.pdf
- 一種混合智能算法的應(yīng)用研究.pdf
- 一種多元GARCH模型及其應(yīng)用研究.pdf
- 一種時(shí)序分類(lèi)技術(shù)及其應(yīng)用研究.pdf
- 求解積分方程的一種新方法及其應(yīng)用.pdf
- 一種改進(jìn)的分類(lèi)算法及其應(yīng)用.pdf
- 一種集成學(xué)習(xí)算法及其對(duì)灰霾預(yù)測(cè)的應(yīng)用研究.pdf
- 柔性作業(yè)車(chē)間調(diào)度問(wèn)題的一種求解算法及其實(shí)現(xiàn).pdf
- 一種實(shí)時(shí)AD HOC網(wǎng)絡(luò)體系結(jié)構(gòu)及其仿真和應(yīng)用研究.pdf
- 一種基于改進(jìn)的COID算法的應(yīng)用研究.pdf
- 一種求解Ramsey數(shù)的計(jì)算機(jī)算法.pdf
- 一種改進(jìn)的蟻群算法——RBFACO算法求解TSP問(wèn)題.pdf
- 一種改進(jìn)的遺傳算法求解TSP問(wèn)題.pdf
評(píng)論
0/150
提交評(píng)論