基于強化學習的駕駛員車輛路徑選擇過程研究.pdf_第1頁
已閱讀1頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來智能交通被廣泛應用于解決交通擁堵問題,但是發(fā)布的誘導信息是否有效、是否會產生交通震蕩,取決駕駛員對誘導信息的反應。駕駛員在面臨誘導信息進行路徑選擇時,可以選擇接受誘導信息,也可以選擇拒絕接受誘導信息,這是一個博弈的過程,又因對駕駛員路徑選擇影響最大的因素是上一次策略選擇收益,收益較好時,策略被強化,否則被弱化,這符合強化學習理論的思想,且駕駛員會存在預期收益,策略概率選擇大小取決于預期收益與實際收益的差值,另外,現(xiàn)實中駕駛員對其他

2、駕駛員的策略選擇信念無法取得,因此本文在博弈論的基礎上,應用強化學習理論思想,以駕駛員預期收益與實際收益的差值更新策略的概率,研究駕駛員在面臨誘導信息時的路徑選擇過程,旨在為交通管理者發(fā)布誘導信息提供依據(jù)。
  本文首先研究基于強化學習理論的駕駛員路徑策略選擇過程。建立了基于強化學習理論的交通誘導模型,詳細論述了模型的博弈過程,并通過仿真基于無誘導信息條件下、基于強化學習誘導信息條件下、基于信念學習誘導信息條件下駕駛員路徑選擇過程

3、,驗證誘導信息發(fā)布的有效性。
  然后基于建立的強化學習理論交通誘導模型,進一步研究了路網(wǎng)環(huán)境變化時對駕駛員路徑策略選擇過程產生的影響。主要通過改變路網(wǎng)流量、初始接受誘導比例兩個因素,分析其對駕駛員路徑選擇過程產生的影響,當路網(wǎng)流量變化時,管理者應將誘導信息的可信度提高至50%~60%,可以使誘導信息被充分利用,且不會導致?lián)矶缕?,能夠有效緩解交通擁?當改變初始接受誘導比例時,當路網(wǎng)流量占通行能力的85%及以上時發(fā)布誘導信息,即

4、當路網(wǎng)開始擁堵時,誘導信息能快速發(fā)揮作用,緩解道路上交通擁堵,提高道路通行能力。
  最后研究了強化學習理論交通誘導模型自身參數(shù)變化對駕駛員車輛路徑選擇過程產生的影響。主要研究了期望支付調整速度、初始接受概率兩個參數(shù)變化時,對駕駛員路徑選擇過程產生的影響。當期望支付調整速度改變時,期望支付調整速度取值較小時,模型的使用效果更好,誘導效果更加明顯,道路通行能力能夠得到快速提升;當初始接受比例改變時,局中人對各個策略的初始接受概率相等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論