版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、機(jī)器學(xué)習(xí)是近年來興起的一門多領(lǐng)域交叉學(xué)科,其涉及到統(tǒng)計(jì)學(xué)、概率論、凸分析、逼近論和算法復(fù)雜度理論等多個(gè)學(xué)科。在機(jī)器學(xué)習(xí)理論中主要涉及到設(shè)計(jì)并分析一些可以讓計(jì)算機(jī)具有自主學(xué)習(xí)能力的算法。而機(jī)器人足球比賽是目前機(jī)器人研究中的應(yīng)用課題之一,其涉及到了人工智能、智能控制和圖形圖像處理等多個(gè)領(lǐng)域。機(jī)器人足球比賽具有實(shí)時(shí)性、分布性、異步性、動(dòng)態(tài)性等特點(diǎn),它是一個(gè)標(biāo)準(zhǔn)的分布式人工智能研究平臺(tái)。對(duì)機(jī)器人足球比賽進(jìn)行模擬仿真不僅可以節(jié)省資金,而且方便人們
2、研究算法的性能。
增強(qiáng)學(xué)習(xí)不需要先驗(yàn)知識(shí),實(shí)體可直接通過與環(huán)境進(jìn)行交互獲取知識(shí)并修正行為策略,這些特性使增強(qiáng)學(xué)習(xí)在機(jī)器人足球比賽中獲得了廣泛應(yīng)用。本文研究基于增強(qiáng)學(xué)習(xí)的機(jī)器人足球比賽算法和仿真,主要工作如下:
1,分析了增強(qiáng)學(xué)習(xí)的基本原理,著重研究了Q-Learning算法、瞬時(shí)差分算法和SARSA算法。在此基礎(chǔ)上,結(jié)合機(jī)器人足球比賽的特點(diǎn),提出了一種改進(jìn)的SARSA算法。
2,分析和搭建了機(jī)器人足球比賽的
3、仿真軟件平臺(tái)MSRS,對(duì)仿真中的增強(qiáng)學(xué)習(xí)算法進(jìn)行了獎(jiǎng)勵(lì)函數(shù)和行為函數(shù)的設(shè)計(jì),并討論了行為選擇方法和狀態(tài)離散化等問題。
3,對(duì)改進(jìn)的SARSA算法在機(jī)器人足球比賽的單實(shí)體環(huán)境下進(jìn)行了仿真分析,在此基礎(chǔ)上,比較了SARSA和改進(jìn)的SARSA算法在多實(shí)體環(huán)境之中的性能,仿真結(jié)果表明,改進(jìn)的SARSA具有更多的智能體控球時(shí)間。
論文通過機(jī)器人足球比賽仿真平臺(tái),研究了增強(qiáng)學(xué)習(xí)算法,仿真結(jié)果表明,應(yīng)用增強(qiáng)學(xué)習(xí)算法可以更好的制定機(jī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)器學(xué)習(xí)算法及其工程應(yīng)用研究.pdf
- 李群機(jī)器學(xué)習(xí)的覆蓋算法及其應(yīng)用研究.pdf
- 正則化機(jī)器學(xué)習(xí)算法及其財(cái)務(wù)預(yù)警應(yīng)用研究.pdf
- 在線學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 時(shí)空特征學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 流形學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 自學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 基于機(jī)器學(xué)習(xí)算法的Web文本挖掘應(yīng)用研究.pdf
- 幾種典型機(jī)器學(xué)習(xí)方法及其應(yīng)用研究.pdf
- 多連通覆蓋學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 分層強(qiáng)化學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 優(yōu)化迭代學(xué)習(xí)控制算法及其應(yīng)用研究.pdf
- 并行化深度學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 同調(diào)結(jié)構(gòu)學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 結(jié)構(gòu)半監(jiān)督學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 健壯的流形學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 機(jī)器學(xué)習(xí)算法及應(yīng)用
- 模糊認(rèn)知圖智能學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 等譜流形學(xué)習(xí)算法及其應(yīng)用研究.pdf
- 切叢流形學(xué)習(xí)算法及其應(yīng)用研究.pdf
評(píng)論
0/150
提交評(píng)論