2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  中文4500字</b></p><p>  出處:Ghosh J, Paden B. A pseudoinverse-based iterative learning control[J]. Automatic Control, IEEE Transactions on, 2002, 47(5): 831-837.</p><p>  基

2、于偽逆的反復(fù)學(xué)習(xí)控制</p><p>  Jayati Ghosh and Brad Paden</p><p>  摘要——學(xué)習(xí)控制是用于一固定時(shí)間間隔內(nèi)重復(fù)作用的跟蹤控制的有效方法。本文給出一種反復(fù)學(xué)習(xí)控制算法,適用于一些具有擾動(dòng)和初始誤差的非線性非最小相位對(duì)象。該算法要求對(duì)一線性對(duì)象的近似轉(zhuǎn)換而非精確轉(zhuǎn)換。這種方法的一個(gè)優(yōu)點(diǎn)是不需區(qū)分對(duì)象的輸出。漸進(jìn)軌跡誤差的范圍通過一精確的試驗(yàn)列出

3、,并且可以看到其隨著擾動(dòng)范圍持續(xù)的增大。該控制器的結(jié)構(gòu)是這樣的,其低頻部分的軌跡匯合要比高頻部分快。</p><p>  索引術(shù)語(yǔ)——反復(fù)學(xué)習(xí)控制,非線性跟蹤,偽逆。</p><p><b>  I.緒論</b></p><p>  反復(fù)學(xué)習(xí)控制用到了一類自調(diào)整控制器,其某一特定任務(wù)的系統(tǒng)性能在同一任務(wù)先前性能的基礎(chǔ)上逐漸改善和完美。學(xué)習(xí)控制

4、的最常見應(yīng)用是在工業(yè)生產(chǎn)的機(jī)器人控制領(lǐng)域,這里要求機(jī)器人執(zhí)行一個(gè)單一的任務(wù),比方說(shuō)反復(fù)在一給定軌跡下取放物體。單獨(dú)一個(gè)反饋控制器時(shí),相同的軌跡誤差會(huì)一直在反復(fù)的試驗(yàn)中存在。相反,學(xué)習(xí)控制器可以利用前一次執(zhí)行信息來(lái)改進(jìn)下一次軌跡執(zhí)行的性能。而在一些應(yīng)用中,多次重復(fù)一個(gè)軌跡的要求不利于學(xué)習(xí),所以我們將注意力集中在別的一些場(chǎng)合,那里來(lái)說(shuō)學(xué)習(xí)控制是自然的解決方案。</p><p>  本文中我們?cè)赱1]提出一種反復(fù)學(xué)習(xí)控

5、制算法的修正以使其適用于帶有輸入擾動(dòng)和輸出傳感噪聲的非線性非最小相位對(duì)象。在章節(jié)II,提出一個(gè)在起始位置描述一偽逆線性裝置的學(xué)習(xí)控制器。在章節(jié)III,舉出仿真例子以展示所提學(xué)習(xí)控制器的性能。最后,章節(jié)IV是全文總結(jié)。</p><p>  II.具有擾動(dòng)的非線性非最小相位對(duì)象</p><p>  本節(jié)中,我們?yōu)榉蔷€性系統(tǒng)提出一個(gè)魯棒迭代學(xué)習(xí)算法。我們僅考慮方(相同的輸入和輸出)時(shí)不變非線性系

6、統(tǒng)。</p><p><b>  A.系統(tǒng)描述</b></p><p>  來(lái)考察一個(gè)在x = 0時(shí)起始近似穩(wěn)定(也就是說(shuō)線性對(duì)象的所有特征根都在復(fù)平面的左半部分)而且輸入穩(wěn)定的非線性系統(tǒng)</p><p>  這里i為ILC的迭代系數(shù),是輸入順序集合,及,。方程表示系統(tǒng)反復(fù)隨機(jī)的有界擾動(dòng);它可以是持續(xù)的,非可再生摩擦力,和狀態(tài)獨(dú)立的模型誤差等

7、等。代表傳感器噪聲。所期待的軌跡維持在有限的時(shí)間域。學(xué)習(xí)的目的是構(gòu)建一個(gè)輸入軌跡的順序如,這樣使系統(tǒng)在[0,T]間“盡可能近的”跟蹤軌跡。我們做以下假設(shè):</p><p>  (A1)方程是連續(xù)可微的,而是連續(xù)的。</p><p>  (A2),這里的是Banach空間的封閉子集。</p><p>  (A3)系統(tǒng)是第一漸進(jìn)穩(wěn)定和輸入狀態(tài)穩(wěn)定。</p>

8、<p>  (備注:如果系統(tǒng)不穩(wěn)定,可以運(yùn)用我們的方法使其穩(wěn)定)。</p><p>  (A4)擾動(dòng)和分別由bw和bv限制(也就是說(shuō),且)。</p><p>  (A5)所期待的軌跡非常接近于軌跡,其滿足以下方程:</p><p>  針對(duì)該系統(tǒng),在圖1.B中給出一個(gè)反復(fù)學(xué)習(xí)控制。</p><p>  B.學(xué)習(xí)控制器的描述<

9、/p><p>  本節(jié)中,圖1所示的學(xué)習(xí)控制器的一個(gè)好的候選者可以這樣獲得,首先對(duì)對(duì)象進(jìn)行線性化,然后用一個(gè)偽逆的線性裝置作為學(xué)習(xí)控制器。</p><p>  現(xiàn)代的反復(fù)學(xué)習(xí)控制法則由因式P,線性對(duì)象,其伴隨矩陣和時(shí)域t∈[0,T]組成,也就是:</p><p>  注意到對(duì)所有的i如果(注意在圖1中,減因子放置在匯合點(diǎn)之前)。</p><p>

10、  定義:由于非線性系統(tǒng)(1)是輸入狀態(tài)穩(wěn)定(A5)且是連續(xù)的(A1),因此這樣定義一個(gè)因果關(guān)系的非線性輸入到輸出的映射P:。因?yàn)镻是第一狀態(tài)漸近穩(wěn)定的(A5),我們定義一穩(wěn)定時(shí)不變的輸入到輸出線性因式,需要對(duì)系統(tǒng)(1)在內(nèi)線性化:</p><p>  圖1,非線性學(xué)習(xí)控制系統(tǒng) P:非線性對(duì)象,LC:學(xué)習(xí)控制器,:負(fù)因子</p><p>  這里,因此,。由于且A為赫茲【在(4)中】,我們

11、可以用代替 而不必改變(4)中定義的輸入輸出(I_O)映射,因此得到的唯一映射是1—1。</p><p>  定義:考察伴隨系統(tǒng)的I—O映射</p><p>  由于A是赫茲,-AT 為雙曲線的(也就是,所有的特征值都沒有零實(shí)部),從而(5)式定義了唯一的無(wú)關(guān)聯(lián)映射,如Devasia等給出的(參見附錄)。。伴隨系統(tǒng)滿足.</p><p>  定義:忽略較高階限制,我

12、們可以在方程(1)的解附近獲得一個(gè)線性對(duì)象:</p><p>  這里。因?yàn)椋?)是穩(wěn)定的,可以根據(jù)李亞普諾夫方法證明,如果有界那么(6)也是有界輸入輸出穩(wěn)定的。注意,這里我們也可以用代替(如(4)中)而且沒有改變輸入輸出映射。定義。線性穩(wěn)定系統(tǒng)(6)有解并且定義了一個(gè)線性輸入輸出映射:。</p><p>  定義:由偽逆【4】的觀念啟發(fā),我們通過下面的線性因子來(lái)定義學(xué)習(xí)控制器:</

13、p><p>  因?yàn)椋覀儼选敖品崔D(zhuǎn)”稱為的α-偽逆。為簡(jiǎn)單起見,下文把α-偽逆稱為簡(jiǎn)單偽逆。在時(shí)域下用(4)和(5):</p><p>  因?yàn)槭欠€(wěn)定的,(8)是具有特征根的雙曲線,因此,【2】中且是無(wú)關(guān)聯(lián)的。在(8)中解,我們可以看到反向算子為:</p><p>  上面系統(tǒng)的特征根α的連續(xù)函數(shù)。在極限為雙曲線的(因?yàn)锳為赫茲)。從而我們通常對(duì)雙曲線選擇一個(gè)α。系

14、統(tǒng)(9)可以根據(jù)Devasia 等人的穩(wěn)定無(wú)關(guān)解方法解決。因此,</p><p>  學(xué)習(xí)控制器是偽逆且在時(shí)域中給出:</p><p>  Ac是對(duì)角塊,因此Ac的特征根是(9)和的特征根。由于是α雙曲線的,因此Ac為雙曲線。從而,及(10)所描述的線性控制器的解可以利用穩(wěn)定無(wú)關(guān)解[2]求得。(使用時(shí)而不是時(shí)的初始條件可以通過控制)。因此跟蹤性能可以根據(jù)假設(shè)和得到改善。</p>

15、;<p><b>  C.集中分析</b></p><p>  定義1:我們?yōu)榉匠潭xλ標(biāo)準(zhǔn):</p><p>  注意意味著和是等價(jià)的標(biāo)準(zhǔn)。集中結(jié)果可以用任一標(biāo)準(zhǔn)證實(shí)。</p><p><b>  導(dǎo)致的λ標(biāo)準(zhǔn):</b></p><p><b>  定義的傅立葉變換。<

16、;/b></p><p>  條件1:(也就是說(shuō),軸上沒有確定或者非確定的零點(diǎn)),遵循。</p><p>  法則1:如果假設(shè)(A1-A5)和條件1滿足,沒有擾動(dòng)(即且)和初始誤差(),那么算則(3)導(dǎo)出了一個(gè)輸入順序,輸入?yún)R合于。如果,及初始狀態(tài)誤差是有界的(),隨著,匯合于。球的半徑r連續(xù)的取決于擾動(dòng),和初始誤差界限。如果存在一個(gè)具有的,那么將匯合于期望的輸入解。</p&g

17、t;<p>  驗(yàn)證:驗(yàn)證依賴于對(duì)輸入順序應(yīng)用不同的收縮映射定理[5]。驗(yàn)證的主要想法是在時(shí)展現(xiàn)出。這表明了極限,,這兒為擾動(dòng)和初始誤差界限的連續(xù)因子。通過以下定義構(gòu)造序列: </p><p>  為簡(jiǎn)單起見下文用表示?,F(xiàn)在,維持頁(yè)尾所示的從(3)到關(guān)斷器(12)的線性。在[6]后,我們用表示P的分叉,也即滿足</p><p>  在式(13)中,這樣定義:。從(13)

18、式,我們可以發(fā)現(xiàn)s就是,為表示,我們重寫(12)如下:</p><p><b>  因?yàn)槭牵?lt;/b></p><p><b>  這表明,</b></p><p><b>  如</b></p><p><b>  限制和:由假設(shè):</b></p&g

19、t;<p>  ,從而。由(6),我們列寫:</p><p>  因此,利用三角不等式,及的限制,我們得到</p><p><b>  。利用</b></p><p>  Gronwall–Bellman不等式(見)</p><p>  。用乘式(15),定義且假設(shè),我們得到:</p><

20、;p>  注意到對(duì)一常數(shù),在上較大值,我們有:</p><p>  和(4)相似,可以證明:</p><p>  這里為式(4)的輸入。</p><p>  定義:定義一線性因子,所以:</p><p>  根據(jù)式(6),因子的輸出為:,且由式(4)因子的輸出為。這表明</p><p>  因此,利用式(16),

21、(17),及的范圍,我們可以得到:</p><p>  列出壓縮映射:由式(12),我們可以得到下文頁(yè)底所示的方程。定義。從以下可看到,如果滿足條件1,當(dāng),那么。當(dāng)選擇足夠小,可以使得任意小。令且,</p><p><b> ?。ǜ盗⑷~變換)</b></p><p>  如果條件1滿足,那么,這里0。重新考慮式(19),令,因此。注意到:<

22、;/p><p>  因此,我們可以寫為,(利用式(19)),當(dāng)。隨著的選擇,可以使得任意小。</p><p>  如果相應(yīng)于的傳遞函數(shù)確實(shí)恰當(dāng),那么在時(shí),條件1無(wú)法滿足。那么隨著1,而且,直觀地,輸入序列的高頻部分會(huì)緩慢的匯合。在那種情況下,學(xué)習(xí)控制器得以以下方式加以修正:</p><p>  不是把當(dāng)作學(xué)習(xí)因子,而是把當(dāng)作修正后的學(xué)習(xí)控制器,這里可以通過對(duì)加入一個(gè)前饋

23、期獲得。因此,可以根據(jù)修正式(4)給出如下:</p><p>  這里。修正后的因子滿足條件1并且集總分析可以在足夠小時(shí)以相同的方式進(jìn)行。從式(19)代人限制條件,且將式(19)乘以我們可以在上取大列寫式(19)的型如下:</p><p>  這里為初始狀態(tài)誤差的標(biāo)準(zhǔn)范圍。和分別為輸入及輸出擾動(dòng)的標(biāo)準(zhǔn)范圍。由于,當(dāng)足夠小,我們可以發(fā)現(xiàn),這使得。因此,得到:。這里包括了控制器的初始狀態(tài)誤差和

24、擾動(dòng)的標(biāo)準(zhǔn)范圍。因此,極限,即,如,這里為收縮映射的固定點(diǎn),且為半徑,球心為的開球體。如果沒有擾動(dòng)和初始誤差,,從而匯合于。如果如,收縮映射的固定點(diǎn)表示為沒有和初始誤差的。如果且。這表明學(xué)習(xí)控制器的輸出為0。因此,</p><p>  收縮一旦得以證實(shí),可以看出(如前定義)也是從空間()的封閉子空間到其自身的映射。因此,為收縮映射。為說(shuō)明這個(gè),來(lái)考察一期望軌跡。從式(2),因,。在式(12)中,如果考慮那么,由于

25、(這里),是從附近一封閉球到其自身的收縮映射。注意,附近球的尺寸必須足夠小這樣式(14)也得到滿足。因此,如果初始軌跡位于附近,對(duì)所有的從其附近到其本身構(gòu)成映射。不失一般性,我們考慮另一對(duì)及(如(2)所給)。從連續(xù)性來(lái)說(shuō),盡管充分接近,也從其附近到其本身構(gòu)成映射。這便是的動(dòng)機(jī)。</p><p><b>  仿真結(jié)果</b></p><p>  具有輸入擾動(dòng)的仿真結(jié)果&

26、lt;/p><p>  本節(jié)中,我們展示一個(gè)單輸入單輸出非線性非最小相位對(duì)象P的仿真研究,其起始漸進(jìn)穩(wěn)定,輸入狀態(tài)穩(wěn)定,具有以下描述的輸入擾動(dòng):</p><p>  首先,我們考慮沒有輸出擾動(dòng)。這樣給出參考輸出軌跡:</p><p><b>  其他。</b></p><p>  通過線性化系統(tǒng)(21)這樣定義:</p

27、><p>  由于線性控制器是非穩(wěn)定的,我們應(yīng)用穩(wěn)定無(wú)關(guān)解方式[2]。我們引入作為有界的輸入擾動(dòng)。通常為限制于間的隨機(jī)數(shù)。仿真[圖2(a)和(b)]展示了兩個(gè)反復(fù)后期望輸出的近似完美的跟蹤。注意高頻部分緩慢匯合所引起的余差。</p><p>  具有輸入輸出擾動(dòng)的仿真結(jié)果</p><p>  現(xiàn)在,我們引入作為(21)所給的相同非線性系統(tǒng)的隨機(jī)有界輸出擾動(dòng)。同時(shí)存在先前

28、引入的輸入擾動(dòng)。仿真圖[圖3]展示了三次反復(fù)后期望輸出軌跡的良好跟蹤。</p><p><b>  討論</b></p><p>  這里的ILC方案比[1]中給出的多了一些優(yōu)點(diǎn)。在[1]中,線性對(duì)象的逆被當(dāng)做學(xué)習(xí)因子。這使得用輸出的分叉顛倒系統(tǒng)成為必要。實(shí)際上,在具有輸出傳感噪聲時(shí)分叉無(wú)法可靠的計(jì)算。進(jìn)一步說(shuō),對(duì)象本身會(huì)產(chǎn)生一個(gè)不可區(qū)分的輸出信號(hào)。然而,這種新的學(xué)習(xí)

29、算法中,不需要在每一反復(fù)用輸出分叉計(jì)算系統(tǒng)輸入的更新條件。(注意必須非零)。</p><p>  圖4(a)和(b)給出了線性對(duì)象的頻率響應(yīng),它的精確逆和偽逆(具備)。在我們先前的方案[1]中,學(xué)習(xí)因子具有如圖4(b)所示的高頻下的高增益。因此,高頻噪聲被學(xué)習(xí)因子放大。從圖4(b)中我們可以看到的頻率響應(yīng)在低頻時(shí)具有和相似的表現(xiàn),但在高頻時(shí)偏離,證明了其低通本性。從而高頻傳感噪聲被濾除掉了。精確逆和偽逆的相位響應(yīng)

30、是相同的(看圖4(b))。注意是一個(gè)零相位濾波器。幾個(gè)反復(fù)后,可以達(dá)到低頻部分的良好跟蹤,同時(shí)輸出誤差信號(hào)的高頻部分更緩慢地匯合。這種行為可以由圖2(a)和(b)得到證實(shí),圖中我們可以看到低頻誤差在起初幾個(gè)反復(fù)內(nèi)匯合于零,而高頻誤差使大量的反復(fù)衰減。</p><p>  在[7]中,比例因子為數(shù)量級(jí)微克,而且本文中質(zhì)量為一算子(不必因果關(guān)系的),通過偽逆的調(diào)整給出。有趣的是,兩個(gè)方案中學(xué)習(xí)控制器的相位等于對(duì)象相位

31、的相反數(shù)。我們的論文建立于早期的工作,因?yàn)樗阕臃萘吭谝粠拑?nèi)導(dǎo)致了對(duì)象的逆,而且你可以期待在那頻帶內(nèi)快速匯合。更甚者,如果多變量對(duì)象在其最小和最大奇異值間具有明顯的散布,偽逆自動(dòng)地在對(duì)象不同的空間方向測(cè)量學(xué)習(xí)控制器的增益。Furuta和Yamakita的三角修正急速升降方法[7]具有和偽逆學(xué)習(xí)控制器相同的高頻復(fù)制特性。并且,我們發(fā)現(xiàn)在機(jī)器人反饋控制系統(tǒng)中應(yīng)用傳遞函數(shù)的倒像去設(shè)計(jì)控制器,而在需要時(shí)切斷學(xué)習(xí)。</p><

32、p>  圖2。具有輸入擾動(dòng)的非線性非最小相位系統(tǒng)的跟蹤(a)三次反復(fù)后(b)10次反復(fù)后</p><p><b>  總結(jié)</b></p><p>  圖3。具有輸入輸出擾動(dòng)非線性非最小相位系統(tǒng)三次反復(fù)后的跟蹤,為實(shí)際(非測(cè)量)輸出。</p><p>  本文提出的學(xué)習(xí)算法在一些相當(dāng)一般的假設(shè)前提下確保了學(xué)習(xí)。理論的判斷偽仿真結(jié)果所證實(shí),

33、證明了在隨機(jī)有界的擾動(dòng)情況下跟蹤誤差一律是有界的。這種方案的主要優(yōu)點(diǎn)是我們可以從學(xué)習(xí)更新法則中消除差分因子,這使我們可以研究一些更一般化的非線性對(duì)象。該學(xué)習(xí)算法可以通過應(yīng)用Coppel[10]方法輕易的加到緩慢時(shí)變對(duì)象中。學(xué)習(xí)算法應(yīng)用于帶非模型動(dòng)力學(xué)的線性對(duì)象中[11],在將來(lái)擴(kuò)展到時(shí)變對(duì)象中。</p><p><b>  附錄</b></p><p>  A.非最小

34、相位系統(tǒng)的邊緣價(jià)值問題</p><p>  一個(gè)非線性非最小相位系統(tǒng)可以看作是到或者是從到的映射。在第一種情形中逆映射是沒有限制的,而第二種情形是有限制但非關(guān)聯(lián)的。正是第二種觀點(diǎn)給予了跟蹤控制問題的恰當(dāng)看法,因?yàn)榍梆伈恍枰性虻挠?jì)算傳感輸出。</p><p>  如果一個(gè)具有拋物線零點(diǎn)動(dòng)力學(xué)的非線性系統(tǒng)是非最小相位系統(tǒng),線性化對(duì)象的逆是不穩(wěn)定的。因此我們用線性化對(duì)象的穩(wěn)定無(wú)關(guān)逆去獲得針對(duì)

35、章節(jié)中描述的ILC方案的學(xué)習(xí)控制器。解決這個(gè)問題的關(guān)鍵部分是尋找一個(gè)在滿足邊界條件的解。從而,對(duì)線性學(xué)習(xí)控制器來(lái)說(shuō),問題歸結(jié)為解:</p><p>  這里我們假設(shè)A沒有軸上的特征根并且,不失一般性,假設(shè)A是對(duì)角矩陣:</p><p>  ,這里和均為赫茲。這可以通過代人(22)易證(用1(t)代表單位階躍函數(shù)),有界狀態(tài)過渡矩陣定義為,且(22)的解滿足邊界條件,具有形式。定義映射,就如

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論