版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、本篇論文主要研究了帶馬爾科夫鏈的隨機最優(yōu)控制問題,及其在金融中的應用。在理論方面,主要研究了與帶馬爾科夫鏈模型相關的最優(yōu)控制理論,如隨機最大值原理,動態(tài)規(guī)劃原理以及它們之間的關系。然后,我們將得到的理論結果應用于金融數(shù)學問題,如股票交易問題,證券投資組合,效用最大化問題,最優(yōu)投資-消費問題等。
在實際中,很多現(xiàn)象或系統(tǒng)都具有狀態(tài)轉移或者趨勢改變的性質。對于這種情形,數(shù)學上,我們一般使用馬爾科夫鏈來刻畫。例如,在股票市場中,市場
2、可以分為牛市和熊市,市場在這兩種趨勢之間轉換。在牛市中,股票的收益率是正的,波動率較小,而在熊市中,股票的收益率是負的,波動率也較大。此時,我們可以使用一個兩狀態(tài)的馬爾科夫鏈來描述,一個狀態(tài)代表牛市,一個狀態(tài)代表熊市,使股票價格方程依賴于這個馬爾科夫鏈。馬爾科夫鏈狀態(tài)的轉移,代表著市場趨勢的改變。從這個例子我們可以看出,馬爾科夫鏈可以較好地模擬現(xiàn)實環(huán)境的隨機變化,研究帶馬爾科夫鏈的隨機最優(yōu)控制問題是有實際意義的。
相比于傳統(tǒng)的
3、擴散模型,帶馬爾科夫鏈模型主要具有以下兩方面的優(yōu)勢。首先,在理論方面,模型所含有的馬爾科夫鏈可以更加直接地描述影響系統(tǒng)的行為中那些不頻繁變化但是對系統(tǒng)長期趨勢有重要影響的因素和事件。例如上面的股票市場的例子,牛市與熊市的市場參數(shù)(收益率和波動率等)明顯不同,傳統(tǒng)的擴散模型就不能方便有效的反映這一現(xiàn)象,當引入馬爾科夫鏈以后,就可以使得股票價格的走勢和波動情況依賴于市場行情的變化。此外,在處理期權定價,證券投資組合等問題中,帶馬爾科夫鏈的模
4、型也有廣泛應用。然后,在數(shù)值計算方面,帶馬爾科夫鏈模型也具有優(yōu)勢。首先,當我們使用動態(tài)規(guī)劃原理時,帶馬爾科夫鏈模型的隨機最優(yōu)控制問題具有簡明的Hamilton-Jacobi-Bellman(HJB)方程,方便我們使用一些有效便捷的科學計算方法來處理。其次,在做計算處理時,帶馬爾科夫鏈模型只要求有限數(shù)據(jù)輸入。仍以股票市場為例,我們只需要輸入在不同狀態(tài)下股票的收益率和波動率,以及馬爾科夫鏈的轉移速率矩陣。由此可見,帶馬爾科夫鏈的隨機最優(yōu)控制
5、問題具有理論和計算兩方面的優(yōu)勢。
下面我們給出本文的主要內(nèi)容和結構框架。
在第一章中,我們研究了帶馬爾科夫鏈模型下的最優(yōu)轉換控制問題,及其在股票交易問題中的應用。我們首先得到了該問題的動態(tài)規(guī)劃原理以及HJB方程,然后證明了問題的值函數(shù)是對應HJB方程的唯一粘性解。同時,最優(yōu)轉換策略也由HJB方程的障礙部分給出,決定了在何時和往何處轉換是最優(yōu)的。當馬爾科夫鏈具有雙時間尺度結構時,我們證明了相應的收斂性結果。最后,我們將
6、在最優(yōu)轉換控制的框架下來研究股票交易問題,并利用數(shù)值計算給出了最優(yōu)交易規(guī)則和最優(yōu)收益。特別地,我們將利用雙時間尺度馬爾科夫鏈來模擬股票市場中的長期趨勢和短期趨勢,收斂性結果也被驗證。
在第二章中,我們研究了隨機離開時間和不完備市場下的連續(xù)時間均值-方差證券投資組合選擇問題。我們首先將均值-方差問題構造成為一個帶終端期望限制的線性二次最優(yōu)控制問題。然后,由隨機線性二次控制理論,我們的均值-方差問題就會歸結為兩個倒向隨機微分方程(
7、BSDEs)的可解性問題。其中一個是隨機Riccati方程,另一個是輔助BSDE。我們將使用BMO-鞅理論來給出一個對于上述兩個BSDEs可解性的簡潔有效的證明。隨后,我們利用這兩個倒向方程的解,給出了最優(yōu)投資組合的線性反饋形式。
在第三章中,我們研究了帶馬爾科夫鏈和泊松跳的正倒向隨機系統(tǒng)的最優(yōu)控制問題。首先利用對偶方法,建立了最優(yōu)控制的充分性隨機最大值原理。接下來,我們研究了它與動態(tài)規(guī)劃原理的關系,建立了伴隨過程、一般哈密頓
8、函數(shù)以及值函數(shù)之間的關系。最后,我們將得到的理論結果應用于一個帶終端財富限制的現(xiàn)金流估值問題,并利用馬爾科夫鏈的性質和一些分析技術得到了顯式的最優(yōu)策略。
在第四章中,我們研究了帶馬爾科夫鏈的超前-延遲正倒向隨機系統(tǒng)的最優(yōu)控制問題的必要性最大值原理。我們先由凸變分方法給出了系統(tǒng)的變分方程,以及一些相關估計,這就使得我們可以推導出變分不等式。然后,我們給出了相應的伴隨方程。根據(jù)變分不等式的形式,以及伴隨方程,我們就得到了必要性最大
9、值原理。同時,我們還證明了,在某些凸性假設下,必要性最大值原理也會變成充分性條件。最后,我們研究了一類遞歸效用投資-消費選擇問題,并給出了顯式的最優(yōu)消費率。
接下來,我們給出本篇論文的主要結論。
1.帶馬爾科夫鏈模型下的最優(yōu)轉換問題及其在股票交易問題中的應用
記(Ω,F(xiàn),P)是一個概率空間,上面定義了一個標準的1-維的布朗運動B(t),t≥0和一個馬爾科夫鏈α(t),t≥0。假設B(·)和α(·)是獨立的。
10、馬爾科夫鏈取值于一個有限的狀態(tài)空間M={1,…,M}。記Q=(λpq)p,q∈M是α(·)的生成元。記{Ft}t≥0是由B(·)和α(·)生成的并完備化的信息族。
考慮一個1-維的混合擴散(αp(·),Xp,x(·)),其初始狀態(tài)是(p,x)∈M×R{ dXp,x(t)=b(αp(t),Xp,x(t))dt+σ(αp(t),Xp,x(t))dB(t), t≥0,Xp,x(0=x),αp(0)=p.
記N={1,…,N
11、}是轉換控制的狀態(tài)集合。一個轉換控制定義為一序列停時-狀態(tài)對(((Τ))n,ξn)n≥1,其中((Τ))n是一列遞增的停時,ξn是F((Τ))n-可測的隨機變量,取值于N,記轉換控制過程為Ii(t)=i1[0,((Τ))1)(t)+∑n≥1ξn1[((Τ))n,((Τ))n+1)(t),t≥0,其中1A是集合A的示性函數(shù)。
總回報函數(shù)定義為J(i,p,x,Ii(·))=E[∫∞0 e-ρtf(Ii(t),αp(t),Xp,x(
12、t))dt-∞∑n=1e-ρ((Τ))ngξn-1,ξn],其中ρ>0是折現(xiàn)因子。我們記Ai是全體初始狀態(tài)為i的容許轉換控制的全體。
我們定義值函數(shù)為v(i,p,x)=sup Ii(·)∈Ai J(i,p,x,Ii(·)),(0.0.1)我們也記v(i,p,x)為vi,p(x)。下面的定理給出了帶馬爾科夫鏈模型下的最優(yōu)轉換問題的動態(tài)規(guī)劃原理。
定理0.1.假設(H1.1)-(H1.3),則對任意的(ip,x)∈N×M
13、×R和停時θ,我們有v(i,p,x)=sup Ii(·)∈Ai E[∫θ0 e-ρtf(Ii(t),αp(t),Xp,x(t))dt+e-ρθv(Ii(θ),αp(θ),Xp.x(θ))-∑((Τ))n≤θ e-p((Τ))ngξn-1,ξn].問題對應的HJB方程(或稱變分不等式系統(tǒng))如下min{ρvi,p(x)-Lpvi,p(x)-f(i,p,x)-∑q≠pλpq(vi,q(x)-vi,p(x)),vi,p(x)-max j≠i{v
14、j,p(x)-gij}}=0,(0.02)其中Lp=b(p,x)(a)/(ax)+1/2σ2(p,x)(a)2/(a)x2。
下面的兩個定理給出了關于方程(0.0.2)的粘性解的存在唯一性結果。
定理0.2.在假設(H1.1)-(H1.3)下,由(0.0.1)定義的值函數(shù)vi,p(x)是HJB方程(0.0.2)的粘性解。
定理0.3.在假設(H1.1)-(H1.3)下,記ui,p(x)(相應地,vi,p(x
15、))是(0.0.2)的一個粘性下解(相應地,上解)且滿足線性增長條件,則我們有ui,p(x)≤vi,p(x)。
然后,我們假設馬爾科夫鏈αε(·)具有雙時間尺度結構,其生成元Qε=(λεpq)結構為Qε=1/ε(Q)+(Q),其中,(Q)=(λpq),(Q)=((λ)pq)。假設αε(·)的狀態(tài)空間是M=M1∪…∪ML,其中Mk={sk1,…,skmk},k=1,…,L,M=m1+…+mL。此外,(Q)結構為{(Q)1…(Q)
16、L}使(Q)k對于Mk也是一個生成元,對任意的k=1,…,L。對應的極限變分不等式系統(tǒng)是min{ρvi,k(x)-(L)kvi,k(x)-(f)(i,k,x)-∑q≠k(λ)kq(vi,q(x)-vi,k(x)),vi,k(x)-max{vj,k(x)-gij}=0,(0.0.3)其中,(L)k=(b)(k,x)(a)/(a)x+1/2(σ)2(k,x)(a)2/(a)x2。
定理0.4.對任意k=1,…,L和l=1,…,mk
17、,我們有vε i,skl(x)→(v)i,k(x)。此外,(v)i,k(x)是極限變分不等式系統(tǒng)(0.0.3)的唯一粘性解。
然后我們將理論結果應用于股票交易問題。股票價格為{dXp,x(t)=b(αp(t))Xp,x(t)dt+σ(αp(t))Xp,x(t)dB(t), t≥0,Xp,x(0)=x,αp(0)=p,(0.0.4)其中,αp(·)是一個馬爾科夫鏈,取值于M={1,2,…,M},x和p是股票價格和馬爾科夫鏈的初始
18、狀態(tài)。在這里,b(p),p∈M,是期望回報率,σ(p),p∈M代表股票的波動率。
記{((Τ))n}n≥1是一列遞增的停時序列,代表轉換控制:在((Τ))n時刻進行買賣股票。我們?nèi)={0,1}。在這里,狀態(tài)0代表不持有股票,狀態(tài)1代表持有1份股票。如果i=0(初始時刻不持有股票),那么交易員在((Τ))1時刻買入股票,然后在((Τ))2時刻賣出,再在((Τ))3時刻買入股票,然后在((Τ))4時刻賣出,依此類推。另一方面,如
19、果i=1(初始時刻有1份股票),那么交易員在((Τ))1時刻先將股票賣出,然后在(Τ)2時刻買入,再在(Τ)3時刻賣出,依此類推。記股票的交易策略(從狀態(tài)i∈N開始)為Ii(t)=i1[0,(Τ)1)(t)+∑n≥1ξn1[(Τ)n,(Τ)n+1)(t),t≥0,并記Ai為交易策略的全體。
目標是選擇一列{(Τ)n}n≥1,最大化收益J(i,p,x,Ii(·))={E[e-ρ(Τ)2(X((Τ)2)-K)-e-ρ(Τ)1(X(
20、(Τ)1)+K)+ e-ρ(Τ)4(X((Τ)4)-K)-e-ρ(Τ)3(X((Τ)3)+K)+…], i=0,E[e-ρ(Τ)1(X((Τ)1)-K)+ e-ρ(Τ)3(X((Τ)3)-K)-e-ρ(Τ)2(X((Τ)2)+K)+…], i=1,(0.0.5)其中K是交易費。此外,定義v(i,p,x)=supIi(·)∈AiJ(i,p,x,Ii(·))。
我們考慮一個新問題,具有與(0.0.4)相同的動態(tài),不過要最大化一個新
21、目標(J)(i,p,x,Ii(·))={Ee-ρ(Τ)2(X((Τ)2)-K)-e-ρ(Τ)1(X((Τ)1)+K)+e-ρ(Τ)4(X((Τ)4)-K)-e-ρ(Τ)3(X((Τ)3)+K)+…], i=0,E[e-ρ(Τ)1(X((Τ)1)-K)-(X(0)+K)+e-ρ(Τ)3(X((Τ)3)-K)-e-ρ(Τ)2(X((Τ)2)+K)+…], i=1,(0.0.6)并定義(v)(i,p,x)=supIi(·)∈Ai(J)(i p
22、,x,Ii(·))。
注意到新問題(0.0.6)與原始問題(0.0.5)具有相同的最優(yōu)交易策略。此外,v(0,p,x)=(v)(0,p,x), v(1,p,x)=(v)(1,p,x)+x+K.經(jīng)過一個變換,我們就會看到目標泛函(0.0.6)可以寫成(J)(i,p,x,Ii(·))=E[∫∞0 e-ρtf(Ii(t),αp(t),Xp,x(t))dt-∞∑n=1 e-ρ(Τ)ngξn-1,ξn].從而,對應于現(xiàn)在的情形,變分不等
23、式(0.0.2)具有下面的形式min{ρ(v)i,p(x)-b(p)x(a)/(a)x(v)i,p(x)-1/2σ2(p)x2(a)2/(a)x2(v)i,p(x)-f(i,p,x)-∑q≠pλpq((v)i,q(x)-(v)i,p(x)),(v)i,p(x)-(v)i,p(x)+gij}=0,基于此,我們就可以計算值函數(shù)和最優(yōu)股票交易規(guī)則。
2.隨機離開時間和不完備市場下的均值-方差證券投資組合問題
假設T>0是一
24、個有限時間區(qū)間的終點。(Ω,A,{Ft}t∈[0,T],P)是一個完備的概率空間。記(B)(t)=(B(t)',W(t)')'=(B1(t),…,Bm(t),W1(t),…,Wd(t))',m≥1,d≥0是一個定義在這個概率空間上的(m+d)-維的標準布朗運動。我們進一步的假設信息族{Ft}t∈[0,T]滿足FT(∈) A,且是由(B)(t)生成的。
考慮一個投資人在時間t投資自己總資產(chǎn)x(t)中的ui(t)于第i種證券,i=
25、0,1,…,m。那么,投資人的資產(chǎn)滿足下面的SDE,其中x0是初始資產(chǎn):{dx(t)={r(t)x(t)+b(t)u(t)}dt+u(t)'σ(t)dB(t), t∈[0,T],x(0)=x0>0,其中b(t)=(μ1(t)-r(t),…,μm(t)-r(t))。我們稱一個投資組合u(t)是容許的,如果u(t)∈U:=L2F(0,T;Rm)。
假設投資人的離開時間(Τ)-是一個關于A可測的正的隨機變量,其中A有可能比F(Τ)大
26、。假設投資期限是T,在此之后投資人就不可以繼續(xù)進行投資。因此,投資人的實際離開時間就是T∧(Τ)。他的目標是,對于一個給定的z∈R,尋找一個終端收益滿足E[x(T∧(Τ))]=z的容許控制u(t),使得終端風險(用終端收益的方差來表示)Var[x(T∧(Τ))]=E[x(T∧(Τ))-E[x(T∧(Τ)-)]]2=E[x(T∧(Τ))-z]2最小化。
利用分離方法和一些隨機分析技術,我們將這個隨機離開時間和不完備市場下的均值-
27、方差問題構造成如下的一個帶限制的隨機線性二次控制問題。
定義0.1.假設(H2.1),(H2.2),和(H2.3)成立,則隨機離開時間和不完備市場下的均值-方差證券投資組合問題被構造成為一個以z∈R為參數(shù)的受約束的隨機線性二次最優(yōu)控制問題:{最小化JMV(u(·))=E[∫T0 a(s)(x(s)-z)2ds+(1-F(T))(x(T)-z)2],對應于{J1(u(·))=E[∫T0 a(s)x(s)ds+(1-F(T))x(
28、T)]=z,(x(·),u(·))是容許的.(0.0.7)
注意到我們的均值-方差問題帶有限制J1(u(·))=z,在解決了可行性問題以后,我們使用拉格朗日乘子法來處理這個限制。對于所有的λ∈R,我們定義J(u(·),λ)=JMV(u(·))+2λ(J1(u(·))-z)=E[∫T0 a(s)(x(s)+(λ-z))2ds+(1-F(T))(x(T)+(λ-z))2]-λ2.第一個目標是處理下面的這個以λ為參數(shù)的不帶限制的問題
29、:{最小化J(u(·),λ),對應于(x(·),u(·))是容許的.(0.0.8)這是一個標準的隨機線性二次最優(yōu)控制問題,
我們引入下面的兩個BSDEs:{dp=[-2a+(-2r+|θ|2)p+2θ'Λ1+Λ'1Λ1/p] dt+Λ'1dB+Λ'2dW,p(T)=2(1-F(T)),p(t)>0, t∈[0,T],(0.0.9)和{dh=[-2a/p+(r+2a/p)h+θ'η1-Λ'2/pη2]dt+η'1dB+η'2dW
30、,h(T)=1,t∈[0,T].(0.0.10)(0.0.9)就是所謂的隨機Riccati方程(SRE),(0.0.10)是輔助BSDE。我們將使用BMO-鞅理論來證明上述兩個方程的可解性,即以下兩個定理。
定理0.5.假設(H2.1)-(H2.3)成立。則SRE(0.0.9)有解(p,Λ)∈L∞F(Ω;C(0,T;R))×L2F(0,T;Rm+d),且滿足k≤p≤K,其中K>k>0。此外,∫t0Λ(s)'d(B)(s)是一個
31、BMO-鞅。
定理0.6.假設(H2.1)-(H2.3)。給定一個SRE(0.0.9)的解(p,Λ)N,則BSDE(0.0.10)存在唯一解(h,η)∈L2F(Ω;C(0,T;R)×L2F(0,T; Rm+d)。而且,對于所有的t∈[0,T],我們有0<h(t)≤1。此外,如果r(t)>0,a.e.t∈[0,T],則對所有的t∈[0,1),有0<h(t)<1。
確定了上述兩個BSDEs的可解性后,就可以解出不受限問題
32、(0.0.8)。最后,根據(jù)不受限問題的解,就能給出原始問題(0.0.7)的解??梢钥闯觯顑?yōu)的投資組合是一個線性狀態(tài)反饋的形式,終端最小風險Va4[x*(T∧(Τ)-)]關于終端財富z是一個二次函數(shù)。
定理0.7.假設(H2.1)-(H2.3)和條件(2.3.2)成立。則我們有1/2p(0)h2(0)+Δ-1<0.此外,對應于z的一個最優(yōu)投資組合(具有反饋控制的形式),由下式給出u*(t)=uλ*(t)=-(σ(t)σ(t)'
33、)-1[(b(t)'+σ(t)Λ1(t)/p(t))(xλ*(t)+(λ*-z)h(t))+(λ*-z)σ(t)η1(t)], t∈(0,T],其中λ*-z=2z-p(0)h(0)x0/p(0)h2(0)+2Δ-2.最優(yōu)的財富過程x*(t)=xλ*(t), t∈[0,T],由方程(2.5.1)的解給出,對應于uλ*(t)。此外,在滿足限制E[x(T∧(Τ))]=z的所有的財富過程x(·)中,終端財富方差Varx(T∧(Τ))]的最優(yōu)值是
34、Var[x*(T∧(Τ))]=p(0)h2(0)+2△/2-2△-p(0)h2(0)(z-p(0)h(0)/p(0)h2(0)+2△x0)2+p(0)△/p(0)h2(0)+2Δx20.
3.帶馬爾科夫鏈和泊松跳的正倒向系統(tǒng)的最大值原理及其在金融中的應用
記(Ω,F(xiàn),{Ft}t∈[0,T],P)是一個完備的概率空間,上面定義了一個標準的1-維的布朗運動,一個連續(xù)時間馬爾科夫鏈,和一個泊松隨機測度。馬爾科夫鏈α(t)的
35、狀態(tài)空間是S={α1,α2,...,αD},其中D∈N,αi∈RD,且第j個分量是δij,對于每一個i,j=1,2,...,D。
對應于控制u(t)∈U∈R的狀態(tài)過程(X(t),Y(t),Z(t),(Z)(t,e),(Z)(t))∈R4×RD由下面的FBSDE給出:{dX(t)=b(t,X(t),u(t),α(t))dt+σ(t,X(t),u(t),α(t))dB(t)+∫ε(σ)(t,X(t),u(t),α(t),e)(N)
36、(dt,de)+<(σ)(t,X(t),u(t),α(t)),d(Φ)(t)>,-dY(t)=f(t,Θ(t),u(t),α(t))dt-Z(t)dB(t)-∫ε(Z)(t,e)(N)(dt,de)-
37、br> 考慮如下的評價指標:J(u(·))=E[∫T0 l(t,Θ(t),u(t),α(t))dt+g(X(T),α(T))+h(Y(0)),(0.0.12)其中l(wèi),g,h是給定的具有合適維數(shù)的函數(shù)。我們的最優(yōu)控制問題是:尋找一個容許控制u*(·)∈(U)使得J(u*(·))=infu(·)∈(U) J(u(·))。
記θ代表(x,y,z),記R代表所有的函數(shù)r:ε(→)R。定義哈密頓函數(shù)H:[0,T]×R3×U×S× R3
38、×R×RD(→)R為H(t,θ,u,αi,φ,ψ,ψ,(ψ),(ψ)=b(t,x,u,αi)ψ+σ(t,x,u,αi)ψ+∫ε(σ)(t,x,u,αi,e)(ψ)v(de)+∑Dj=1(σ)j(t,x,u,αi)(ψ)jλij+f(t,θ,u,αi)φ+l(t,θ,u,αi)。我們假設哈密頓函數(shù)H關于θ是可微的。在引入伴隨方程(3.2.3)后,我們就可以得到下面的充分性隨機最大值原理。
定理0.8.記u*∈(U),對應的方程
39、(0.0.11)的解是(X*,Y*,Z*,(Z)*,(Z)*),假設伴隨方程(3.2.3)的解(φ,ψ*,ψ*,(ψ)*,(ψ)*)使得對所有的u∈(U),有E∫T0(X(t)-X*(t))2[ψ*(t)2+∫ε(ψ)*(t,e)2v(de)+(ψ)*(t)'Diag(λ(t))(ψ)*(t)]dt<∞,E∫T0(Y(t)-Y*(t))2[(a)f/(a)z(t,Θ*,u*,α)2+(a)l/(a)z(t,Θ*,u*,α)2]dt<∞,
40、E∫T0φ*(t)2[Z(t)2+∫ε(Z)(t,e)2v(de)+(Z)(t)'Diag(λ(t))(Z)(t)]dt<∞,E∫T0ψ*(t)2[σ(t,X,u,α)2+∫ε(σ)(t,X,u,α,e)2v(de)+(σ)(t,X, u,α)'Diag(λ(t))(σ)(t,X,u,α)dt<∞.
為了符號方便,我們記H(t,θ,u)=H(t,θ,u,α(t),φ*(t),ψ*(t),ψ*(t),(ψ)*(t,e),(ψ)*
41、(t))。此外,我們假設下面的條件成立
條件1.對于所有的t∈[0,T],H(t,Θ*(t),u*(t))=infu∈UH(t,Θ*(t),u)。
條件2.對于每一個固定的t∈[0,T],H(t,θ)=infu∈UH(t,θ,u)存在并且是一個關于θ的凸函數(shù)。
條件3.函數(shù)g(x,αi)和h(y)是凸的,對于每一個αi,i=1,2,…,D。
則u*是一個最優(yōu)控制,(X*,Y*,Z*,(Z)*,(Z
42、)*)是對應的最優(yōu)狀態(tài)過程。
接下來,我們將建立最大值原理與動態(tài)規(guī)劃原理之間的關系。我們首先將代價泛函(0.0.12)簡化為J(u(·))=Y(0),并記J(t,x,αi;u(·))=Y(t),其中(t,x,αi)代表初始時間和初始狀態(tài),即X(t)=x,α(t)=αi。并且,定義V(t,x,αi)=inf u(·)∈u J(t,x,αi;u(·)).我們得到值函數(shù)V(t,x,αi)滿足下面的HJB方程:{0=-(a)v/(a)
43、t(t,x,αi)+sup u∈U G(t,x,-v(t,x,αi),-(a)v/(a)x(t,x,αi),-(a)2v/(a)x2(t,x,αi),u,αi),μx=V(T,x,αi),其中,對于每一個αi,關于v∈C1,2([0,T]×R)的一般哈密頓函數(shù)G定義為(3.4.2)。則我們有下面的定理。
定理0.9.假設V(t,x,αi)∈C1,2([0,T]×R),對于每一個αi∈S。記u*是最優(yōu)控制,(X*,Y*,Z*,(
44、Z)*,(Z)*)是相應的最優(yōu)狀態(tài)過程。則對于所有的s∈[t,T],我們有(a)V/(a)s(s,X*,α)=G(s,X*,-V(s,X*,α),-(a)V/(a)x(s,X*,α),-(a)2V/(a)x2(s,X*,α),u*,α).此外,如果V(t,x,αi)∈C1,3([0,T]×R),我們定義下列過程:φ*(s)=exp{∫s t[(a)f/(a)y(r,Θ*,u*,α)-1/2(a)f/(a)z(r,Θ*,u*,α)2]dr
45、+∫s t(a)f/(a)z(r,Θ*,u*,α)dB},ψ*(s)=(aV)/(a)x(s,X*,α)φ*(s),Ψ*(s)=[(a)2V/(a)x2(s,X*,α)σ(s,X*,u*,α)+(a)V/(a)x(s,X*,α)(a)f/(a)z(s,Θ*,u*,α)]φ*(s),(Ψ)*(s,e)=[(a)V/(a)x(s,X*+(σ)(s,u*,α,e),α)-(a)V/(a)x(s,X*,α)]φ*(s),(ψ)*j(s)=[(a
46、)V/(a)x(s,X*+(σ)j(s,u*,α),αj)-(a)V/(a)x(s,X*,α)]φ*(s),j=1,2,...,D.則(φ*(s),ψ*(s),ψ*(s),(ψ)*(s,e),(ψ)*(s))就是伴隨過程且滿足FBSDE(3.2.3)。
最后,我們應用最大值原理解決一個帶馬爾科夫鏈和泊松跳的金融市場中的帶終端財富限制的現(xiàn)金流估值問題。由拉格朗日乘子法,我們將問題構造如下。最小化:J(c(·),u(·))=E[-
47、∫T0 e-∫t0β(s,α(s))dsU(c(t)X(t))dt+δ/2(X(T)-d)2+θ(Y(0)-x0)],其中,c(t)是委托人的提取回報率,作為控制的一部分。代理人的財富過程X(t)由下面的SDE給出{dX(t)=[r(t,α(t))X(t)+Π(t,α(t))u(t)]dt+σ(t,α(t))u(t)dB(t)+∫ε(σ)(t,α(t),e)u(t)(N)(dt,de),X(0)=x0,其中,u(t)是代理人的投資策略,
48、作為控制的另一部分。委托人的效用Y(t)由下面的倒向隨機微分方程給出{-dY(t)=[k(t,α(t))Y(t)-c(t)X(t)]dt-Z(t)dB(t)-∫ε(Z)(t,e)(N)(dt,de)-<(Z)(t),d(φ)(t)>,Y(T)=0.利用馬爾科夫鏈的性質和鞅表示定理,我們可以顯式地解出上述問題的最優(yōu)策略,即下面的定理。
定理0.10.帶終端財富限制的現(xiàn)金流估值問題(3.5.3)的最優(yōu)控制策略由下面給出:c*(t)
49、=θ*1/γ-1e1/1-γ∫t0[k(s,α(s))-β(s,α(s))]dsX*(t)-1,u*(t)=-Λ(t,α(t))-1Π(t,α(t))[X*(t)+q(t,α(t))/p(t,α(t))],其中θ*由(3.5.23)給出,p(t,α(t))和q(t,α(t))分別由(3.5.17)和(3.5.18)給出。
4.帶馬爾科夫鏈的正倒向超前-延遲系統(tǒng)的隨機最大值原理
記(Ω,F(xiàn),P)是一個概率空間。T>0是
50、一個有限時間區(qū)間的終點。{Bt}0≤t≤T是一個1-維布朗運動,{αt}0≤t≤T是一個有限狀態(tài)馬爾科夫鏈,狀態(tài)空間記為I={1,2,…,k}。假設B和α是相互獨立的。馬爾科夫鏈的轉移速率記為λ(i,j)。假設λ(i,j)是非負的和一致有界的,并且λ(i,i)=-∑j≠iλ(i,j)。記{Ft}0≤t≤T是由{Bt,αt}0≤t≤T生成的自然信息族,并包含F(xiàn)中所有的P-零測集。
我們首先建立下面的帶馬爾科夫鏈的超前的BSDE的
51、解的存在唯一性:{-dYt=g(t,Yt,Yt+δ,Zt,Zt+δ,Vt)dt-ZtdBt-∑j∈IVt(j)d(V)t(j), t∈[0,T),(0.0.13)Yt=at, Zt=bt, t∈[T,T+δ],其中,終端條件at∈L2F(T,T+δ;R),bt∈L2F(T,T+δ;R)。
定理0.11.在假設(H4.1)和(H4.2)下,BSDE(0.0.13)存在唯一解(Yt,Zt,Vt)∈L2F(0,T+δ;R)×L2F(
52、0,T+δ;R)×L2(P; R)。
我們考慮下面的最優(yōu)控制問題,控制系統(tǒng)由一個正倒向方程給出。{dXt=b(t,αt,Xt,Xt-δ,vt,vt-δ)dt+σ(t,αt,Xt,Xt-δ,vt,vt-δ)dBt,-dYt=g(t,αt,Xt,Xt-δ,Yt,EFt[Yt+δ],Zt,EFt[Zt+δ],Wtnt,vt,vt-δ)dt-ZtdBt-∑j∈I Wt(j)d(V)t(j), t∈[0,T],X t=x0(t), vt
53、=v0(t), t∈[-δ,0],YT=ψ(XT),ZT=bT, Yt=at, Zt=bt, t∈(T,T+δ],其中Wtnt=(Wt(1)nt(1),...,Wt(k)nt(k)),x0(t),v0(t)是確定性的函數(shù)。
在上面,vt是一個Ft-適應的控制過程,取值于U,且U(C)R是一個非空的凸集。記U為容許控制的集合,其中容許控制是指取值于凸集U并且滿足E[∫T0|vt|2dt|<∞。定義代價泛函如下:J(vt)=E[∫
54、T0 l(t,αt,Xt,Xt-δ,Yt,Zt,Wtnt,vt,vt-δ)dt+h(XT)+r(Y0)],(0.0.14)其中l(wèi),h,r是可測函數(shù)。
我們的最優(yōu)控制問題的目標是,在容許控制集U中,最大化泛函指標(0.0.14)。能夠最大化(0.0.14)的控制ut被稱為是最優(yōu)控制。
由變分方程(4.3.1),以及定理4.2中的估計,我們可以建立下面的變分不等式。
定理0.12.假設(H4.3)-(H4.5)
55、成立,則我們有:E[∫T0(lxξt+ lxδξt-δ+lyηt+lzγt+∑j∈Ilw(j)Γt(j)nt(j)+lvv't+lvδv't-δ)dt+hx(X T)ξT+ry(y0)η0]≤0.
引入伴隨方程(4.3.5)后,定義哈密頓函數(shù)H:[0,T]×I×R×R×R×L2(Fr;R)×R×L2(F(r); R)×L2((P); R)×U×U×R×R×R(→)R如下H(t,j,x,xδ,y,Yδ,z,zδ,w,v,vδ,p
56、,k,q)=pb(t,j,x,xδ,v,vδ)+kσ(t,j,x,xδ,v,vδ)-qg(t,j,x,xδ,y,yδ,z,zδ,wnt,v,vδ)+l(t,j,x,xδ,y,z,wnt,v,vδ),其中r,(r)∈[t,T]。我們可以得到下面的隨機最大值原理。
定理0.13.假設(H4.3)-(H4.5),記ut是一個最優(yōu)控制,(Xt,Yt,Zt,Wt)是對應的狀態(tài)過程。(qt,pt,kt,Λt)是伴隨方程(4.3.5)的唯一
57、解。則對任意的v∈U,我們有(Hv+EFt[(Hvδ|t+δ)])(v-ut)≤0, a.e.,a.s.(0.0.15)
然后,我們假設一個額外的凸性條件,來獲得一個關于最優(yōu)控制的充分性條件。
定理0.14.假設ut∈U。記(Xt,Yt,Zt,Wt)是對應的狀態(tài)過程,(qt, pt,kt,Λt)是伴隨方程(4.3.5)的解。如果假設(H4.3)-(H4.6)和方程(0.0.15)對于ut成立,則ut是一個最優(yōu)控制。<
58、br> 最后,我們研究一個遞歸效用下的投資-消費問題。應用隨機最大值原理,我們得到了顯式的最優(yōu)消費率??紤]一個帶馬爾科夫鏈和延遲的隨機動態(tài):{ dXt=(b(αt)Xt-δ-ct)dt+σ(αt)Xt-δdBt, t∈[0,T],X0=x0(t), ct=c0(t), t∈[-δ,0],α0=i.其中,消費過程ct是一個Ft-適應的非負的過程,滿足E[∫T0|ct|2dt]<∞。記(U)代表所有消費過程的集合。在我們的投資-消費問題中
59、,假設投資人將會選取U中的一個消費過程去最大化他的效用??紤]下面的遞歸效用,由一個帶馬爾科夫鏈的BSDE來描述:{-dYt=(U(t,ct,ω)+β(αt)Xt+γ(αt)Xt-δ+m(αt)Yt+n(αt)Zt)dt-ZtdBt-∑j∈IWt(j)dVt(j),t∈[0,T],Y(Τ)=ψ(αt)X(Τ),其中U(t,c,w):[0,T]×R+×Ω(→)R是一個給定的滿足一定條件的效用函數(shù)。
我們想要找到一個消費率(c)t,
60、使得Y0((c)t)=sup ct∈(U) Y0(ct).利用隨機最大值原理,通過最大化哈密頓函數(shù),再結合一些BSDE的性質,我們可以得到候選的最優(yōu)消費率(c)t可以由下式給出:(c)t=I(t,-pt/qt,ω), t∈[0,T].(0.0.16)容易驗證假設(H4.3)-(H4.6)被滿足,所以我們得到下面的結果。
定理0.15.記(qt,pt,kt,Λt)是伴隨方程(4.4.3)的解,假設(4.4.4)成立,則由定理0.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 復合馬爾科夫二項風險模型的最優(yōu)控制問題.pdf
- 馬爾科夫鏈問題算法研究.pdf
- 馬爾科夫鏈在橋梁狀態(tài)預測中的研究與應用.pdf
- 馬爾科夫隨機場理論在圖像分割領域的應用.pdf
- 馬爾科夫隨機場在圖像分割方法中的應用研究.pdf
- 馬爾科夫鏈應用的一些探討.pdf
- 馬爾科夫鏈在中長期負荷組合預測中的應用.pdf
- 最優(yōu)控制的若干問題及其在金融數(shù)學中的應用.pdf
- 馬爾科夫鏈在江西省區(qū)域經(jīng)濟趨同中的應用.pdf
- 馬爾科夫鏈在江西省區(qū)域經(jīng)濟趨同中的應用
- 道路場景中的馬爾科夫隨機場方法研究.pdf
- 帶半馬爾科夫切換的隨機系統(tǒng)的指數(shù)穩(wěn)定性.pdf
- 馬爾科夫模型在醫(yī)療保險精算中的應用.pdf
- 鞍點問題和馬爾科夫鏈問題的高性能算法研究
- 基于馬爾科夫隨機場的圖像分割算法及其在變化檢測中的應用研究.pdf
- 方差約束下基于馬爾科夫模型帶負債的最優(yōu)資產(chǎn)選擇.pdf
- 鞍點問題和馬爾科夫鏈問題的高性能算法研究.pdf
- 23234.基于可控馬爾科夫鏈的跳躍系統(tǒng)控制問題研究
- 馬爾科夫模型預測方法的研究及其應用.pdf
- 基于馬爾科夫隨機場的SAR圖像處理.pdf
評論
0/150
提交評論