基于文本挖掘技術(shù)的金融預測方法研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著世界經(jīng)濟全球化及世界金融業(yè)的不斷發(fā)展,金融活動中的不確定性增加,金融預測日益受到學術(shù)界及金融業(yè)界的高度重視。人們希望通過對金融經(jīng)營管理活動中難以確定的未來發(fā)展趨勢和規(guī)律進行研究,做出預見性的判斷與推測,使金融活動中的不確定性最小化,為制定金融計劃和金融決策提供依據(jù)。近年來由于海量金融信息的出現(xiàn),數(shù)據(jù)挖掘技術(shù)在金融預測領(lǐng)域開始得到廣泛研究與應用,但大多數(shù)的研究只局限于數(shù)值信息。海量金融信息中有大量的數(shù)據(jù)是以文本的形式存在,如何從這些文

2、本信息中挖掘出有價值的信息變得異常重要。為了提高金融預測的準確度,本文主要研究將文本挖掘相關(guān)技術(shù)引入到金融預測領(lǐng)域。在金融文本預處理方面,對金融報告的語義標注進行了研究,在標注的金融文本基礎(chǔ)上,對金融報告的可信度進行了分析。進而基于文本挖掘相關(guān)技術(shù),對金融預測的兩個重要問題:金融時間序列及金融短期波動率進行了預測研究。本研究內(nèi)容主要包括:
  ⑴面向金融預測的年報語義標注方法研究。年度報告已經(jīng)成為投資者進行金融預測時重要的信息來源

3、。為了使投資者更方便和更準確檢索到所需信息進行預測,針對中文與英文年報,本文分別提出了基于領(lǐng)域本體和自然語言處理技術(shù)的語義標注方法與基于正則表達式的半自動語義標注方法。對中文年報的公司基本信息及英文年報的管理層討論與分析部分所進行的語義標注實驗表明,所提出方法是有效的。
 ?、苹谖谋就诰蚣夹g(shù)的年報可信度研究。上市公司的年報是投資者進行金融預測的重要信息來源,當上市公司的報告造假時,所做的預測將無效并將給市場參與者帶來巨大損失。已

4、有的研究表明基于語言特征的識別方法在造假識別方面是一種有效的方式。本文在年報可信度分析領(lǐng)域引入了無監(jiān)督機器學習方法,基于已標注的年報管理層討論與分析部分,提出了一種以文本語言特征為基礎(chǔ)的層次聚類方法。該方法包含三個步驟:將年度報告的文本數(shù)據(jù)以特征向量方式表示;選擇最佳相似度計算函數(shù)和連通方法;執(zhí)行層次聚類,識別造假年度報告。為了驗證所提出方法的有效性,本文應用所提出的算法對十家上市公司的年度報告分別進行實驗,對比實驗結(jié)果表明,所提出的方

5、法具有較好的性能。
  ⑶基于文本挖掘技術(shù)的金融時間序列預測方法研究。金融時間序列預測是金融預測領(lǐng)域的一個重要問題,但因其充滿噪聲、非平穩(wěn)和混沌性,對它的預測成為一個非常具有挑戰(zhàn)性的課題。文本數(shù)據(jù)中包含著有價值的預測信息,但大多數(shù)現(xiàn)有的預測模型并沒有考慮到伴隨著時間序列的文本數(shù)據(jù)。為了克服這一局限性,在保證年報可信度的情況下,本文提出了一種組合采用數(shù)值和文本信息,通過結(jié)合差分自回歸移動平均模型(ARIMA)和支持向量回歸模型(SV

6、R)的方法進行金融時間序列預測。該方法包含三個步驟:將文本數(shù)據(jù)表示為特征向量,使用基于數(shù)值的ARIMA模型分析時間序列的線性部分,基于文本特征向量的支持向量回歸模型處理非線性部分。為了驗證該方法的有效性,本文選擇六家上市公司的季度末凈資產(chǎn)收益率(ROE)時間序列作為預測對象。對比目前現(xiàn)有主流模型,本文模型表現(xiàn)了更為優(yōu)異的性能。這表明本文所提出的使用額外文本數(shù)據(jù)進行預測的模型,是一種有效的金融時間序列預測方法。
 ?、然谥С窒蛄炕?/p>

7、歸的馬爾科夫轉(zhuǎn)換多重分形模型金融短期波動率預測方法研究。金融時間序列波動率因為其長期記憶,厚尾和波動持久等特性,受到研究者的廣泛關(guān)注。多重分形過程最近成為解決金融時間序列波動率預測問題的一個新方法,一種迭代馬爾科夫轉(zhuǎn)換多重分形模型(MSM)被引入這一領(lǐng)域,它能夠捕捉到金融時間序列許多重要的內(nèi)在特征,該模型在長期預測方面表現(xiàn)出良好的性能。為了提高馬爾科夫轉(zhuǎn)換多重分形模型短期預測的準確性,本文將文本挖掘的重要技術(shù):支持向量機技術(shù)引入到波動率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論