版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、風險決策中廣泛存在著具有如下特征的一類問題,即風險決策者首先需要建立歷史數據樣本與自然狀態(tài)之間的依賴關系,然后根據該依賴關系估計一個新的數據樣本所對應自然狀態(tài)的出現(xiàn)概率,最后建立風險決策模型,以最大化收益函數(或最小化風險損失函數)為目標選擇最優(yōu)行動方案。從建立歷史數據樣本與自然狀態(tài)的依賴關系這一意義上,可以將這類風險決策問題歸納為數據挖掘中的分類問題,因而數據挖掘中的各種分類方法可以應用于該類風險決策問題。由于分類的高效性和準確性對于
2、風險決策具有關鍵性影響,因此分類方法及其在風險決策中的應用研究具有重要的理論和現(xiàn)實意義。 已有的相關研究主要從分類方法及其應用的角度考慮風險決策問題。事實上,在應用各種數據挖掘技術前,探索了解數據的特性將對挖掘結果有重要甚至關鍵性的影響。在分類問題中,特征變量異質性是一種重要的數據特性,對于分類方法的應用結果具有顯著影響。因此,本文主要研究考慮特征變量異質性的分類方法及其在風險決策問題中的應用。研究目的在于探索數據中存在的特征異
3、質性這一數據特性,并提出相應的解決方法以提高分類的準確性,使分類方法能夠更好地為風險決策提供支持。 本文從第一章到第六章的內容安排如下: 第一章概述了本文的研究背景,回顧了分類方法及其在風險決策問題中的相關研究和分類問題中特征變量異質性的研究現(xiàn)狀,說明了本文的研究內容和研究意義。 第二章首先對分類問題進行簡要介紹,然后概述分類問題中的特征變量相關性和特征變量選擇問題。在此基礎上,根據一系列理論和實際應用研究對特征
4、變量異質性的概念進行描述。由于特征變量異質性無法從數據樣本集合中直接觀察和測度,本章基于薈萃分析的基本思想,提出了一種利用全局特征變量選擇和數據樣本集合隨機劃分的方法來測度特征變量異質性的方法。在一系列基準數據集和人工構造的混合數據集上的實驗計算結果說明了該測度方法的有效性。 第三章主要考察特征變量異質性對分類方法效果的影響。本章首先對特征變量異質性的影響進行簡要分析,然后通過實證研究說明分類問題中存在的特征變量異質性對分類方法
5、的準確率具有較為顯著的影響。本章采用的分類方法為一種將logistic回歸與支持向量機集成的分類方法,該方法的主要思想是應用logistic回歸的輸出概率為支持向量機提供支持信息,以提高分類判別準確性。實證研究以企業(yè)財務困境預測這一風險管理和決策問題為背景,通過比較考慮特征變量異質性前后的分類預測準確率,說明了在存在特征變量異質性的分類問題中,考慮特征變量異質性有利于提高分類方法的準確率。 第四章提出了一種基于因子分析和聚類分析
6、的分類策略,該策略的基本思想是首先將原始的特征變量轉化為新的特征變量,使得新的特征變量能夠體現(xiàn)出原始特征變量在數據樣本空間中的異質性,然后通過聚類分析得到各個具有特征變量同質性的樣本子集,并在每個樣本子集中分別建立相應的分類模型,從而減小特征變量異質性對分類方法準確率的影響。對于一個未知類標記樣本,該分類策略首先將其轉化為因子得分向量,然后將該因子得分向量按照最近鄰規(guī)則劃分到與之最近的樣本子集合中,最后利用該樣本子集合中的分類模型進行分
7、類。在一系列基準數據集上的實驗計算結果說明了該分類策略的有效性。 第五章提出了一種考慮特征變量異質性且具有增量式學習特性的分類方法,可有效應用于一類具有特征變量異質性且需要決策者利用分類方法進行在線實時風險決策的問題。該方法首先利用基于網格的有指導聚類對數據樣本集合進行劃分,從而得到若干數據簇,且每個數據簇中數據樣本點的類標記相同。在去除異常數據點后,該方法計算各個數據簇的特征變量相關性,并將該相關性作為距離測度中各特征變量的權
8、重,應用最近鄰方法進行分類。本章最后將該分類方法應用于一系列基準數據集和市場營銷中的顧客確定問題,實證結果說明了該方法的有效性。 第六章總結本文的工作,歸納本文的主要創(chuàng)新點,指出目前本文研究的局限,并根據已取得的研究結果對未來進一步研究的問題進行思考。 本文工作的主要創(chuàng)新點如下: (1)提出了一種有效的特征變量異質性的測度方法,該方法可用于探索分類問題中存在的特征變量異質性,為解決分類問題提供策略性的信息。
9、 (2)提出了一種基于logistic回歸與支持向量機集成的分類方法,該方法利用logistic回歸得到的后驗概率信息對支持向量機的輸出結果進行修正,能夠有效提高傳統(tǒng)支持向量機的分類準確性。 (3)提出了一種有效的考慮特征變量異質性的分類策略,該策略將具有特征變量異質性的數據樣本集合劃分為若干同質性的子集合,然后通過在各個子集合中分別建立分類模型來提高分類的準確性。 (4)提出了一種具有增量式學習特性的分類方法,該方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分類潛變量模型在異質性群體分類中的應用研究.pdf
- 考慮異質性的活動-出行決策行為研究.pdf
- 疾病空間結構異質性界限的識別方法及其應用研究.pdf
- 多屬性決策方法及其在軟件項目風險管理中的應用研究.pdf
- 決策樹分類方法及其應用研究.pdf
- 考慮變量相關性的Monte Carlo方法在建筑風險管理中的應用.pdf
- 貝葉斯網絡推理方法及其在災害風險決策中的應用研究.pdf
- 特征變換在組合分類中的應用研究.pdf
- 分類變量的logistic回歸模型及其應用研究.pdf
- 支持向量機分類方法及其在文本分類中的應用研究.pdf
- 問句分類方法及其在問答系統(tǒng)中的應用研究.pdf
- 特征分類器研究及其在圖像分類中的應用.pdf
- 計算智能分類方法及其在入侵檢測中的應用研究.pdf
- 考慮個體異質性的網絡約租車選擇行為研究.pdf
- 分工演進中的資本異質性研究.pdf
- 基于PET圖像紋理特征的腫瘤異質性研究.pdf
- 基于異質性特征的電力價格歧視問題研究.pdf
- 實物期權方法在風險投資決策評價中的應用研究.pdf
- 數據挖掘中的決策樹方法及其在客戶分類中的應用.pdf
- 基于特征選擇的醫(yī)學圖像分類方法及其應用研究.pdf
評論
0/150
提交評論