版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在過去十多年間,數(shù)據收集和存儲能力的顯著進步在生物、天文學、統(tǒng)計學和經濟學等許多科學領域都引起了“信息過載”的問題。研究者需要面對越來越海量的數(shù)據,和已經經過廣泛研究的傳統(tǒng)小數(shù)據集不同,這類數(shù)據對數(shù)據分析方法提出了新的挑戰(zhàn)。幸運的是,很多實際數(shù)據集都存在隱含的少量參數(shù)控制其主要的分布變化,類似的情況出現(xiàn)在很多不同的研究領域中獲取的高維數(shù)據中,比如生物信息學、機器人導航和自然語言處理等。這些隱含參數(shù)描述了一個低維流形,可以通過記錄哪些流形
2、上的點為近鄰的圖來表示。通過圖嵌入,我們便可以獲取描述隱含參數(shù)的低維坐標,進而揭示出數(shù)據潛在的結構,從而使數(shù)據探索、可視化和建模的性能更優(yōu)。圍繞這一目標,全文的主要工作概括如下:
(1)線性判別分析(linear discriminant analysis,LDA)在數(shù)據挖掘、機器學習和生物信息學等領域是最為常用的有監(jiān)督特征提取和維數(shù)約減工具之一??墒?,LDA的計算通常需要求解稠密矩陣對的廣義特征分解,計算負擔較大,難以應
3、用于大規(guī)模數(shù)據集。因此,在本文中我們提出瑞利-瑞茨判別分析(Rayleigh-Ritz discriminant analysis,RRDA)用于求解LDA,不同于以往需要將LDA轉換為回歸問題的相關方法,RRDA建立在求解通用特征值問題的瑞利-瑞茨框架基礎上,同時,通過利用LDA問題的特殊結構,我們得以設計出快速的子空間擴展和瑞茨向量擴展策略。為了降低LDA應用中常見的樣本不足問題的計算復雜度,我們也為其建立了RRDA的等價快速形式。
4、此外,我們進一步討論了RRDA的實現(xiàn)細節(jié)和收斂結果。在多個真實數(shù)據集上的實驗結果表明了RRDA的有效性。
(2)正則化線性判別分析(regularized linear discriminant analysis,RLDA)是用于處理LDA中小樣本問題(small sample size,SSS)的維數(shù)約減方法。RLDA的一個尚未解決的重要問題是如何快速確定合適的正則參數(shù),而不需訴諸交叉驗證等擴展性較差的方法。在本文中,基
5、于RLDA的幾何解釋,我們提出一種新穎的RLDA參數(shù)選擇方法。我們進而給出所提出方法的理論分析,證明它對于訓練數(shù)據特征空間的擾動具有魯棒性。在多個基準數(shù)據集上的實驗結果證明了該方法的有效性。
(3)蛋白質相互作用網絡為理解生物過程、功能和細胞內在復雜演化機制提供了新的渠道。為蛋白質網絡建模,找出需要更少的結構假設、對噪音魯棒和擬合能力更強的網絡模型仍然是系統(tǒng)生物學的重要課題。在本文中,我們提出一種基于圖嵌入的t-邏輯斯蒂語
6、意嵌入(t-logistic semantic embedding,t-LSE)模型為蛋白質相互作用網絡建模。基于蛋白質網絡的幾何假設,t-LSE試圖自適應地將網絡嵌入到低維空間,并使用非凸損失函數(shù)降低噪音的影響,實驗結果證明相比于其它主流網絡模型,t-LSE的擬合能力更強,同時我們所選取的非凸損失函數(shù)也顯著地提高了對于蛋白質網絡噪音的處理能力。由此,我們所提出的模型可以有助于基于圖的蛋白質相互作用網絡研究,更好地推斷出其隱含的生物知識
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖的半監(jiān)督維數(shù)約減方法的研究.pdf
- 基于圖的半監(jiān)督維數(shù)約減算法研究及其應用.pdf
- 基于流形學習和低秩表示的維數(shù)約減算法研究.pdf
- 基于嵌入式Linux的裁減方法設計與實現(xiàn).pdf
- 基于非線性維數(shù)約減的模式識別.pdf
- 維數(shù)約減技術及應用.pdf
- 非線性維數(shù)約減的研究及其應用.pdf
- 基于圖的半監(jiān)督學習和維數(shù)約簡方法及其應用研究.pdf
- 基于圖的半監(jiān)督學習和維數(shù)約簡:方法及其應用研究.pdf
- 步態(tài)識別中的目標輪廓提取和特征維數(shù)約減研究.pdf
- 基于MLE的本征維數(shù)估計方法研究.pdf
- 用有限維約化和反可積方法對若干無窮維問題的研究.pdf
- 不可約特征標維數(shù)對群結構的影響.pdf
- 維數(shù)約減和半監(jiān)督學習研究及在人群數(shù)量估計的應用.pdf
- 基于稀疏學習的圖像維數(shù)約簡和目標識別方法研究.pdf
- 基于SOM和模糊聚類的設計空間縮減方法研究及應用.pdf
- 基于復雜網絡局域維數(shù)的圖像分割方法研究.pdf
- 基于非線性維數(shù)約減的優(yōu)化算法在腦電問題中的應用.pdf
- 非線性維數(shù)約減算法中若干關鍵問題的研究.pdf
- 基于多嵌入維數(shù)的時用水量LSSVM組合預測.pdf
評論
0/150
提交評論