稀疏優(yōu)化在機器學習中的若干應(yīng)用.pdf_第1頁
已閱讀1頁,還剩141頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,利用解的稀疏性和其他內(nèi)在結(jié)構(gòu)成為眾多計算和工程領(lǐng)域中共同關(guān)注的問題.稀疏的內(nèi)含不僅是指“只有很少的非零分量”,它蘊含著“具有一種簡單結(jié)構(gòu)”.本文對機器學習中不同問題的稀疏結(jié)構(gòu)進行建模,并在必要時改進經(jīng)典的稀疏優(yōu)化算法進行求解.論文的主要工作可概括如下:
  1.第2章給出了本文在解決不同的機器學習問題中所提出的稀疏優(yōu)化模型及算法.所提出的稀疏優(yōu)化模型有同樣的抽象結(jié)構(gòu),即在一個具有某種簡單或特定結(jié)構(gòu)的假設(shè)空間上極小化某個損失

2、泛函.本文中給出的盒子約束的Lasso模型及塊PCA模型均具有這一結(jié)構(gòu).該章給出了求解盒子約束的Lasso模型的同倫算法及求解塊PCA模型的Splitting算法.
  2.第3章研究了求解盒子約束的Lasso模型的同倫算法的收斂性并檢驗了該算法的數(shù)值性能.該章的工作指出同倫算法收斂性不是顯然成立.在無退化指標假設(shè)和其它較弱的條件下,該章證明了同倫算法具有有限終止性.另外,該章討論了退化和循環(huán)的問題.當前已有眾多算法可求解該模型,

3、但數(shù)值實驗證明同倫算法具有特別的優(yōu)勢:適于最優(yōu)解非常稀疏的問題及需要計算整條正則化路徑的情形.這是第4章協(xié)同過濾數(shù)據(jù)可預(yù)測性問題的計算中所采用的關(guān)鍵技術(shù).
  3.第4章研究了協(xié)同過濾問題中評分數(shù)據(jù)的可預(yù)測性問題.當前協(xié)同過濾方面的大部分工作主要研究算法性能的改進.該章指出,受評分數(shù)據(jù)自身的限制,評分矩陣中有一部分未知評分是難于給出準確預(yù)測的.第4章提出了一個新的度量——相關(guān)性,以度量用戶在某個商品上的評分能被準確預(yù)測的可能性.一

4、個用戶一商品對的相關(guān)性由相關(guān)的用戶和商品構(gòu)成的社區(qū)所確定.作為相關(guān)性度量的應(yīng)用,提出了基于數(shù)據(jù)的組合方法(DOC)以應(yīng)用于推薦系統(tǒng).
  4.第5章研究從時間序列基因表達數(shù)據(jù)中推斷基因正則化網(wǎng)絡(luò)(GRN).由于計算復(fù)雜度較大,大部分GRN重建方法僅限于推斷較低連通性的單個網(wǎng)絡(luò).該章提出了網(wǎng)絡(luò)和社區(qū)識別方法,結(jié)合社區(qū)結(jié)構(gòu)信息,從基因表達數(shù)據(jù)中推斷多個子網(wǎng)絡(luò).其中的塊PCA模型,通過第2章給出的Splitting算法,可有效求解網(wǎng)絡(luò)中

5、的社區(qū)結(jié)構(gòu).
  5.第6章研究了作為蛋白質(zhì)鑒別關(guān)鍵步驟的肽段識別問題.序列數(shù)據(jù)庫搜索是當前肽段識別的主流方法.但搜索引擎給出的大量的匹配是不正確的.現(xiàn)有方法大多基于半監(jiān)督或監(jiān)督學習框架,充分利用了誘騙PSM的樣本及標簽信息,但目標PSM樣本點自身信息沒有被充分利用.該章提出了一個稱為FC-Ranker的新的評分方法,給每個目標PSM賦予一個非負權(quán)重,反映其匹配正確的可能性.特別地,F(xiàn)C-Ranker通過模糊支持向量機分類模型和所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論