基于GC-MS的高速譜庫探索算法研究.pdf_第1頁
已閱讀1頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、化合物識別主要通過質(zhì)譜庫相似性搜索實現(xiàn)的。近年來,隨著質(zhì)譜庫中可用質(zhì)譜數(shù)據(jù)的迅速增加,這就需要一個高識別率,高速搜索的庫搜索算法。本文中我們將七種相似性度量結(jié)合在一起并利用它們的識別差異性來提高識別率,即多元組合相似性度量算法(Multiple Similarity Measures,MUL_SM)。七種相似性度量:絕對距離度量(Absolute Value Difference,ABS VD)、歐幾里得距離度量(Euclidean d

2、istance,Euclidean)、余弦相關(guān)系數(shù)度量(Cosine Correlation,Cosine)、相關(guān)系數(shù)度量(Correlation)和Stein和Scott提出的復(fù)合相似性度量(以下簡稱SS)、以及基于離散傅里葉變換和小波變換的復(fù)合相似性度量(Discrete Fourierand wavelet transform composite similarity measure,DFTR和DWTD)并利用粒子群優(yōu)化算法(Pa

3、rticle Swarm Optimization,PSO)來設(shè)定這七種不同相似性度量在MUL SM中所占的權(quán)重值。同時,為了減少庫搜索計算時間,從七種相似性度量中選擇一種度量作為“濾波器”(構(gòu)建子搜索主庫)。根據(jù)庫搜索計算時間、識別率和分子結(jié)構(gòu)相似性解釋能力三種性能,最終選定ABS VD作為原始搜索主庫的“濾波器”。
  傳統(tǒng)質(zhì)譜庫搜索的數(shù)據(jù)基本上是原始的氣相色譜-質(zhì)譜聯(lián)用(GasChromatography Coupled t

4、o Mass Spectrometry,GC-MS)數(shù)據(jù),樣本量多且數(shù)據(jù)的維數(shù)較高,從而導(dǎo)致庫搜索速度較為緩慢。所以本文中提出了一種基于隨機映射位置敏感哈希(Location Sensitive Hash,LSH)的庫搜索算法實現(xiàn)了高速、高效的庫搜索算法。
  本文主要研究內(nèi)容如下:
  1、針對傳統(tǒng)單一相似度量算法低識別率的問題,提出了MUL_SM。本算法主要內(nèi)容如下:識別差異性的可視化和粒子群優(yōu)化算法選擇權(quán)值。實驗表明M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論