2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、轉(zhuǎn)錄因子結(jié)合位點(diǎn)的識(shí)別是闡明基因轉(zhuǎn)錄調(diào)控機(jī)制的重要環(huán)節(jié),準(zhǔn)確的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的預(yù)測(cè)算法將有助于人們識(shí)別轉(zhuǎn)錄因子的目標(biāo)基因,進(jìn)而研究其在上游調(diào)控區(qū)中的位置對(duì)轉(zhuǎn)錄調(diào)控的影響。然而,目前存在的預(yù)測(cè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的算法所得結(jié)果的特異性普遍較低,因此有必要提出一種新的有效的理論預(yù)測(cè)算法。動(dòng)物毒素能直接作用于藥物作用靶點(diǎn),這使得動(dòng)物毒素成為研究藥物靶點(diǎn)的重要工具。動(dòng)物毒素還在離子通道的研究、藥物發(fā)現(xiàn)和殺蟲(chóng)劑的合成方面有廣泛的應(yīng)用。因此,預(yù)測(cè)動(dòng)物

2、毒素就變得非常重要,有必要提出一種能準(zhǔn)確鑒別動(dòng)物毒素的理論算法。
   本文以轉(zhuǎn)錄因子結(jié)合位點(diǎn)、動(dòng)物毒素、神經(jīng)毒素、細(xì)胞毒素、突觸前神經(jīng)毒素和突觸后神經(jīng)毒素作為研究對(duì)象,利用位置關(guān)聯(lián)性打分方程(positioncorrelationscoringfunction,PCSF)、離散增量(incrementofdiversity,ID)、支持向量機(jī)(SupportVectorMachine,SVM)和樸素貝葉斯分類(lèi)器(NaiveBa

3、yesClassifier,NB)四類(lèi)算法對(duì)它們進(jìn)行了預(yù)測(cè)研究。本文的研究工作如下:
   首先,從轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù)庫(kù)JASPAR選出8種實(shí)驗(yàn)上證實(shí)的沒(méi)有冗余的轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù),結(jié)合位置保守性和偽計(jì)數(shù),構(gòu)建了位置關(guān)聯(lián)方程,通過(guò)定義位置關(guān)聯(lián)性打分方程的最佳閾值,使得打分方程在此最佳閾值下所得結(jié)果的假陽(yáng)率較低。同時(shí)為了比較打分方程在轉(zhuǎn)錄因子結(jié)合位點(diǎn)方面的預(yù)測(cè)能力,本文將打分方程與MATCHTM中所使用的位置權(quán)重矩陣進(jìn)行了比較

4、,結(jié)果顯示打分方程的預(yù)測(cè)能力優(yōu)于位置權(quán)重矩陣的預(yù)測(cè)能力。
   其次,從動(dòng)物毒素?cái)?shù)據(jù)庫(kù)ATDB下載了全部的動(dòng)物毒素,用Saha和Raghava工作中提供的非毒素的蛋白質(zhì)序列作為負(fù)集,利用PISCES軟件對(duì)動(dòng)物毒素和非毒素進(jìn)行序列相似性比對(duì),構(gòu)建了序列相似小于25%、40%、60%、80%和90%的數(shù)據(jù)集合。分別選取20種氨基酸組分、400種二肽組分、6種親疏水組分、36種二肽親疏水組分作為離散增量算法的參數(shù),對(duì)不同序列相似性的動(dòng)

5、物毒素?cái)?shù)據(jù)集進(jìn)行了預(yù)測(cè)。結(jié)果表明:離散增量算法在以二肽組分作為參數(shù)時(shí)預(yù)測(cè)結(jié)果最好;5種不同序列相似性的動(dòng)物毒素?cái)?shù)據(jù)集的預(yù)測(cè)結(jié)果隨序列相似性變化較小。為了進(jìn)一步提高動(dòng)物毒素的預(yù)測(cè)精度,本文對(duì)4種不同的離散增量值進(jìn)行組合并作為支持向量機(jī)的輸入?yún)?shù),對(duì)動(dòng)物毒素進(jìn)行了預(yù)測(cè),結(jié)果顯示:支持向量機(jī)的預(yù)測(cè)結(jié)果優(yōu)于離散增量算法的預(yù)測(cè)結(jié)果。同時(shí)本文還對(duì)神經(jīng)毒素和細(xì)胞毒素進(jìn)行了預(yù)測(cè)。此外,為了將支持向量機(jī)和其它的預(yù)測(cè)算法進(jìn)行比較,這里將支持向量機(jī)應(yīng)用到Sa

6、ha和Raghava構(gòu)建的神經(jīng)毒素的數(shù)據(jù)庫(kù)上,預(yù)測(cè)結(jié)果顯示:本文所使用的支持向量機(jī)的預(yù)測(cè)結(jié)果優(yōu)于Saha和Raghava所提出的算法取得的預(yù)測(cè)結(jié)果。
   最后,本文從Swiss-Prot數(shù)據(jù)庫(kù)上下載了突觸前和突觸后神經(jīng)毒素的蛋白質(zhì)序列,參照數(shù)據(jù)庫(kù)給出的注釋信息,統(tǒng)計(jì)了突觸前和突觸后神經(jīng)毒素的二硫鍵類(lèi)型及其二硫鍵數(shù)目的分布。從ATDB和Swiss-Prot數(shù)據(jù)庫(kù)上下載了突觸前和突觸后神經(jīng)毒素的蛋白質(zhì)序列,分別構(gòu)建了序列相似性小于

7、80%的數(shù)據(jù)集1和數(shù)據(jù)集2。本文采用了5種方法選取參數(shù):(1):蛋白質(zhì)序列的二肽參數(shù);(2):MRMR軟件提取的50個(gè)二肽參數(shù);(3):MEME搜索到的模體特征;(4):Prosite搜索到的模體特征;(5):Interpro搜索到的模體特征。本文還對(duì)這5種參數(shù)進(jìn)行了組合,一共得到了12類(lèi)參數(shù),并將這12類(lèi)參數(shù)作為離散增量和樸素貝葉斯分類(lèi)器的參數(shù),在Jackknife檢驗(yàn)下,對(duì)數(shù)據(jù)集1和2進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果表明:(1):增加模體參數(shù)的預(yù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論