版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、固有無(wú)序蛋白(IDPs,Intrinsic Disordered Proteins)是近些年發(fā)現(xiàn)的一類普遍存在且缺乏穩(wěn)定三維結(jié)構(gòu)的天然蛋白,在多種生理與病理過(guò)程中行使重要的生物學(xué)功能。由于結(jié)構(gòu)柔性大,實(shí)驗(yàn)研究IDPs難度很大。目前IDPs的許多生物機(jī)理還不清楚,基于生物信息學(xué)方法發(fā)展IDPs預(yù)測(cè)分析算法為IDPs的研究提供了重要研究工具。自固有無(wú)序蛋白被發(fā)現(xiàn)以來(lái),研究人員發(fā)展了多個(gè)IDPs預(yù)測(cè)算法,然而多數(shù)預(yù)測(cè)算法效率不高,不同預(yù)測(cè)算法
2、之間的預(yù)測(cè)結(jié)果具有很大差異,還需要更加全面、深入挖掘IDPs固有序列結(jié)構(gòu)特征。已有的IDPs預(yù)測(cè)算法都是基于蛋白質(zhì)序列特征構(gòu)建而成,因此為了揭示IDPs更深層次序列結(jié)構(gòu)特征,本文系統(tǒng)研究了IDPs中有序區(qū)和無(wú)序區(qū)對(duì)應(yīng)在DNA序列層次的差異特征,在此基礎(chǔ)上發(fā)展了IDPs有序區(qū)/無(wú)序區(qū)預(yù)測(cè)分類算法,為今后IDPs預(yù)測(cè)提供了新思路,論文主要工作如下。
1.基于DNA水平的IDPs有序區(qū)/無(wú)序區(qū)序列特征分析
以最新版本的ID
3、Ps數(shù)據(jù)庫(kù)DisProt6.02中的注釋信息為基礎(chǔ),本文首先從EMBL核酸數(shù)據(jù)庫(kù)獲取了IDPs對(duì)應(yīng)原始基因組中的DNA序列,經(jīng)過(guò)去冗余等環(huán)節(jié),最終構(gòu)建了包含1063條有序區(qū)和499條無(wú)序區(qū)數(shù)據(jù)集?;谠摂?shù)據(jù)集,本文借助序列分析CGR(Chaos Game Representation)模型、密碼子偏好分析等方法,深入研究了有序區(qū)和無(wú)序區(qū)序列的特征差異,結(jié)果表明有序區(qū)和無(wú)序區(qū)在單堿基、二聯(lián)體核苷酸、密碼子使用等方面存在不同程度的差異,具有
4、一定的偏好性。進(jìn)一步分析表明無(wú)序區(qū)有更寬的密碼子使用范圍,密碼子用法差異較大,具有相似密碼子用法的基因數(shù)量少,而有序區(qū)密碼子用法相似。對(duì)密碼子各位點(diǎn)GC相對(duì)含量、嘌呤與嘧啶的含量差分析結(jié)果表明有序區(qū)和無(wú)序區(qū)存在一定的特征差異。無(wú)序區(qū)G+C含量差異較大,無(wú)序區(qū)密碼子第三位位點(diǎn)偏好使用嘌呤而有序區(qū)偏好使用嘧啶。此外,本文對(duì)有序區(qū)和無(wú)序區(qū)連接位點(diǎn)區(qū)域的序列特征進(jìn)行了比較分析,結(jié)果發(fā)現(xiàn)無(wú)序區(qū)具有相對(duì)保守的序列特征。因此,上述研究表明了IDPs有
5、序區(qū)和無(wú)序區(qū)在DNA層次展現(xiàn)了不同程度的序列特征,為IDPs預(yù)測(cè)奠定了理論基礎(chǔ)。
2.融合蛋白質(zhì)及DNA序列特征的IDPs有序區(qū)/無(wú)序區(qū)分類方法
為了能夠定量刻畫IDPs有序區(qū)和無(wú)序區(qū)的差異特征,本文分別選取了三種特征參數(shù)作為IDPs分類算法的輸入?yún)?shù):第一種特征對(duì)應(yīng)DNA序列單堿基、二聯(lián)體核苷酸、三聯(lián)體核苷酸使用頻率;第二種特征引入了基于TN曲線和Z曲線提出的75個(gè)特征參數(shù)來(lái)描述三聯(lián)體核苷酸的組成及排列信息;第三種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列多位點(diǎn)特征挖掘的固有無(wú)序蛋白預(yù)測(cè).pdf
- 基于序列特征固有無(wú)序蛋白與蛋白質(zhì)和核酸相互作用位點(diǎn)的研究.pdf
- 同源固有無(wú)序蛋白全無(wú)序和半無(wú)序區(qū)結(jié)構(gòu)特征的計(jì)算機(jī)模擬研究.pdf
- 固有無(wú)序化蛋白質(zhì)預(yù)測(cè)和功能分析方法研究.pdf
- 結(jié)合增強(qiáng)采樣及化學(xué)位移約束對(duì)固有無(wú)序蛋白的計(jì)算模擬.pdf
- 8544.固有無(wú)序蛋白與其它成份相互作用數(shù)據(jù)庫(kù)構(gòu)建
- 基于機(jī)器學(xué)習(xí)的DNA序列分類算法研究.pdf
- 20974.基于svm分類機(jī)的dna序列分類方法
- 21226.基于統(tǒng)計(jì)特征的dna序列特征提取方法研究
- DNA及蛋白序列相似性分析方法研究.pdf
- 基于圖形表示的DNA序列分析研究.pdf
- 山羊FSHR基因部分結(jié)構(gòu)DNA序列的特征分析.pdf
- 基于時(shí)間序列分析的GPR數(shù)據(jù)特征提取與模式分類研究.pdf
- 基于序列信息的DNA結(jié)合蛋白質(zhì)預(yù)測(cè)方法研究.pdf
- DNA全序列分形特征研究.pdf
- 基于序列特征的胞內(nèi)蛋白穩(wěn)定性計(jì)算分析.pdf
- DNA序列特征分析及其在基因組研究中的應(yīng)用.pdf
- 基于序列的蛋白質(zhì)折疊速率與膜蛋白功能分類研究.pdf
- 基于序列編碼的蛋白質(zhì)分類問(wèn)題研究.pdf
- 基于固有特征的復(fù)印文檔取證研究.pdf
評(píng)論
0/150
提交評(píng)論