版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、蛋白質(zhì)是細(xì)胞結(jié)構(gòu)的重要構(gòu)成物質(zhì),也是細(xì)胞內(nèi)各項功能的直接執(zhí)行者。蛋白質(zhì)組學(xué)的主要任務(wù)是定性和定量地鑒定某生物體組織或細(xì)胞內(nèi)的全部蛋白質(zhì),并進(jìn)一步對這些蛋白質(zhì)的亞細(xì)胞定位、相互作用與翻譯后修飾進(jìn)行系統(tǒng)分析。蛋白質(zhì)翻譯后修飾在真核生物細(xì)胞內(nèi)廣泛存在,對蛋白質(zhì)結(jié)構(gòu)和功能有重要影響。磷酸化修飾在信號轉(zhuǎn)導(dǎo)、代謝、增殖與分化等重要細(xì)胞進(jìn)程中發(fā)揮著重要作用,是目前蛋白質(zhì)組學(xué)研究最廣泛的修飾類型之一。串聯(lián)質(zhì)譜技術(shù)的快速發(fā)展,為蛋白質(zhì)組學(xué)研究提供了良好的
2、技術(shù)平臺。其中鳥槍法蛋白質(zhì)組學(xué)策略以肽段為核心,可實(shí)現(xiàn)肽段、蛋白質(zhì)及其翻譯后修飾的高通量快速鑒定,是目前蛋白質(zhì)組學(xué)研究最主要的技術(shù)手段。
蛋白質(zhì)序列數(shù)據(jù)庫搜索是串聯(lián)質(zhì)譜數(shù)據(jù)解析最主要的策略。然而受質(zhì)譜數(shù)據(jù)復(fù)雜性影響,數(shù)據(jù)庫搜索鑒定結(jié)果中會存在相當(dāng)比例的錯誤匹配。因此采用合理策略對數(shù)據(jù)庫搜索結(jié)果進(jìn)行質(zhì)量控制已成為數(shù)據(jù)解析的必要環(huán)節(jié)。正偽庫搜索是目前質(zhì)量控制領(lǐng)域應(yīng)用最廣泛的策略,可以估計不同來源質(zhì)譜數(shù)據(jù)肽段鑒定的準(zhǔn)確性。然而隨著蛋
3、白質(zhì)組學(xué)數(shù)據(jù)規(guī)模的不斷提升,現(xiàn)有質(zhì)量控制算法開始面臨更多的挑戰(zhàn):
1.在肽段質(zhì)控層面,多種數(shù)據(jù)搜索引擎被應(yīng)用于大規(guī)模串聯(lián)質(zhì)譜數(shù)據(jù)分析。質(zhì)控算法需要處理不同搜索引擎的鑒定結(jié)果,進(jìn)行合理整合,以保證肽段鑒定的準(zhǔn)確性與靈敏度。
2.在修飾質(zhì)控層面,以磷酸化為代表的翻譯后修飾質(zhì)控研究需要在保證肽段鑒定準(zhǔn)確性基礎(chǔ)上,進(jìn)一步保證修飾位點(diǎn)判定的準(zhǔn)確性。隨著修飾組學(xué)數(shù)據(jù)集規(guī)模的不斷提升,現(xiàn)有質(zhì)量控制算法不能有效保證大規(guī)模磷酸化肽段與
4、位點(diǎn)鑒定的準(zhǔn)確性。
3.受磷酸化修飾中性丟失、譜圖噪聲以及肽段序列潛在修飾位點(diǎn)臨近等因素影響,相當(dāng)比例的高可信匹配修飾肽段不能實(shí)現(xiàn)修飾位點(diǎn)的精確判定,嚴(yán)重降低了質(zhì)譜數(shù)據(jù)的利用效率。
4.在蛋白質(zhì)分析方面,采用多批次串聯(lián)質(zhì)譜數(shù)據(jù)集累加策略,人類蛋白質(zhì)編碼基因的鑒定覆蓋度可以達(dá)到60%甚至更高。采用合理質(zhì)控策略整合不同來源的蛋白質(zhì)組數(shù)據(jù)集,避免多批次鑒定結(jié)果累加引入的假陽性,保證最終蛋白質(zhì)列表的準(zhǔn)確性,已成為蛋白質(zhì)組信息
5、學(xué)關(guān)注的重要問題。
本文主要關(guān)注大規(guī)模串聯(lián)質(zhì)譜數(shù)據(jù)鑒定結(jié)果的質(zhì)量控制問題。在常規(guī)肽段質(zhì)控研究基礎(chǔ)上,構(gòu)建了高靈敏度、高準(zhǔn)確性的修飾肽段與位點(diǎn)質(zhì)控算法,進(jìn)一步添加序列特征,提升了質(zhì)譜數(shù)據(jù)利用效率。質(zhì)控流程應(yīng)用于人類染色體蛋白質(zhì)組計劃與酵母大規(guī)模蛋白質(zhì)組學(xué)數(shù)據(jù)分析,建立了蛋白質(zhì)水平鑒定準(zhǔn)確性評估機(jī)制,實(shí)現(xiàn)不同來源數(shù)據(jù)集的整合質(zhì)控,為后續(xù)生物學(xué)分析提供高可信的數(shù)據(jù)支撐。
首先在常規(guī)肽段質(zhì)控研究方面,對已有的基于迭代支持向量
6、機(jī)整合多特征的質(zhì)量控制策略進(jìn)行改進(jìn)。通過構(gòu)建質(zhì)控算法標(biāo)準(zhǔn)輸入格式、改進(jìn)理論碎裂模型與特征計算策略,使得算法可以適用多種質(zhì)譜儀器平臺數(shù)據(jù)與不同搜索引擎鑒定結(jié)果的質(zhì)控分析。進(jìn)一步建立常規(guī)肽段的多搜索引擎整合質(zhì)控模型,利用不同搜索引擎性能的互補(bǔ)性,提升肽段鑒定靈敏度。
在常規(guī)肽段質(zhì)控研究基礎(chǔ)上,針對已有磷酸化修飾質(zhì)量控制算法存在的問題以及大規(guī)模修飾組學(xué)數(shù)據(jù)分析的需要,開發(fā)了一套完整的磷酸化修飾數(shù)據(jù)集搜庫結(jié)果質(zhì)控流程PhosphoDi
7、stiller,保證修飾肽段與位點(diǎn)鑒定的準(zhǔn)確性與靈敏度。流程主要包括修飾肽段質(zhì)控、修飾位點(diǎn)概率打分、修飾位點(diǎn)Motif特征重打分以及蛋白質(zhì)水平統(tǒng)計展示模塊。
修飾肽段質(zhì)控與常規(guī)肽段質(zhì)控的基本原理相同,但整合的特征有所不同。在常規(guī)肽段質(zhì)控使用特征集合基礎(chǔ)上,修飾肽段質(zhì)控算法加入了磷酸化修飾中性丟失相關(guān)特征,針對不同碎裂模式質(zhì)譜數(shù)據(jù)進(jìn)行特征篩選,保證肽段鑒定靈敏度。實(shí)現(xiàn)多餾分?jǐn)?shù)據(jù)集整合質(zhì)控,避免不同餾分?jǐn)?shù)據(jù)質(zhì)量差異引入的假陽性。大
8、規(guī)模標(biāo)準(zhǔn)肽段數(shù)據(jù)集評估顯示,算法估計的錯誤發(fā)現(xiàn)率不低于真實(shí)值,可以保證修飾肽段鑒定準(zhǔn)確性。
位點(diǎn)概率打分算法主要作用是評估不同潛在修飾位點(diǎn)理論碎裂譜圖與噪聲過濾之后實(shí)驗(yàn)譜圖的相似關(guān)系,利用基于二項分布的數(shù)學(xué)模型,將匹配子離子數(shù)轉(zhuǎn)化成概率,評估位點(diǎn)鑒定的準(zhǔn)確性。為降低噪聲對位點(diǎn)判定的影響,結(jié)合位點(diǎn)特征離子總數(shù)引入一個虛擬的潛在修飾位點(diǎn),校正概率打分算法,避免位點(diǎn)錯誤發(fā)現(xiàn)率的低估。評估結(jié)果顯示,校正之后的位點(diǎn)概率打分算法估計的位點(diǎn)
9、錯誤發(fā)現(xiàn)率接近真實(shí)值,有效提升了修飾位點(diǎn)鑒定的準(zhǔn)確性。
之后針對那些概率打分算法不能精確定位的高可信修飾肽段匹配結(jié)果,在修飾位點(diǎn)概率打分基礎(chǔ)上,引入Motif序列特征,提升修飾位點(diǎn)判定的靈敏度。算法以貝葉斯模型為核心,采用概率打分中位點(diǎn)高可信的修飾肽段與非修飾肽段作為訓(xùn)練集,分析每個激酶及其對應(yīng)Motif在樣品中的活性,作為特征應(yīng)用于位點(diǎn)概率打分模型,提升算法對于臨近潛在修飾位點(diǎn)的區(qū)分能力。該策略將不同譜圖鑒定信息相關(guān)聯(lián),降低
10、位點(diǎn)打分算法對單一二級譜數(shù)據(jù)質(zhì)量的依賴。采用人類磷酸化富集數(shù)據(jù)集分析顯示,Motif特征打分與位點(diǎn)概率打分有很好的一致性,可以將位點(diǎn)鑒定規(guī)模提升15%左右。
最后應(yīng)用構(gòu)建的質(zhì)量控制體系對人類染色體蛋白質(zhì)組計劃的大規(guī)模數(shù)據(jù)展開分析。針對不同儀器平臺、不同樣本來源的串聯(lián)質(zhì)譜數(shù)據(jù)集,在肽段水平質(zhì)量控制基礎(chǔ)上,進(jìn)行蛋白質(zhì)水平的整合質(zhì)控,推出高可信的大規(guī)模整合蛋白質(zhì)組數(shù)據(jù)集,為注釋人類基因組——補(bǔ)充蛋白質(zhì)水平證據(jù)提供高可信的數(shù)據(jù)支撐。之
11、后以轉(zhuǎn)錄組豐度為背景,采用模擬策略對人類大規(guī)模蛋白質(zhì)組數(shù)據(jù)飽和性進(jìn)行分析,為后續(xù)染色體蛋白質(zhì)組研究的實(shí)驗(yàn)設(shè)計指明方向。除了人類蛋白質(zhì)組數(shù)據(jù),我們的質(zhì)量控制體系還應(yīng)用于酵母深度覆蓋蛋白質(zhì)組數(shù)據(jù)分析,進(jìn)一步研究飽和狀態(tài)下組學(xué)數(shù)據(jù)特性與質(zhì)控算法性能,為深入研究酵母基因組的表達(dá)特性提供高可信的數(shù)據(jù)支撐。
綜上所述,本研究針對鳥槍法蛋白質(zhì)組研究中大規(guī)模串聯(lián)質(zhì)譜數(shù)據(jù)肽段與翻譯后修飾鑒定結(jié)果的質(zhì)量控制問題,構(gòu)建基于正偽庫搜索的質(zhì)量控制流程P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 質(zhì)譜蛋白質(zhì)組中肽段及其修飾鑒定算法研究.pdf
- 蛋白質(zhì)組肽段鑒定質(zhì)量控制方法的研究與應(yīng)用.pdf
- 基于串聯(lián)質(zhì)譜的蛋白質(zhì)鑒定算法研究.pdf
- 一種基于串聯(lián)質(zhì)譜鑒定蛋白質(zhì)突變和翻譯后修飾的算法.pdf
- 頭發(fā)DHEA串聯(lián)質(zhì)譜檢測與應(yīng)用.pdf
- 質(zhì)譜聯(lián)用技術(shù)在藥品質(zhì)量控制研究中的應(yīng)用.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)的PepNovo并行化研究與實(shí)現(xiàn).pdf
- 蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)預(yù)處理的算法研究.pdf
- 15928.基于質(zhì)譜的高通量糖基化肽段鑒定新方法研究
- 肽段質(zhì)譜響應(yīng)曲線數(shù)據(jù)庫的建立和應(yīng)用.pdf
- 基于質(zhì)譜數(shù)據(jù)分析的蛋白質(zhì)鑒定——斷裂模型、磷酸化肽段以及譜庫搜索方法的研究.pdf
- 食品中多溴聯(lián)苯醚殘留的氣相色譜-質(zhì)譜與氣相色譜-串聯(lián)質(zhì)譜的分析方法研究與應(yīng)用.pdf
- 竹質(zhì)重組材熱壓工藝與質(zhì)量控制的研究.pdf
- 基于領(lǐng)域的服務(wù)質(zhì)量控制框架的研究與應(yīng)用.pdf
- 基于知識重用的質(zhì)量控制信息建模與數(shù)據(jù)挖掘算法及其應(yīng)用研究.pdf
- 軟件質(zhì)量控制技術(shù)的研究與應(yīng)用.pdf
- 基于pdca 法的教學(xué)質(zhì)量控制應(yīng)用與研究
- 串聯(lián)質(zhì)譜數(shù)據(jù)的預(yù)處理方法研究.pdf
- 食品中多種農(nóng)藥殘留的氣相色譜-質(zhì)譜與氣相色譜-串聯(lián)質(zhì)譜分析方法研究與應(yīng)用.pdf
- 電能質(zhì)量控制器串聯(lián)變換器的設(shè)計與實(shí)現(xiàn).pdf
評論
0/150
提交評論