轉錄因子結合位點和順式調控模塊識別方法的研究.pdf_第1頁
已閱讀1頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、DNA序列中轉錄因子結合位點的識別是解碼轉錄調控的重要任務之一。但是,從真核生物千兆數量級的堿基對中正確識別轉錄因子結合位點面臨著巨大挑戰(zhàn)。為解決這一難題,本文從兩方面展開研究:利用遺傳表觀數據來提高單轉錄因子結合位點識別的準確率,以及利用頻繁項集挖掘技術識別順式調控模塊。
  研究表明,遺傳表觀數據中DNase I數據、組蛋白修飾數據等其它數據有助于提高轉錄因子結合位點識別的準確率。
  本文首先將轉錄因子結合位點識別問題

2、轉換為有監(jiān)督分類學習問題。本文利用PWM得分結合DNase I數據,根據不同的模型組合成不同的特征向量,分別利用SVM和logistic回歸分類器進行訓練和預測。通過不同模型比較研究,發(fā)現(xiàn)將DNase I數據進行適當的切分,能更好的反映出DNase I數據總量特征以及DNase I數據 footprint特征,從而有助于提高識別的準確率。同其它方法相比較,這種基于有監(jiān)督分類學習的識別方法的識別效果是非常具有競爭力的。
  為了將每

3、個掃描出的位點的正確性給以概率上的說明,本文接著深入研究了一種基于遺傳表觀先驗信息的轉錄因子結合位點識別方法。本文提出了將有監(jiān)督學習得到的位置先驗信息和一種基于 Bayes決策理論的得分相結合的思想,并說明了其合理性。通過實驗同其它方法進行比較,結果表明這種結合是有效的。
  轉錄調控通常需要多個轉錄因子的合作,它們的轉錄因子結合位點之間距離較近,組成相應的順式調控模塊。有順式調控模塊的區(qū)域比只有單個轉錄因子結合位點的區(qū)域更可能是

4、轉錄調控區(qū)域,預測順式調控模塊從而推斷轉錄因子結合位點的分布,也可以提高轉錄因子結合位點預測的準確率。
  本文提出一種基于頻繁項集挖掘技術的順式調控模塊識別方法FCLOVER。該方法通過挖掘頻繁模體對,結合一種能量得分度量函數識別順式調控模塊。該能量得分函數充分結合了模體對的統(tǒng)計顯著性,近鄰約束,以及兩種支持度度量標準。通過能量得分曲線可以提取確切的順式調控模塊區(qū)域。本文通過實驗探究了各種因素對該方法的影響,并將該方法和前沿的順

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論