

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、復雜疾病的致病不是由于單個基因位點的顯性或隱性的遺傳所引起的,遺傳因素在復雜疾病的發(fā)展中起著重要的作用,且其病因由多種因素組成,包括常見變異以及基因-基因、基因-環(huán)境相互作用等。目前我們對于大多數(shù)復雜疾病的病因的了解仍然有限,有很大比例的遺傳風險因素還有待探索。開展復雜疾病的遺傳學研究將有助于我們了解疾病發(fā)生發(fā)展中的生化機制和發(fā)病機制,從而為疾病的早期預防、早期診斷、藥物篩選和使用提供理論依據和生物靶標,最終提高復雜疾病的防治水平。因此
2、,開展復雜疾病的遺傳學研究有著重要的意義。
當前,復雜疾病遺傳機制的研究思路主要分為以下幾步:(1)開展高通量實驗得到位點的基因型。(2)對原始數(shù)據進行質量控制、人群結構分析。(3)進行功能變異位點分析,即單位點分析策略。(4)進行基因相互作用分析,即多位點分析策略。(5)構建復雜疾病遺傳機制的分子網絡。
復雜疾病的遺傳學研究的成果能夠為遺傳診斷和疾病預防提供大量的信息,這些信息將能夠為臨床決策提供重要的依據并使得個
3、性化醫(yī)療成為可能。二代測序技術的發(fā)展為遺傳疾病的診斷和預防奠定了堅實的基礎。
本研究論文的前三個課題將圍繞復雜疾病遺傳機制的研究思路中的(2)、(3)、(4)展開。第四個課題則提出了一種新的基于二代測序的無創(chuàng)產前診斷方法。
課題I:人群層化是指不同人群之間等位基因頻率存在系統(tǒng)性差異的現(xiàn)象。在全基因組關聯(lián)分析研究中,人群層化的存在會增加關聯(lián)分析結果的假陽性率。主成分分析是目前使用最廣泛的檢測人群層化的方法之一。然而,隨
4、著基因芯片技術的發(fā)展,其通量也越來越大,傳統(tǒng)的基于CPU的算法的效率已經無法滿足日益增長的數(shù)據量的需求。為此,我們實現(xiàn)了一種基于G P U的主成分分析的算法:SHEsisPCA,其運算效率遠遠高于傳統(tǒng)的基于CPU的算法,最高加速比超過了100倍。同時,我們也實現(xiàn)了一種基于X-means的聚類分析算法,它可以根據樣本的遺傳背景計算出匹配的病例和對照樣本,從而降低人群層化對于全基因組關聯(lián)分析的影響。我們使用SHEsisPCA對非洲人種進行了
5、人群結構分析,結果表明樣本的聚類結果和樣本的實際人群分類是高度相關的。且我們的研究表明,使用SHEsisPCA得到匹配的病例對照樣本后再進行關聯(lián)分析能很大程度上降低關聯(lián)分析的假陽性率。研究者們也可以使用SHEsisPCA來匹配公共數(shù)據庫里(如dbGaP,Illumina iControlDB)的對照樣本,從而擴充研究樣本的數(shù)據量,增加全基因組關聯(lián)分析的統(tǒng)計效能。
課題 II:關聯(lián)分析是遺傳學研究的重要手段。目前,已有很多適用于
6、二倍體二等位基因物種的關聯(lián)分析算法和軟件被提出,而適用于多倍體多等位基因物種的算法和軟件卻十分有限。多倍體在植物中是十分常見的,且多等位基因的遺傳標記位點,如小衛(wèi)星位點,拷貝數(shù)多態(tài)性等,也常常被研究者使用。本課題提出了一個用于多倍體多等位基因物種的關聯(lián)分析的在線分析平臺SHEsisPlus,其操作簡單、用戶友好,主要功能包括:病例-對照以及數(shù)量性狀位點的關聯(lián)分析、哈溫平衡檢驗、連鎖不平衡分析、單倍型分析以及高維的基因相互作用分析。同時,
7、我們也提出了兩種新的算法。一種是適用于多倍體多等位基因物種的高效的單倍型推斷算法,該算法的準確度以及效率遠遠超過了現(xiàn)有的算法。另一種是適用于數(shù)量性狀的高維基因相互作用分析算法,我們應用了信息論中的互作信息來定量位點之間的相互作用,研究結果表明該方法的統(tǒng)計效能遠遠高于傳統(tǒng)的方法,且不受單個位點的邊際效應的影響。SHEsisPlus是目前第一個支持多倍體多等位基因物種關聯(lián)分析的在線平臺。
課題 m:前列腺癌是發(fā)生于男性的最常見的惡
8、性腫瘤之一。前列腺癌是一種復雜疾病,目前認為復雜疾病的致病機制受遺傳因素和環(huán)境因素的交互影響。雖然現(xiàn)已發(fā)現(xiàn)了多個前列腺癌的易感基因位點,然而這些發(fā)現(xiàn)僅能解釋13%的遺傳度。為了進一步尋找前列腺癌致病因素中缺失的遺傳度,我們在四個人種(非洲裔美國人、歐洲人、拉丁美洲人、日本人)中開展了大規(guī)模的全基因組基因相互作用研究,共包含5,269個病例及5,289個對照。在我們的結果中,有一對相互作用的區(qū)域(7p21.3和18p11.2,p=1.4x
9、10_14)達到了經 Bonferroni矯正后的全局陽性閾值(p<2.28x10_13),且這兩個區(qū)域間的相互作用在四個人種中均為陽性。18p11.22位于基因以R4附近,研究表明,在前列腺癌的發(fā)生發(fā)展中,是基因 P T E N的ceRNAs(competing endogenous R N A),而P T E N則是一個重要的腫瘤抑制基因,該基因在多種腫瘤中均存在變異,包括前列腺癌。以往的研究已在7p21區(qū)域內發(fā)現(xiàn)了多個前列腺癌的易
10、感位點。藥物富集分析的結果表明,呈現(xiàn)強陽性的相互作用的基因與經FDA批準的用于治療前列腺癌的藥物的靶標基因顯著重疊。之前的研究認為全基因組關聯(lián)分析的結果可以為新藥的開發(fā)提供非常寶貴的信息。這里我們證明了全基因組基因相互作用分析的結果也能夠為藥物研發(fā)提供重要的證據和指導。這表明人類遺傳數(shù)據可以有效地和其他生物學信息相結合以發(fā)現(xiàn)新的生物學證據并指導藥物的開發(fā)。
課題 W:高通量測序技術已被廣泛應用于無創(chuàng)產前診斷領域,相比于傳統(tǒng)的有
11、創(chuàng)產前診斷,無創(chuàng)產前診斷不僅安全性高,其準確度和靈敏度也很高。無創(chuàng)產前診斷主要用于檢測胎兒的染色體非整倍性疾病,如21-三體綜合征、18-三體綜合征以及13-三體綜合征等。目前,使用高通量測序技術進行無創(chuàng)產前診斷的方法主要是Z-score法。該方法首先使用懷有正常胎兒的孕婦的相應染色體含量建立一個正常分布,然后將待測樣本的相應染色體的含量與該分布進行比較,最后得出診斷結果。由于該方法需要使用大量的正常樣本建立正常分布,這不僅耗時長,且成
12、本高。除此以外,每次測序的實驗環(huán)境(如實驗室的溫度、濕度等)無法保證一致,因此可能會引入噪聲,對結果造成一定的影響。針對這些問題,我們提出了一種新的分析方法,該方法只需一個已知正常的樣本即可判斷待測樣本是否患病,且參考樣本和受試樣本的DNA信息都在同一次測序中得到。這樣不僅減少了測序的成本、節(jié)約時間,且能夠盡可能地避免引入噪聲。我們使用該方法檢測了44個已知核型的樣本(共計13次測序實驗),其對于13-三體綜合征的檢測的特異性和靈敏性分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 用戶研究數(shù)據采集與分析工具的開發(fā)與應用.pdf
- 基因數(shù)據分析中聚類算法的研究與應用.pdf
- HHT與AC算法在金融數(shù)據分析中的應用研究.pdf
- 基于USB數(shù)據采集分析系統(tǒng)的開發(fā)與應用.pdf
- 基于OLAP技術的疾病數(shù)據分析系統(tǒng)的研究與應用.pdf
- 電力云數(shù)據分析平臺數(shù)據挖掘算法的研究與應用.pdf
- 機器學習算法在醫(yī)療數(shù)據分析中的應用.pdf
- 指紋算法研究平臺的設計開發(fā)與應用.pdf
- 粗糙數(shù)據分析模型與算法研究.pdf
- 大數(shù)據分析中的聚類算法研究.pdf
- 醫(yī)學數(shù)據組合因素分析系統(tǒng)開發(fā)與應用.pdf
- BP算法在煤譜數(shù)據分析中的應用研究.pdf
- 立方陣數(shù)據分析算法及其在三維熒光等復雜測試體系中的應用研究.pdf
- 機器學習算法在不同領域數(shù)據分析中的應用.pdf
- 盲分離算法在高速列車監(jiān)測數(shù)據分析中的應用.pdf
- 非線性與復雜網絡理論在腦電數(shù)據分析中的應用研究.pdf
- 制造執(zhí)行系統(tǒng)中數(shù)據采集器的開發(fā)與應用.pdf
- 電信行業(yè)中數(shù)據分析的關聯(lián)規(guī)則研究與應用.pdf
- 模糊分類算法及其在數(shù)據分析系統(tǒng)中的應用研究.pdf
- APRIORI_T算法研究及在高考數(shù)據分析中的應用.pdf
評論
0/150
提交評論