2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩112頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分子進(jìn)化分析與相關(guān)進(jìn)化模式例子,分子進(jìn)化分析介紹系統(tǒng)發(fā)育樹重建方法相關(guān)進(jìn)化模式例子,從物種的一些分子特性出發(fā),從而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系。 蛋白和核酸序列通過序列同源性的比較進(jìn)而了解基因的進(jìn)化以及生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。,分子進(jìn)化研究的目的,,系統(tǒng)發(fā)育樹是什么?,對(duì)一組實(shí)際對(duì)象的世系關(guān)系的描述(如基因,物種等)。,一個(gè)系統(tǒng)發(fā)育樹,,,,,,,末端,物種,頂端,,,,,中間節(jié)點(diǎn),中間

2、枝條,,,,,根,,,末端分支,葉子,節(jié)點(diǎn),,,,,,,,,A,B,C,D,E?,F,G,,,樹只代表分支的拓?fù)浣Y(jié)構(gòu),,,,,,,,F,G,C,D,E?,A,B,,分子進(jìn)化研究的基礎(chǔ)(假設(shè)),核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息。,在各種不同的發(fā)育譜系及足夠大的進(jìn)化時(shí)間尺度中,許多序列的進(jìn)化速率幾乎是恒定不變的。(分子鐘理論, 1965 ),分子進(jìn)化研究的基礎(chǔ)(理論),雖然很多時(shí)候仍然存在爭(zhēng)議,但是分子進(jìn)化確實(shí)能闡述一些生物系

3、統(tǒng)發(fā)生的內(nèi)在規(guī)律。,分子進(jìn)化研究的基礎(chǔ)(實(shí)際),,從一個(gè)分歧數(shù)據(jù)可以推測(cè)其他,,,序 列 分 歧 度,分歧時(shí)間,,x,,,分子鐘理論,直系同源(orthologs): 同源的基因是由于共同的祖先基因進(jìn)化而產(chǎn)生的.旁系同源(paralogs): 同源的基因是由于基因復(fù)制產(chǎn)生的. (以上定義源自Fitch, W.M. (1970) Distinguishing homologous from analogous proteins. S

4、yst. Zool. 19, 99–113),直系同源與旁系同源,,,,paralogs,,,orthologs,,paralogs,,,,orthologs,Erik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog subtypes TRENDS in Genetics Vol.18 No.12 December 2002http

5、://tig.trends.com 0168-9525/02/$ – see front matter © 2002 Elsevier Science Ltd. All rights reserved.,以上兩個(gè)概念代表了兩個(gè)不同的進(jìn)化事件 用于分子進(jìn)化分析中的序列必須是直系同源的,才能真實(shí)反映進(jìn)化過程。,,趨同進(jìn)化的基因(genes have converged function by separate evolut

6、ionary paths),,異源基因或水平轉(zhuǎn)移基因(xenologous or horizontally transferred genes),,,,,,,Bacterium 1,Bacterium 3,Bacterium 2,Eukaryote 1,Eukaryote 4,Eukaryote 3,Eukaryote 2,,,,,,,Bacterium 1,Bacterium 3,Bacterium 2,Eukaryote 1,E

7、ukaryote 4,Eukaryote 3,Eukaryote 2,Phylograms show branch order and branch lengths進(jìn)化樹,有分支和支長(zhǎng)信息,2.進(jìn)化分支圖,進(jìn)化樹,Cladograms show branching order - branch lengths are meaningless進(jìn)化分支圖,只用分支信息,無支長(zhǎng)信息。,Rooted by outgroup,archae

8、a,archaea,archaea,bacteria outgroup,,root,,eukaryote,eukaryote,eukaryote,eukaryote,無根樹,archaea,archaea,archaea,Monophyletic group(單源群),Monophyleticgroup,,,3.有根樹,無根樹,外圍群,有根樹,外圍群,4.基因樹,物種樹,We often assume that gene trees

9、give us species trees,a,b,c,A,B,D,Gene tree,Species tree,系統(tǒng)發(fā)育樹重建分析步驟,多序列比對(duì)(自動(dòng)比對(duì),手工比對(duì)),建立取代模型(建樹方法),建立進(jìn)化樹,進(jìn)化樹評(píng)估,系統(tǒng)發(fā)育樹重建的基本方法,最大簡(jiǎn)約法(maximum parsimony,MP)距離法(distance)最大似然法(maximum likelihood,ML)Bayes法,最大簡(jiǎn)約法(MP),最大簡(jiǎn)約法

10、(maximum parsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。最大簡(jiǎn)約法的理論基礎(chǔ)是奧卡姆(Ockham)哲學(xué)原則,這個(gè)原則認(rèn)為:解釋一個(gè)過程的最好理論是所需假設(shè)數(shù)目最少的那一個(gè)。對(duì)所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計(jì)算,并計(jì)算出所需替代數(shù)最小的那個(gè)拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹。,序列個(gè)數(shù)與樹的個(gè)數(shù)的關(guān)系,優(yōu)點(diǎn):最大簡(jiǎn)約法不需要在處理核苷酸或者氨基酸替代的時(shí)候引入假設(shè)(替代模型)。此外,最大簡(jiǎn)約法對(duì)于分析

11、某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。,最大簡(jiǎn)約法(MP),缺點(diǎn):在分析的序列位點(diǎn)上沒有回復(fù)突變或平行突變,且被檢驗(yàn)的序列位點(diǎn)數(shù)很大的時(shí)候,最大簡(jiǎn)約法能夠推導(dǎo)獲得一個(gè)很好的進(jìn)化樹。然而在分析序列上存在較多的回復(fù)突變或平行突變,而被檢驗(yàn)的序列位點(diǎn)數(shù)又比較少的時(shí)候,最大簡(jiǎn)約法可能會(huì)給出一個(gè)不合理的或者錯(cuò)誤的進(jìn)化樹推導(dǎo)結(jié)果。,最大簡(jiǎn)約法(MP),距離法,距離法又稱距離矩陣法,首先通過各個(gè)物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化

12、距離模型)推導(dǎo)得出分類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化距離矩陣。進(jìn)化樹的構(gòu)建則是基于這個(gè)矩陣中的進(jìn)化距離關(guān)系 。,計(jì)算序列的距離,建立距離矩陣,,通過距離矩陣建進(jìn)化樹,一種簡(jiǎn)單的距離矩陣,由進(jìn)化距離構(gòu)建進(jìn)化樹的方法有很多,常見有:1.Fitch-Margoliash Method(FM法)2. Neighbor-Joining Method (NJ法/鄰接法)3. Neighbors Relaton Method(鄰居關(guān)系

13、法)4.Unweighted Pair Group Method (UPGMA法),通過矩陣建樹的方法,最大似然法(ML),最大似然法(maximum likelihood,ML)最早應(yīng)用于系統(tǒng)發(fā)育分析是在對(duì)基因頻率數(shù)據(jù)的分析上,后來基于分子序列的分析中也已經(jīng)引入了最大似然法的分析方法。,最大似然法分析中,選取一個(gè)特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個(gè)拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作

14、為最優(yōu)樹。在最大似然法的分析中,所考慮的參數(shù)并不是拓?fù)浣Y(jié)構(gòu)而是每個(gè)拓?fù)浣Y(jié)構(gòu)的枝長(zhǎng),并對(duì)似然率球最大值來估計(jì)枝長(zhǎng) 。,最大似然法(ML),最大似然法的建樹過程是個(gè)很費(fèi)時(shí)的過程,因?yàn)樵诜治鲞^程中有很大的計(jì)算量,每個(gè)步驟都要考慮內(nèi)部節(jié)點(diǎn)的所有可能性。最大似然法是一個(gè)比較成熟的參數(shù)估計(jì)的統(tǒng)計(jì)學(xué)方法,具有很好的統(tǒng)計(jì)學(xué)理論基礎(chǔ),在當(dāng)樣本量很大的時(shí)候,似然法可以獲得參數(shù)統(tǒng)計(jì)的最小方差。只要使用了一個(gè)合理的、正確的替代模型,最大似然法可以推導(dǎo)出一

15、個(gè)很好的進(jìn)化樹結(jié)果。,最大似然法(ML),堿基變化的通用模型,由于最大似然法的分析過程需要耗費(fèi)較多的時(shí)間,針對(duì)這種情況,發(fā)展出了許多優(yōu)化的可以加快最大似然法尋找最優(yōu)樹的搜索方法,如啟發(fā)式搜索,分枝交換搜索等。最大似然法具有堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)理論基礎(chǔ),充分的使用了分析序列中的信息資源,只要采用了合理的替代模型,可以得出很好的進(jìn)化樹分析結(jié)果。,最大似然法(ML),選擇外類群(Outgroup),選擇一個(gè)或多個(gè)已知與分析序列關(guān)系較遠(yuǎn)的序列作為外類

16、群外類群可以輔助定位樹根外類群序列必須與剩余序列關(guān)系較近,但外類群序列與其他序列間的差異必須比其他序列之間的差異更顯著。,bacteria outgroup,eukaryote,eukaryote,eukaryote,eukaryote,archaea,archaea,archaea,外圍群,,進(jìn)化樹的可靠性分析,自展法(Bootstrap Method),從排列的多序列中隨機(jī)有放回的抽取某一列,構(gòu)成相同長(zhǎng)度的新的排列序列重復(fù)上面

17、的過程,得到多組新的序列對(duì)這些新的序列進(jìn)行建樹,再觀察這些樹與原始樹是否有差異,以此評(píng)價(jià)建樹的可靠性,原始排列Alpha AACAACBeta AACCCCGamma ACCAACDelta CCACCAEpsilon CCAAAC,Bootstrap1Alpha ACAAACBeta ACCCCCGamma ACAAACDelta CACCCA

18、Epsilon CAAAAC Bootstrap2Alpha AAAACCBeta AACCCCGamma CCAACCDelta CCCCAAEpsilon CCAACC Bootstrap3Alpha ACAAACBeta ACCCCCGamma CCAAACDelta CACCCAEpsilon CAAAAC,,,分子進(jìn)化

19、模式,1、專性胞內(nèi)菌Rickettsia核心基因進(jìn)化機(jī)制2、藍(lán)藻二元信號(hào)轉(zhuǎn)導(dǎo)中的環(huán)化酶進(jìn)化機(jī)制3、藍(lán)藻限制性修復(fù)系統(tǒng)進(jìn)化機(jī)制4、蘇云金芽孢桿菌殺蟲蛋白進(jìn)化機(jī)制5、SARS進(jìn)化機(jī)制,1、專性胞內(nèi)菌Rickettsia核心基因進(jìn)化機(jī)制,,,,,2、藍(lán)藻二元信號(hào)轉(zhuǎn)導(dǎo)中的環(huán)化酶進(jìn)化機(jī)制,,,,,,,,,,,,3、藍(lán)藻限制性修復(fù)系統(tǒng)進(jìn)化機(jī)制,,,,,,,,4、蘇云金芽孢桿菌殺蟲蛋白進(jìn)化機(jī)制,,,,,,5、SARS進(jìn)化機(jī)制,,,,,

20、,,,,,此部分供同學(xué)們自學(xué),常見的分子進(jìn)化分析程序,1.Phylip 由華盛頓大學(xué)遺傳學(xué)系開發(fā),是一個(gè)免費(fèi)的系統(tǒng)發(fā)育分析軟件包,可以通過以下地址下載。http://evolution.genetics.washington.edu/phylip.html2. PAUP* 最早是在蘋果機(jī)上開發(fā)的具有菜單界面的進(jìn)化分析軟件,早先版本只有MP法,后續(xù)版本已經(jīng)包括距離法和ML法,現(xiàn)今有mac,win,linux等多種版本,

21、該軟件不是免費(fèi)軟件,使用者需要向開發(fā)者購(gòu)買。,Phylip軟件包介紹,Phylip是一個(gè)免費(fèi)的系統(tǒng)發(fā)生(phylogenetics)分析軟件包。以下鏈接可以下載: http://evolution.genetics,washington.edu/phylip.html 由華盛頓大學(xué)遺傳學(xué)系開發(fā),1980年首次公布,目前的版本是3.6(2000年6月)。,Phylip軟件包介紹,Phylip包含了35個(gè)獨(dú)立的程序,這些獨(dú)立的程序

22、都實(shí)現(xiàn)特定的功能,這些程序基本上包括了系統(tǒng)發(fā)生分析的所有方面。 Phylip有多種不同平臺(tái)的版本(包括windows,Macintosh,DOS,Linux,Unix和OpenVMX)。,Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括一下幾個(gè)程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進(jìn)化樹繪制組。,Phylip軟件包介紹,分子序列組: 1.蛋白質(zhì)序列:protpars,proml,promlk,

23、 protdist 2.核酸序列:dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp,Phylip軟件包分組介紹,距離矩陣組:Fitch,kitsch,neighbor基因頻率組:Gendist,contml離散字符組P

24、ars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor,Phylip軟件包分組介紹,進(jìn)化樹繪制組:drawtree,drawgram其他:restdist,restml,seqboot,contrast treedist,consense,retree,Phylip軟件包分組介紹,Phylip軟件包的文檔是非常詳細(xì)的,對(duì)于每個(gè)獨(dú)立的程序,都有一個(gè)獨(dú)立的文

25、檔,詳細(xì)的介紹了該程序的使用及其說明。 此外,Phylip軟件包還包括程序的源代碼(c語言)。,Phylip軟件包的文檔,Phylip軟件包的應(yīng)用,1,根據(jù)你的分析數(shù)據(jù),選擇適當(dāng)?shù)某绦?如,你分析的是DNA數(shù)據(jù),就在核酸序列分析類中選擇程序(dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,

26、dnacomp )如果分析的是離散數(shù)據(jù),如突變位點(diǎn)數(shù)據(jù),就在離散字符組里面選擇程序。,2.選擇適當(dāng)?shù)姆治龇椒ㄈ缒惴治龅氖荄NA數(shù)據(jù),可以選擇簡(jiǎn)約法(DNAPARS),似然法(DNAML, DNAMLK),距離法等(DNADIST)。。。,Phylip軟件包的應(yīng)用,3.進(jìn)行分析 選擇好程序后,執(zhí)行,讀入分析數(shù)據(jù),選擇適當(dāng)?shù)膮?shù),進(jìn)行分析,結(jié)果自動(dòng)保存為outfile,outtree。,Phylip軟件包的應(yīng)用,Outfile是一個(gè)

27、記錄文件,記錄了分析的過程和結(jié)果,可以直接用文本編輯器(如寫字板)打開。outtree是分析結(jié)果的樹文件,可以用phylip提供的繪樹程序打開查看,也可以用其他的程序來打開,如treeview,Phylip軟件包的應(yīng)用,出發(fā)數(shù)據(jù)-已經(jīng)排列好的蛋白序列。重構(gòu)算法-距離法(protdist.exe) 最大簡(jiǎn)約法(protpars.exe) 最大似然法(proml.

28、exe)統(tǒng)計(jì)分析-撥靴法(bootstrap),實(shí)際應(yīng)用(從蛋白序列推導(dǎo)進(jìn)化樹),實(shí)際操作,Phylip軟件包中的每個(gè)分析程序都是一個(gè)獨(dú)立的應(yīng)用程序。我們選擇好了分析算法后,按一定的順序組合使用選擇的程序,就可以獲得按選擇的算法分析的結(jié)果(進(jìn)化樹)。例子:從我們剛剛通過clustal比對(duì)獲得的蛋白序 列推測(cè)進(jìn)化樹。 選擇方法:距離法(protdist.exe),,第一步:雙擊執(zhí)行protdist.exe,根據(jù)提示輸入分析的

29、 文件名(程序默認(rèn)是infile)。,第二步:設(shè)定各個(gè)參數(shù),執(zhí)行程序,獲得距 離矩陣數(shù)據(jù)輸出文件outfile。第三步:選擇通過距離矩陣推測(cè)進(jìn)化樹的算法(fitch.exe,kotsch.exe,neighbor.exe)。第四步:將剛獲得的輸出文件改名為infile,執(zhí)行選擇的推測(cè)算法(neighbor.exe)。設(shè)置好參數(shù)后執(zhí)行程序,獲得outfile和ou

30、ttree兩個(gè)結(jié)果輸出。,獲得的結(jié)果文件中,outtree文件是一個(gè)樹文件,可以用treeview等軟件打開。outfile是一個(gè)分析結(jié)果的輸出報(bào)告,包括了樹和其他一些分析報(bào)告,可以用記事本直接打開。,outfile,outtree,加入統(tǒng)計(jì)分析(bootstrap),我們剛剛獲得的進(jìn)化樹是純粹的根據(jù)先前獲得的排列數(shù)據(jù)所推導(dǎo)出來的。有很多可能使得這個(gè)樹并不一定可靠。1.測(cè)序的出錯(cuò)。2.多序列比對(duì)算法本身的問題。3.其他的問題。我

31、們可以引進(jìn)一些統(tǒng)計(jì)分析來尋找更優(yōu)的進(jìn)化樹最常見的就是bootstrap分析。,Bootstrap分析,Phylip軟件包中有兩個(gè)用于執(zhí)行bootstrap分析的程序。(seqboot.exe,consence.exe)。分析過程:1.Seqboot產(chǎn)生大量的數(shù)據(jù)組2.應(yīng)用選擇的算法對(duì)產(chǎn)生的數(shù)據(jù)組進(jìn)行分析。3.由consence獲得最優(yōu)樹。,PAUP*的使用,PAUP*的數(shù)據(jù)格式(Nexus),#NEXUSbegin tax

32、a;dimensions ntax=12;taxlabelsLemur_catta…Tarsius_syrichta;end;begin characters;dimensions nchar=898;format missing=? gap=- matchchar=. interleave datatype=dna;options gapmode=missing;matrixLemur_catt

33、a AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATTHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATTPan AAGCTTCACCGGCGCAATTATCCTCATAATCGCCCACGGACTTACATCCTCAT

34、TATTATTGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATCATTATTATTPongo AAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTCCCTACTGTTHylobates AAGCTTTACAGGTGCAACCGTCCTCATAA

35、TCGCCCACGGACTAACCTCTTCCCTGCTATT,begin assumptions;charset coding = 2-457 660-896;charset noncoding = 1 458-659 897-898;charset 1stpos = 2-457\3 660-896\3;charset 2ndpos = 3-457\3 661-896\3;charset 3rdpos = 4-45

36、7\3 662-.\3;exset coding = noncoding;exset noncoding = coding;usertype 2_1 = 4[weights transversions 2 times transitions]a c g t[a]. 2 1 2[c] 2 . 2 1[g]1 2 . 2[t]2 1 2 .;user

37、type 3_1 = 4[weights transversions 3 times transitions]a c g t[a]. 3 1 3[c] 3 . 3 1[g]1 3 . 3[t]3 1 3 .;taxset hominoids = Homo_sapiens Pan Gorilla Pongo Hylobates;end;begin paup

38、;constraints ch = ((Homo_sapiens,Pan));constraints chg = ((Homo_sapiens,Pan,Gorilla));end;,PAUP*的數(shù)據(jù)格式(Nexus) 主要包括taxa,characters,assumptions,sets,trees,codons,distances,paup八個(gè)數(shù)據(jù)塊。 對(duì)于一個(gè)常規(guī)的分析,taxa,characters塊是

39、必須的。而分析的命令可以通過菜單操作(mac),或者鍵盤命令(win,linux),也可以在nexus文件中加入paup命令塊,1.TAXA塊 主要是定義所分析的數(shù)據(jù)(如分子序列)個(gè)數(shù),以及這些數(shù)據(jù)的名稱(如物種名稱)。2. CHARACTERS 塊 主要是定義數(shù)據(jù)矩陣(如多序列比對(duì)結(jié)果)和其他一些相關(guān)的信息(如序列特征值,序列有效區(qū)域等),PAUP*的Nexus的文件塊,3. ASSUMPTIONS塊 定義了

40、對(duì)數(shù)據(jù)的一些設(shè)定,如那些特征值是不需考慮的,怎么處理gap這個(gè)特征值等,用戶自定義的一些數(shù)據(jù)也放在這塊,如自定義的打分矩陣。4. SETS塊 定義了一系列的數(shù)據(jù)組,如特征值組,物種組等,這些設(shè)置都是為了方便后續(xù)的分析。,5. TREES 塊 定義了用戶自己設(shè)定的樹。用于后續(xù)的分析,如作為限制樹等。6. CODONS 塊 定義了遺傳密碼子的一些信息。如編碼的位置(哪些是編碼的,密碼子的位點(diǎn)等)。7. DIS

41、TANCES 塊 定義了一些距離矩陣。,8. PAUP 塊 是軟件的核心塊,所有的分析命令和一些參數(shù)設(shè)置(90多個(gè)命令)都放在這一塊。 這一塊并不是分析輸入數(shù)據(jù)所必須的,這些命令可以寫在這一塊(文件中),這時(shí)載入文件時(shí)就開始根據(jù)該塊的命令進(jìn)行分析(有點(diǎn)類似dos的批處理過程)。當(dāng)然也可以通過鍵盤命令逐一敲入 ,交互進(jìn)行分析。 批處理的方式在分析過程比較長(zhǎng),耗時(shí)比較久的時(shí)候是比較有用的。當(dāng)然在進(jìn)行處理之前一定要先

42、保證該批處理過程沒有問題。,一個(gè)PAUP*的基本分析實(shí)例,1.通過clustalw/clustalx獲取一個(gè)多序列比對(duì)結(jié)果(可能要經(jīng)過人工調(diào)整,推薦用bioedit做輔助編輯器)。保存成nexus格式的文件,或者用其他格式轉(zhuǎn)換軟件轉(zhuǎn)換成nexus格式。paup*中也有一個(gè)tonexus命令可以將其他格式(包括phylip,GCG等格式)的文件轉(zhuǎn)換為nexus格式的文件。,2.在PAUP*程序中讀入數(shù)據(jù)(Nexus格式),輸入命令的地方,

43、打開文件的窗口,程序自帶的測(cè)試數(shù)據(jù),執(zhí)行該文件還是編輯該文件?執(zhí)行文件時(shí)將文件數(shù)據(jù)讀入程序,編輯文件則調(diào)用一個(gè)文本編輯器。如果不是nexus格式,執(zhí)行時(shí)候會(huì)出錯(cuò),然后調(diào)用文本編輯器打開。,3.數(shù)據(jù)輸入完成,開始分析… 兩個(gè)很有用的命令 ?:顯示所有的命令 命令 ?:顯示命令的所有參數(shù),分析…(開始一),1.開始之前 打開記錄文件?(跟蹤整個(gè)分析過程)命令:log start file =your_log_f

44、ile_name;停止:log stop;,2.設(shè)置數(shù)據(jù) 哪些用于分析?如:include coding/only; exclude coding/only;哪些物種要分析(刪除不要的)?如: delete 1; 或者 delete taxa_name… undelete 1;……,分析…(開始二),3.確定建樹方法最大簡(jiǎn)約法?最大似然法? 距離法?命令:Set crite

45、rion=parsimony|likelihood|distance;,分析…(建樹一),4.確定其他參數(shù)Set ?查看其他參數(shù)的設(shè)置,改為自己所需要的設(shè)置。如:set maxtree=10000 increase=no autoclose=yes;,分析… (建樹二),5.確定搜索方法(對(duì)于距離法不適用) 窮盡法:alltrees 分支跳躍查找:bandb 啟發(fā)式搜索:hsearch 其他:puz

46、zle(只在likelihood時(shí)有效)…,分析… (建樹三),6.開始搜索樹之前(設(shè)置各個(gè)建樹方法的參數(shù))距離法:dset如:dset distance=tamnei negbrlen=allow最大簡(jiǎn)約法:pset如 pset collapse=no gapmode=newstate最大似然法:lset如:lset nst=6 clock=yes,分析… (建樹四),7.再次確認(rèn)參數(shù) 是否要設(shè)置外圍群(outgro

47、up)?如 outgroup 1,2 ;或者 outgroup taxa_set;其他參數(shù)?,分析… (建樹五),7.開始搜索樹距離法:NJ,UPGMA最大簡(jiǎn)約法,最大似然法Hsearch ?參數(shù)是否要更改?如:hsearch andseq=random swap=spr,分析… (建樹六),8.進(jìn)化樹的評(píng)估 選擇評(píng)估方法?Bootstrap(自展法) 用的最多,是對(duì)進(jìn)化樹重新取樣的評(píng)估方法,可以對(duì)距離法,

48、簡(jiǎn)約法,似然法以及衍生出的任何其他方法構(gòu)建的進(jìn)化樹進(jìn)行評(píng)估。其分析結(jié)果是一組數(shù)字,這個(gè)數(shù)字描述了進(jìn)化樹進(jìn)化分支的支持比例,也就是進(jìn)化樹分支的穩(wěn)健性。,分析…(樹評(píng)估一),分析… (樹評(píng)估二),未經(jīng)過bootstrap的樹,Bootstrap后的樹,BOOTSTRAP [options][/heuristic-search-options|branch-and-bound-search-options]; 使用分支限制或者是

49、啟發(fā)式搜索的方法進(jìn)行bootstrap分析。參數(shù):? BSEED = integer-value 隨機(jī)數(shù)種子。? NREPS = integer-value bootstrap重復(fù)的次數(shù),默認(rèn)值為100。? SEARCH = HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA 搜索方式? CONLEVEL = integer-value bootstrap重復(fù)次數(shù)的最低比率,默認(rèn)為50。? KEEPALL

50、= YES|NO? WTS = IGNORE|SIMPLE|REPEATCNT|PROPORTIONAL? NCHAR = CURRENT|number-of-characters 每次重復(fù)采樣的數(shù)目。? GRPFREQ = YES|NO 顯示bootstrap分割頻率? TREEFILE = bootstrap-tree-file-name 樹的文件? FORMAT= NEXUS|ALTNEXUS|FREQPARS|PHY

51、LIP|HENNIG ? BRLENS = YES|NO 分支的長(zhǎng)度? *REPLACE = YES|NO? CUTOFFPCT = integer-value 定義顯示的最低bootstrap分割頻率。Examplebootstrap nreps=200 treefile=boot.tre search=heuristic/addseq=random;,分析… (樹評(píng)估三),PAUP*中的bootstrap命令,對(duì)折分析(j

52、ackknife) 跟bootstrap類似,只是在對(duì)原始數(shù)據(jù)取樣的時(shí)候不會(huì)取重復(fù)的數(shù)據(jù)位點(diǎn)。因?yàn)樗貜?fù)取樣的時(shí)候是在原始數(shù)據(jù)中除去一個(gè)或者多個(gè)比對(duì)位點(diǎn)。 對(duì)折分析得出的結(jié)果和bootstrap是一樣的。命令和參數(shù)都類似,用的比bootstrap少很多。,分析… (樹評(píng)估四),JACKKNIFE [options][/heuristic-search-options|branchand-bound-search-options]

53、; 對(duì)折分析? PCTDELETE = real-value 每個(gè)對(duì)折分析循環(huán)中刪除的data set百分?jǐn)?shù)? JSEED = integer-value 隨機(jī)數(shù)種子? NREPS = integer-value 對(duì)折循環(huán)次數(shù)? SEARCH = HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA 樹的搜索方法(NJ和UPGMA僅在最優(yōu)規(guī)則為distance時(shí)才可用)? RESA

54、MPLE = NORMAL|JAC ? CONLEVEL = integer-value boostrap中出現(xiàn)的最小比例(最為保留group),默認(rèn)為50,即50%? KEEPALL = YES|NO 低于conlevel的樹,若與一致樹兼容,也保留? WTS = IGNORE|SIMPLE|REPEATCNT|PROPORTIONAL ? GRPFREQ = YES|NO 顯示對(duì)折分區(qū)頻率? TREEFIL

55、E = tree-file-name? FORMAT = NEXUS|ALTNEXUS|FREQPARS|PHYLIP|HENNIG? *REPLACE = YES|NO? CUTOFFPCT = integer-value 對(duì)折頻率表中顯示的最小頻率。ExampleJACKKNIFE nreps=200 treefile=tree.tre search=heuristic/addseq=random,分析… (樹評(píng)估五)

56、,PAUP*中的jackknife命令,KHtest和SHtest 用來測(cè)試一個(gè)特定的次優(yōu)化的ml或者mp拓?fù)浣Y(jié)構(gòu)同最優(yōu)化的拓?fù)浣Y(jié)構(gòu)相比是否顯著不同(通常用來做Hypothesis test)。 PAUP*中這兩個(gè)測(cè)試是作為pscores和lscores的一個(gè)參數(shù),默認(rèn)關(guān)閉,需要進(jìn)行這兩個(gè)測(cè)試的時(shí)候,要打開該參數(shù)。Pscore中有KHtest,不支持SHtestLscore中有KHtest和SHtest,分析…

57、(樹評(píng)估六),如:Pscores all/khtest=normal;Lscores all/khtest= normal shtest=rell; 測(cè)試得出的結(jié)果是返回一個(gè)顯著性差異系數(shù)(P值)。,分析… (樹評(píng)估七),其他測(cè)試隨機(jī)測(cè)試:permute不一致的長(zhǎng)度差異測(cè)試: hompart…,分析… (樹評(píng)估八),分析結(jié)束之前,1.保存分析結(jié)果Savetrees 根據(jù)要求將內(nèi)存中的樹保存到文件如:savetre

58、es file=tree.tre brlens=yes savebootp=both from=1 to=2;2.停止記錄文件Log stop;,退出,3.如果要進(jìn)行下一項(xiàng)分析,想讓原來改過的參數(shù)全部變回默認(rèn)設(shè)置 命令:factory 所有參數(shù)恢復(fù)默認(rèn)設(shè)置4.確定要退出后 命令 :quit,一些有用的命令,1.Treeinfo 查看內(nèi)存中樹的情況(多少個(gè)?有根還是無根?…)。2.clear 清除內(nèi)存

59、中所有的樹。3.showtree 查看內(nèi)存中的樹(默認(rèn)顯示第一個(gè)樹,可以加入?yún)?shù)) 如:showtree all;showtree 2,3;4.gettrees 從樹文件中讀取樹到內(nèi)存中,5.dscores,pscores,lscores 計(jì)算樹的距離,簡(jiǎn)約性,相似性分值。6.ingroup/outgroup 取消和設(shè)定外圍群7.Contree 根據(jù)一定的規(guī)則求解一致樹8.Deroott

60、rees 將有根樹轉(zhuǎn)換為無根樹9.Roottrees 根據(jù)當(dāng)前設(shè)定的outgroup將無根樹轉(zhuǎn)換為有根樹,10.Filter根據(jù)設(shè)定的規(guī)則篩選樹。11.詳細(xì)的命令請(qǐng)參考paup*軟件的command reference。,Paup塊的一個(gè)例子,begin paup;Log star file=log.txt; set criterion=likelihood autoclose=yes maxtree

61、s=10000 increase=no;lset nst=6 rmatrix=estimate basefreq=estimate pinv=estimate rates=gamma shape=estimate; hsearch addseq=random nreps=100; bootstrap nreps=1000 search=heuristic brlens=yes;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論