版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、轉(zhuǎn)座子是一大類廣泛存在于生物基因組中的DNA序列,其通過轉(zhuǎn)錄或者逆轉(zhuǎn)錄的方式,將自身的一個(gè)拷貝插入到基因組新的位點(diǎn)。二十世紀(jì)四十年代后期Babara McClintock首次發(fā)現(xiàn)轉(zhuǎn)座子,隨著越來越多物種基因組序列的公布,發(fā)現(xiàn)轉(zhuǎn)座子在所有生物基因組中廣泛分布,而且隨著研究的深入,發(fā)現(xiàn)這些轉(zhuǎn)座子對(duì)其宿主有著極為重要的作用,具體表現(xiàn)在對(duì)宿主基因組的擴(kuò)增、基因組重排、新基因形成、基因破壞、基因表達(dá)活性以及驅(qū)動(dòng)microRNA的形成等多個(gè)方面。<
2、br> 桑樹是一種多年生的木本植物,長期以來人們對(duì)桑樹的認(rèn)識(shí)都停留在栽桑養(yǎng)蠶的層面上,其生態(tài)價(jià)值、經(jīng)濟(jì)價(jià)值以及藥用價(jià)值等被忽視。近年來隨著研究的深入,其綜合利用價(jià)值逐斬得到發(fā)掘,諸如石漠化治理、鹽堿地治理、防風(fēng)治沙等多種生態(tài)價(jià)值,桑葉、桑葚、桑皮、桑根等的藥用價(jià)值以及桑葉、桑葚等作為保健食品等的經(jīng)濟(jì)價(jià)值。然而即便如此,作為??浦参锏拇?,桑樹的分子研究基礎(chǔ)非常薄弱,關(guān)于其轉(zhuǎn)座子方面的研究基礎(chǔ)仍是一個(gè)空白,因此對(duì)桑樹轉(zhuǎn)座子的研究對(duì)于我們
3、進(jìn)一步了解桑樹的特性有著重要的意義。
桑樹基因組測序的完成,為我們從全基因組層面上對(duì)桑樹基因組中轉(zhuǎn)座子進(jìn)行全面的鑒定以及分析提供了絕佳的機(jī)會(huì)。本研究基于多種方法從全基因組層面對(duì)桑樹中的所有轉(zhuǎn)座子進(jìn)行鑒定,并所有轉(zhuǎn)座子的分布特征、插入?yún)^(qū)間偏好性及其對(duì)基因的影響等方面進(jìn)行分析。LTR類逆轉(zhuǎn)錄轉(zhuǎn)座子占據(jù)了所有轉(zhuǎn)座子的絕大部分,因此我們進(jìn)一步對(duì)桑樹中的這些LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的特性進(jìn)行分析。另外,在鑒定轉(zhuǎn)座子的過程當(dāng)中發(fā)現(xiàn)在含量最為豐富
4、的LTR類逆轉(zhuǎn)錄轉(zhuǎn)座子中存在大量Nested LTR類逆轉(zhuǎn)錄轉(zhuǎn)座子,Nested LTR逆轉(zhuǎn)錄轉(zhuǎn)座子對(duì)染色體著絲粒的形成和基因組的進(jìn)化、擴(kuò)增等具有著重要的意義,我們對(duì)這部分Nested逆轉(zhuǎn)錄轉(zhuǎn)座子的特征也進(jìn)行了分析。主要研究結(jié)果如下:
一、全基因組轉(zhuǎn)座子的鑒定及轉(zhuǎn)座子數(shù)據(jù)庫的構(gòu)建
1、為了全面鑒定桑樹中的轉(zhuǎn)座子,考慮到各種方法的優(yōu)缺點(diǎn)、最終我們結(jié)合多種方法來完成對(duì)桑樹基因組中轉(zhuǎn)座子的鑒定。所用到的方法包括De nov
5、o鑒定方法、基于結(jié)構(gòu)特征鑒定方法和基于同源性鑒定方法。匯總?cè)糠椒ㄨb定到的序列庫命名為CustomLib。將CustomLib與已知的三個(gè)數(shù)據(jù)庫(Repbase、Plant Repeat Database、RepeatPep)比對(duì)篩選,最終得到可靠的轉(zhuǎn)座子序列共計(jì)5925條,并將這些序列劃分為13個(gè)超家族,包括Copia、Gypsy、Lard、Trim、L1、RTE、hAT、CMC、PIF-Harbinger、MuLE、TcMar、MI
6、TE、Helitron等,轉(zhuǎn)座子依據(jù)wicker提出的標(biāo)準(zhǔn)進(jìn)行命名。
2、對(duì)于轉(zhuǎn)座子家族的劃分,我們根據(jù)wicker提出的80-80-80 rule進(jìn)行,最終我們將這5925個(gè)轉(zhuǎn)座子序列劃分為1062個(gè)家族,其中Copia有226個(gè)家族、Gypsy有145個(gè)家族、Lard有312個(gè)家族、Trim有119個(gè)家族、L1有19個(gè)家族、RTE有30個(gè)家族、PIF-Harbinger有31個(gè)家族、hAT有44個(gè)家族、CMC有38個(gè)家族、
7、MuLE有39個(gè)家族、TcMar有1個(gè)家族、MITE有26個(gè)家族、Helitron有32個(gè)家族。
3、為方便研究者使用這部分轉(zhuǎn)座子信息,我們采用LAMP(Linux、 Apache、MySQL、PHP/Perl)技術(shù)構(gòu)建了桑樹轉(zhuǎn)座子數(shù)據(jù)庫(MnTEdb,http://morus.swu.edu.cn/mntedb/),該數(shù)據(jù)庫全面整合桑樹基因組中鑒定到的所有轉(zhuǎn)座子序列信息,除了為用戶提供信息瀏覽、查詢、下載等功能外,還整合了數(shù)
8、個(gè)可用于對(duì)轉(zhuǎn)座子序列進(jìn)行分析的工具,包括有BLAST、GetORF、HMMER、Sequence Extractor以及JBrowse等工具。與已有桑樹相關(guān)數(shù)據(jù)庫MorusDB相比而言,MnTEdb具有自己的特點(diǎn)及優(yōu)勢:該數(shù)據(jù)庫專注于桑樹轉(zhuǎn)座子信息,包含有桑樹中已鑒定到的全部轉(zhuǎn)座子信息:該數(shù)據(jù)庫還為轉(zhuǎn)座子的研究提供了多種分析工具:另外該數(shù)據(jù)庫將作為一個(gè)綜合數(shù)據(jù)庫,待后續(xù)??浦参锘蚪M測序完成之后,我們會(huì)進(jìn)一步將該物種的轉(zhuǎn)座子信息匯總到該
9、數(shù)據(jù)庫,為物種之間的比較分析提供可靠的數(shù)據(jù)來源。
二、桑樹轉(zhuǎn)座子的特征分析
1、對(duì)桑樹全基因組的轉(zhuǎn)座子進(jìn)行注釋,結(jié)果表明,共計(jì)有125.3 MB的序列可以注釋為轉(zhuǎn)座子相關(guān)序列,占川桑基因組的37.87%(125.3/330.79),其中以逆轉(zhuǎn)錄轉(zhuǎn)座子所占比例最高,達(dá)到了29.26%,逆轉(zhuǎn)錄轉(zhuǎn)座子中又以Copia、Gypsy和Lard所占比例最高,分別為10.44%、9.20%和8.59%。DNA轉(zhuǎn)座子只占到總基因組的
10、8.6%。這與眾多已測序物種中轉(zhuǎn)座子分布規(guī)律相似。
2、桑樹scaffold N50為390115 bp,我們選取大于scaffold N50的總計(jì)245個(gè)scaffolds進(jìn)行轉(zhuǎn)座子覆蓋度和基因覆蓋度相關(guān)性分析。結(jié)果表明,轉(zhuǎn)座子覆蓋度和基因覆蓋度呈負(fù)相關(guān)關(guān)系(r=-0.759,p<0.01)。進(jìn)一步選取245個(gè)scaffolds中代表性的30個(gè)scaffolds(10個(gè)TE-richscaffolds;10個(gè)Gene-ric
11、h scaffolds及10個(gè)TE和Gene覆蓋度相似的scaffolds),將每個(gè)scaffold以50kb做為一個(gè)窗口分割。對(duì)分割后的窗口上TE和基因的分布進(jìn)行分析,也得到了相同的結(jié)果。結(jié)合LTR逆轉(zhuǎn)錄轉(zhuǎn)座子比例為最高這個(gè)結(jié)果,最終認(rèn)為LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的分布對(duì)基因組所產(chǎn)生的影響最大。
3、進(jìn)一步對(duì)scaffold上的轉(zhuǎn)座子覆蓋度和有表達(dá)活性的基因比例進(jìn)行相關(guān)性分析,設(shè)定如果在川桑轉(zhuǎn)錄組測序的5個(gè)組織中至少一個(gè)組織里基因的
12、RPKM值大于1,則認(rèn)為該基因有表達(dá)活性,按此標(biāo)準(zhǔn)進(jìn)行分析發(fā)現(xiàn)245個(gè)scaffolds上有轉(zhuǎn)錄活性的基因占74.9%(11162/14909)。相關(guān)性分析結(jié)果同樣表明兩者之間呈現(xiàn)負(fù)相關(guān)關(guān)系(r=-0.556,p<0.01)。這些分析結(jié)果進(jìn)一步說明轉(zhuǎn)座子對(duì)其鄰近基因活性具有潛在的調(diào)節(jié)作用。
4、我們?cè)O(shè)定3個(gè)區(qū)域:基因內(nèi)部、基因上下游2kb區(qū)域以及基因上下游2-5 kb區(qū)域。對(duì)桑樹中轉(zhuǎn)座子在不同區(qū)間插入偏好性進(jìn)行分析,結(jié)果表明不
13、同類型轉(zhuǎn)座子在不同區(qū)間內(nèi)的插入偏好性不同。由于轉(zhuǎn)座子對(duì)鄰近基因的調(diào)節(jié)作用以及其可作為表觀沉默的靶標(biāo)從而調(diào)節(jié)鄰近基因,因此該偏好性分析結(jié)果具有重要意義。
5、通過對(duì)基因內(nèi)部以及基因上下游2kb區(qū)域內(nèi)存在轉(zhuǎn)座子的基因進(jìn)行注釋及Pathway分析,結(jié)果表明這些基因主要參與的生物過程有metabolic process(37.1%)、cellular process(29.6%)和single-organism process(10.
14、7%);分子功能則集中在binding(46.4%)和catalytic activity(39.8%);細(xì)胞組分主要位于cell(36.3%)、membrane(29.1%)、organelle(19.1%)和macromolecular complex(12.5%)。Pathway分析顯示這些基因參與到了至少有104個(gè)途徑當(dāng)中,該結(jié)果進(jìn)一步暗示了轉(zhuǎn)座子對(duì)物種基因組有重要作用。
三、逆轉(zhuǎn)錄轉(zhuǎn)座子逆轉(zhuǎn)錄酶(Reverse tr
15、anscriptase,RT)片段的克隆及特征分析
1、利用Copia和Gypsy的RT片段的簡并引物,從桑樹基因組中分別得到106個(gè)Copia RT片段克隆和101個(gè)Gypsy RT片段克隆。
2、對(duì)RT片段的序列特征分析,結(jié)果顯示Copia RT序列長度范圍從240 bp到278 bp,Gypsy RT序列長度范圍從408 bp到437bp; Copia RT和Gypsy RT均富含AT,AT/GC比例范圍分別為
16、1.16-1.58和1.43-1.55。Copia RT和Gypsy RT序列相似度范圍分別為0.419-0.992和0.535-0,997。該結(jié)果說明這些RT片段均呈現(xiàn)出高異質(zhì)性的特點(diǎn)。而且Copia的RT序列較之Gypsy RT序列的分化程度更高,序列相似度的分布范圍也更加分散。
3、Copia RT和Gypsy RT均存在隨機(jī)分布的提前終止和移碼突變等現(xiàn)象。Copia RT有53.8%的序列是完整序列,Gypsy RT則
17、有48.5%的序列為完整序列。進(jìn)一步分析氨基酸序列保守程度發(fā)現(xiàn),造成RT序列高異質(zhì)性的原因是由于其序列中存在的提前終止和移碼突變的隨機(jī)性分布現(xiàn)象。
4、通過選取公共數(shù)據(jù)庫中已有的RT序列與桑樹中RT序列進(jìn)行系統(tǒng)發(fā)生分析,結(jié)果表明無論Copia還是Gypsy來源的RT序列均出現(xiàn)進(jìn)化樹與物種的系統(tǒng)分類關(guān)系不一致的現(xiàn)象,這些結(jié)果暗示了LTR類逆轉(zhuǎn)錄轉(zhuǎn)座子可能在不同植物物種之間存在水平轉(zhuǎn)移現(xiàn)象。
5、對(duì)Copia RT和Gy
18、psy RT分別進(jìn)行選擇壓力分析,結(jié)果表明,兩者都受到了凈化選擇壓力。相對(duì)而言,Gypsy的RT序列比Copia的RT序列受到較為寬松的選擇約束。
6、利用熒光原位雜交(Fluorescence in situ hybridization,F(xiàn)ISH)技術(shù)對(duì)桑樹的Copia和Gypsy逆轉(zhuǎn)錄轉(zhuǎn)座子的染色體定位分析結(jié)果顯示,Copia和Gypsy除了大量分布在近著絲粒區(qū)域之外,也有少部分分布在染色體的近端粒區(qū)域。
四、L
19、TR的特征分析
1、在桑樹基因組中共計(jì)鑒定到584條tRNA序列,其中553條可以得到明確分類。結(jié)合構(gòu)建完成的tRNA庫,最終得到桑樹中全長的LTR類逆轉(zhuǎn)錄轉(zhuǎn)座子3892條,其中Copia1532,Gypsy1384,Lard722,Trim254,這些轉(zhuǎn)座子分別占到基因組的10.12%、9.07%、8.59%和10.61%。共計(jì)1728條序列形成了Nested形式,占總序列條數(shù)的44.4%(1728/2892)。
20、2、對(duì)tRNA使用偏好性分析發(fā)現(xiàn),不同超家族的PBS結(jié)合的tRNA具有偏好性,在基因組中含量最高的tRNA,在LTR的轉(zhuǎn)錄過程當(dāng)中使用頻率卻不是最高的。其中tRNAMet使用率最高,在Copia、Gypsy、Lard以及Trim中的使用率分別達(dá)到41.2%、28.0%、13.9%以及27.2%。
3、序列特征分析發(fā)現(xiàn),幾乎所有鑒定到的全長LTR均具有典型的TG-CA結(jié)構(gòu)特征。LTR逆轉(zhuǎn)錄轉(zhuǎn)座子序列的全長與該序列的LTR長度具有
21、正相關(guān)性(r=0.343,p<0.01),即更長的序列具有更長的LTR序列。對(duì)Nested LTR與LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的比較分析發(fā)現(xiàn),每個(gè)超家族內(nèi)的Nested LTR比例與該超家族序列的平均長度呈現(xiàn)強(qiáng)烈的正相關(guān)關(guān)系(r=0.963,p<0.01),認(rèn)為正是由于形成了Nested LTR的結(jié)構(gòu),從而導(dǎo)致該超家族序列長度變長。
4、對(duì)Copia和Gypsy的RT、INT序列進(jìn)行系統(tǒng)發(fā)生分析結(jié)果表明,單純依靠RT、INT序列的相似
22、性就能夠?qū)opia和Gypsy兩大類超家族區(qū)分開,而且基于RT的系統(tǒng)樹與基于INT的系統(tǒng)樹呈現(xiàn)相似的結(jié)構(gòu),該結(jié)果進(jìn)一步說明在Copia和Gypsy的進(jìn)化過程當(dāng)中經(jīng)歷過一次序列顛換,從而形成Copia和Gypsy。我們最終認(rèn)為是Copia在進(jìn)化過程當(dāng)中出現(xiàn)了序列內(nèi)部重組,導(dǎo)致了其RT和INT序列結(jié)構(gòu)域的顛換,顛換之后,Copia和Gypsy各自沿著自己的方向進(jìn)化。選取了已有分類的Copia和Gypsy主要枝系的代表序列與桑樹的Copia
23、和Gypsy的RT序列進(jìn)行系統(tǒng)發(fā)生分析,結(jié)果顯示桑樹當(dāng)中的序列均可以劃分到已有分枝,進(jìn)一步說明了已有的Copia和Gypsy的主要枝系在植物中是廣泛存在的。
5、我們選取Copia和Gypsy的RT序列進(jìn)行選擇壓力分析,結(jié)果表明兩者均受到較強(qiáng)的凈化選擇壓力,然而部分家族的序列dN/dS的比例大于1,該結(jié)果暗示了可能這些家族序列在基因組中出現(xiàn)了適應(yīng)性進(jìn)化。
6、對(duì)LTR逆轉(zhuǎn)錄轉(zhuǎn)座子插入時(shí)間分析發(fā)現(xiàn),Copia和Gyps
24、y的分布規(guī)律比較一致,均在最近的1百萬年到二百萬年間有一個(gè)爆發(fā)擴(kuò)增的現(xiàn)象,95%左右的轉(zhuǎn)座子均在最近的三百萬年內(nèi)插入到桑樹基因組中。Lard和Trim的插入時(shí)間分布則較為散亂,不過在最近的1-2百萬年內(nèi)同樣存在一個(gè)高峰,大多還是集中在最近的三百萬年內(nèi)插入到桑樹基因組中(Lard,77.1%;Trim,90.2%)。我們對(duì)半衰期的估計(jì)發(fā)現(xiàn),桑樹中LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的頻數(shù)分布不遵從負(fù)指數(shù)分布,該結(jié)果暗示了桑樹中的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子可能具有不
25、同于其他物種的進(jìn)化歷程,呈現(xiàn)出不規(guī)律的分布,該規(guī)律有待進(jìn)一步通過與其余物種的比較分析。Nested LTR逆轉(zhuǎn)錄轉(zhuǎn)座子插入桑樹基因組的時(shí)間是在一個(gè)比較分散的區(qū)間之內(nèi),通過分析不同時(shí)間區(qū)間內(nèi),NestedLTR和全長LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的分布平度發(fā)現(xiàn),兩者之間具有極強(qiáng)的正相關(guān)性(r=0.989,p<0.01)。最終結(jié)果表明在每個(gè)時(shí)間段,一個(gè)LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的新拷貝形成Nested轉(zhuǎn)座子的概率和重新插入基因組中新的獨(dú)立位置的概率幾乎一樣,不
26、存在偏好性。
7、分析有活性的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子拷貝數(shù)及表達(dá)情況,結(jié)果表明LTR逆轉(zhuǎn)錄轉(zhuǎn)座子有無活性與其在基因組上的拷貝數(shù)并沒有直接的關(guān)系。即有活性的轉(zhuǎn)座子有可能剛開始表現(xiàn)出活性,其在基因組上的拷貝數(shù)依然較少;或者已經(jīng)具有多拷貝數(shù)的轉(zhuǎn)座子已失去活性,只保留下了自身的一些拷貝。
8、全長 LTR逆轉(zhuǎn)錄轉(zhuǎn)座子中存在的Nested LTR之間存在一個(gè)有趣的現(xiàn)象。即Nested LTR數(shù)目占總?cè)LLTR逆轉(zhuǎn)錄轉(zhuǎn)座子數(shù)目的44
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基因組重測序作物的新轉(zhuǎn)座子鑒定及特征分析.pdf
- 家蠶SINE轉(zhuǎn)座子的全基因組鑒定及進(jìn)化分析.pdf
- 桑樹LINE反轉(zhuǎn)錄轉(zhuǎn)座子的特征及相關(guān)基因分析.pdf
- 鱗翅目昆蟲基因組中HITEs轉(zhuǎn)座子的鑒定、特征和進(jìn)化分析.pdf
- 基于基因組重測序的玉米溫?zé)釒ё越幌缔D(zhuǎn)座子特征分析.pdf
- 家蠶基因組中轉(zhuǎn)座子的水平轉(zhuǎn)移.pdf
- 全基因組中網(wǎng)絡(luò)缺失基因和微型轉(zhuǎn)座子的發(fā)現(xiàn)及研究.pdf
- 基于簡化基因組的地黃屬植物轉(zhuǎn)座子比較研究.pdf
- 毛竹PIF類轉(zhuǎn)座子的克隆與結(jié)構(gòu)分析以及MLE轉(zhuǎn)座子對(duì)毛竹基因組多態(tài)性的影響.pdf
- 毛竹MLE轉(zhuǎn)座子轉(zhuǎn)座活性的鑒定與分析.pdf
- 玉米基因組中SINE轉(zhuǎn)座子的發(fā)掘和特性研究.pdf
- 植物基因組LTR反轉(zhuǎn)錄轉(zhuǎn)座子注釋和比較研究.pdf
- 竹亞科轉(zhuǎn)座子的克隆及特征分析.pdf
- PB轉(zhuǎn)座子和To12轉(zhuǎn)座子介導(dǎo)基因長期表達(dá)的研究.pdf
- 基于轉(zhuǎn)座子聚集性的轉(zhuǎn)座子預(yù)測工具.pdf
- 15280.藻類基因組ltr逆轉(zhuǎn)座子發(fā)掘及海帶(saccharinajaponica)轉(zhuǎn)錄組分析研究
- 家蠶轉(zhuǎn)座子來源siRNA的鑒定與分析.pdf
- 基于高通量測序的石刁柏基因轉(zhuǎn)座子分析.pdf
- 組織培養(yǎng)誘發(fā)水稻基因組兩種內(nèi)源轉(zhuǎn)座子的激活.pdf
- 逆轉(zhuǎn)座子LINE-1調(diào)控靶基因的鑒定及機(jī)制研究.pdf
評(píng)論
0/150
提交評(píng)論