版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物化學(xué)與新生物技術(shù),,第一節(jié)基因組學(xué),一、基因組和基因組學(xué)的概念二、基因組圖譜三、人類基因組研究,一、基因組和基因組學(xué)的概念,基因組(genome )是指一個生物機(jī)體的一套完整的遺傳物質(zhì),即全套基因的總稱,包括決定蛋白質(zhì)和核酸結(jié)構(gòu)的編碼區(qū),以及并非直接決定蛋白質(zhì)和核酸結(jié)構(gòu)的非編碼區(qū)。自從1990 年啟動“人類基因組計劃”后,開展了對人類基因組結(jié)構(gòu)的研究,隨著該計劃的進(jìn)行,發(fā)展和建立了多種新的研究技術(shù),借助這些技術(shù),先后開展了對果蠅
2、、家鼠、線蟲、水稻、擬南芥、啤酒酵母等數(shù)十種動植物和微生物基因組結(jié)構(gòu)的研究,于是提出了基因組學(xué)(genomics)或基因組工程(genomic engineering )的概念,它包括研究基因組結(jié)構(gòu)的方法技術(shù)、各種基因組圖譜的建立等。,二、基因組圖譜,1 .基因組物理圖譜 2 .基因組遺傳圖譜3 .基因組表達(dá)圖譜 4 .單核苷酸多態(tài)性圖譜,1 .基因組物理圖譜,物理圖是從戰(zhàn)略的角度研究DNA 序列,它是以特異的DNA 序列為標(biāo)志的
3、染色休圖。標(biāo)志之間的距離以物理距離如堿基對(bp)、千堿基對(kb)等表示。最粗略的物理圖是染色體組型圖(即染色體的細(xì)胞學(xué)區(qū)帶圖),最精細(xì)的物理圖是核苷酸序列圖。,,物理圖譜包括序列標(biāo)記位點(diǎn)圖、限制酶圖、輻射雜種細(xì)胞圖等。① STS 圖譜序列標(biāo)記位點(diǎn)(sequence tagged sites , STS)圖譜是以堿基對為標(biāo)尺,以STS 為位標(biāo)所繪出的物理圖。STS 位標(biāo)是以單拷貝DNA 序列為基礎(chǔ)發(fā)展而來的一對PCR 引物,每個位標(biāo)
4、在基因組內(nèi)只有一個特定的位置。依據(jù)此序列設(shè)計的引物不僅具有DNA 位置特異性,而且具有PCR 方法測定的方便性。利用STS 位標(biāo)將眾多的YAC 克隆依照它們在染色體上的位置排列起來,構(gòu)建一個所謂克隆重疊(cotig) ,構(gòu)建大量的重疊群后,對YAC進(jìn)行DNA 測序,然后把結(jié)果串聯(lián)起來得到全染色體序列。,,② 限制酶圖譜由于DNA 限制性內(nèi)切酶都有特點(diǎn)的識別序列和切割位點(diǎn),因此如果用酶所識別的特異序列作為標(biāo)志在DNA 長鏈上作圖,對制定物
5、理圖譜也是很有用的。不同DNA 片段用限制酶切割后可產(chǎn)生多種不同的圖形,同一個克隆一定有相同的圖形,相重疊的克隆可依據(jù)其相同部分進(jìn)行重疊,是用作識別DNA 的可靠標(biāo)志。采用部分酶切法,一個酶切產(chǎn)物各DNA 片段的長度即表示一個識別位點(diǎn)的位置,可直接得到酶切圖譜。同一個YAC DNA 片段可以用幾種限制酶分別酶解,可以測定出各DNA 標(biāo)志所在的DNA 片段,從而測定出DNA 標(biāo)志間的相對距離。此法的優(yōu)點(diǎn)之一是YAC DNA 不必純化,提取
6、酵母總DNA 即可。,,③ 輻射雜種細(xì)胞圖譜射線可以造成染色體斷裂,當(dāng)用射線照射雜種細(xì)胞(含某一單個人染色體的中國倉鼠細(xì)胞)時,染色體被斷裂并隨后進(jìn)行了隨機(jī)連接,有可能得到許多染色體新組合細(xì)胞,篩選出那些只含有單一人染色體片段的倉鼠細(xì)胞組,可以得到含有全套人類染色體片段的細(xì)胞組群,每個細(xì)胞株分別含有人染色體片段,用特定的STS 可以識別特定的人類染色體片段,從而制作染色體物理圖譜。此方法的優(yōu)點(diǎn)是:可得到高分辨率的物理圖譜;既適用于多態(tài)性
7、DNA 標(biāo)志,也適用于非多態(tài)性標(biāo)志;由于使用的是PCR 技術(shù),因而方法簡單快捷。,,④ DNA 序列圖在制作染色體物理圖的基礎(chǔ)上,需進(jìn)一步制作DNA 序列圖,這是最精細(xì)的物理圖。制作序列圖必須進(jìn)行大量DNA 測序工作。現(xiàn)在DNA 測序工作大多是在Sange :雙脫氧鏈終止法和Maxam-Gilbert 化學(xué)修飾法的基礎(chǔ)上發(fā)展起來的DNA 大規(guī)模測序技術(shù),這種技術(shù)是將DNA 測序與計算機(jī)技術(shù)和熒光技術(shù)相結(jié)合,發(fā)明了自動測序儀。在測序過程中
8、,一般是將較長的DNA 片段打斷,構(gòu)建一系列隨機(jī)亞克降,然后通過自動測定每個亞克隆的序列,用計算機(jī)分析以發(fā)現(xiàn)重疊區(qū)域,最后完成對大片段的DNA 定序?,F(xiàn)在由于采用了STS 作為位標(biāo),分析序列的起始位點(diǎn),大大減少了對序列重疊部分的鑒定,提高了測定效率。,2 .基因組遺傳圖譜,遺傳圖是遺傳學(xué)上早就對染色體進(jìn)行研究的一種方法,遺傳圖上位標(biāo)的位置和相互之間的距離不是以堿基對等物理距離來表示,它沒有確切的物理距離,而是以連鎖或重組的方法來測定,以
9、遺傳單位來表示。在遺傳圖的制作中,旱先曾用多態(tài)性DNA 標(biāo)志,即限制酶片段長度多態(tài)性,后來發(fā)展為微衛(wèi)星DNA 標(biāo)志。,3 .基因組表達(dá)圖譜,基因表達(dá)圖或稱轉(zhuǎn)錄圖,所采用的染色體位標(biāo)是基因的轉(zhuǎn)錄產(chǎn)物,即mRNA 。但實(shí)際上應(yīng)用更多的是cDNA ,即以mRNA 為模板,用逆轉(zhuǎn)錄酶催化產(chǎn)生的互補(bǔ)DNA ,完全能夠反映基因的信息。機(jī)體的每一細(xì)胞、每一組織,在不同的發(fā)育階段,不同的生理?xiàng)l件和病理狀態(tài)下,其表達(dá)的基因種類及每一基因的表達(dá)程度都是各
10、不相同的。通過構(gòu)建處于某一特定狀態(tài)下的細(xì)胞或組織的cDNA 文庫,大規(guī)模cDNA 測序,收集cDNA 序列片段,定性定量分析其mRNA 群體組成,從而描繪該特定細(xì)胞或組織在特定狀態(tài)下的基因表達(dá)種類和表達(dá)程度,這樣編制成的數(shù)據(jù)表就稱為基因表達(dá)圖譜。這種圖譜從mRNA 水平反映了細(xì)胞或組織特異性表型和表達(dá)模式,即可反映基因的功能。,4 .單核苷酸多態(tài)性圖譜,在基因組中,DNA 分子上存在的單個堿基變化,包括缺失和插人,更多的是單個堿基的置換
11、,稱為單核昔酸多態(tài)性(single nucleotide polymorphism , SNP ) , SNP常引起基因功能的改變,即突變。DNA 中單個堿基的置換,包括轉(zhuǎn)換和顛換。轉(zhuǎn)換指一種嘌呤取代另一種嘌呤,或一種嘧啶取代另一種嘧啶;顛換則是嘌呤與嘧啶間的互換。在SNP 中轉(zhuǎn)換多于顛換,二者之比為2 : 1 。,三、人類基因組研究,基因組學(xué)是源于對人類基因組的研究并受其推動的。人類基因組計劃(HGP , human genome
12、project )是人類科學(xué)史上最偉大的壯舉之一,被譽(yù)為生命科學(xué)中的登月計劃。HGP 最初由美國科學(xué)家在20 世紀(jì)80 年代中期提出,美國于1990 年正式實(shí)施,計劃用15 年的時間完成人類基因組DNA 全部堿基對(約30 億)排列順序的測定,并在此基礎(chǔ)上進(jìn)行人類基因的定位和分離。繼后,1993 年又對HGP研究內(nèi)容進(jìn)行了修訂和補(bǔ)充,修訂后的內(nèi)容包括:人類基因組作圖及序列分析,基因的鑒定、基因組研究技術(shù)的建立和創(chuàng)新、模式生物基因組圖和測
13、定、信息系統(tǒng)的建立、儲存及相應(yīng)軟件的開發(fā)、相應(yīng)產(chǎn)業(yè)的開發(fā)等。在國際人類基因組組織的協(xié)調(diào)和統(tǒng)一下,開展國際合作,由美國、英國、法國、德國、日本和中國共6 個國家20 個工作小組的共同努力,于2000 年6 月26 日完成人類基因組框架,2003 年4 月14 日宣布人類基因組序列圖繪制成功。人類基因組核苷酸序列圖是分子水平上最高層次、最詳盡的物理圖譜。,第二節(jié)蛋白質(zhì)組學(xué),一、蛋白質(zhì)組學(xué)的涵義 二、蛋白質(zhì)組研究的技術(shù)簡介 三、蛋白質(zhì)組學(xué)
14、的應(yīng)用前景,一、蛋白質(zhì)組學(xué)的涵義,1 .蛋白質(zhì)組的定義 2 .蛋白質(zhì)組學(xué)的涵義,1 .蛋白質(zhì)組的定義,1995 年Wasinger VC 首次將蛋白質(zhì)組定義為:一個基因組編碼的全部蛋白質(zhì);1997 年Wilkins 和Wiliams 在有關(guān)蛋白質(zhì)組研究的第一部專著中將其定義為:一個基因組或組織所表達(dá)的全部蛋白質(zhì);1999 年《 Nature 》 雜志將蛋白質(zhì)組進(jìn)一步定義為:在一個細(xì)胞的整個生命過程中由基因組表達(dá)的以及表達(dá)后修飾的全部蛋
15、白質(zhì)。由此可見,蛋白質(zhì)組是包括一個細(xì)胞或組織或一個生物體的一個基因組在生命的全過程中所表達(dá)產(chǎn)生的所有蛋白質(zhì)。由于蛋白質(zhì)的種類和數(shù)量在新陳代謝中總是處于動態(tài)過程中,同一細(xì)胞在不同時期、不同生長條件(正常與異常)下,其所表達(dá)產(chǎn)生的蛋白質(zhì)是不相同的。因此,在蛋白質(zhì)組的研究中,對某種生物的蛋白質(zhì)組而言,必須標(biāo)明時期和條件,在什么情況下產(chǎn)生的,才能接近闡明在該條件下基因組的確切功能。,2 .蛋白質(zhì)組學(xué)的涵義,蛋白質(zhì)組學(xué)是在整體水平上研究細(xì)胞內(nèi)蛋白
16、質(zhì)組成、數(shù)量及其在不同生理?xiàng)l件下變化規(guī)律的學(xué)科。它主要研究細(xì)胞內(nèi)所有蛋白質(zhì)在生命活動過程中的時空表達(dá)、蛋白質(zhì)分子間的相互作用、翻譯后的各種修飾等。與傳統(tǒng)的針對單一蛋白質(zhì)進(jìn)行的研究相比,蛋白質(zhì)組學(xué)的研究不僅在研究手段上是全新的、大規(guī)模和高通量的,而且由于一個細(xì)胞蛋白質(zhì)的復(fù)雜性、多樣性和可變性,對其分析分離都要相對困難得多。,二、蛋白質(zhì)組研究的技術(shù)簡介,一個完整的蛋白質(zhì)組研究包括下列步驟:,二、蛋白質(zhì)組研究的技術(shù)簡介,1 .雙向電泳 2
17、.圖像數(shù)字化分析 3 .質(zhì)譜分析技術(shù) 4 .蛋白質(zhì)組數(shù)據(jù)庫的建立,1 .雙向電泳,① 樣品制備用于電泳前樣品需作一系列處理,包括蛋白質(zhì)的溶解、變性及還原,去除非蛋白質(zhì)雜質(zhì)等。在蛋白質(zhì)的溶解液中通常含有去極劑(尿素)和還原劑,以解除蛋白質(zhì)的二級結(jié)構(gòu),使蛋白質(zhì)的不同帶電狀態(tài)還原為單一帶電狀態(tài),這就可避免同一蛋白的多個構(gòu)象在等電聚焦時出現(xiàn)在不同的等電點(diǎn)位置。還原劑是破壞蛋白質(zhì)的二硫鍵,傳統(tǒng)用二硫蘇糖醇(DTT )或浮琉基乙醇,但這些試劑帶
18、電荷,可引起含二硫鍵多的蛋白丟失。因而現(xiàn)多采用不帶電荷的三正丁基麟(TBP )加上增溶劑― 硫脲,所制得樣品效果較好。,,② 雙向電泳第一相等電聚焦是利用不同蛋白質(zhì)等電點(diǎn)不同在人孔徑凝膠中將蛋白質(zhì)分離開。在傳統(tǒng)的等電聚焦電泳中是用小分子兩性電解質(zhì)載體在膠條上形成pH 梯度,當(dāng)?shù)鞍踪|(zhì)在電場下移動至與本身等電點(diǎn)相同的pH 值的位置時,就停止移動。由于蛋白質(zhì)帶電狀態(tài)取決于其二級結(jié)構(gòu),因此,要達(dá)到最好的分辨率,蛋白質(zhì)必須充分變性。傳統(tǒng)的用小分子
19、兩性電解質(zhì)載體所建立的pH 梯度是臨時性的,其穩(wěn)定性有限,而且機(jī)械性能也不好,易斷裂,每一次制膠的重復(fù)性難于控制。因此,在蛋白質(zhì)組研究中采用了一種新技術(shù)― 固相pH 梯度等電聚焦(IPG ) ,該技術(shù)是丙烯酰胺凝膠預(yù)聚合時共價引人酸堿緩沖基團(tuán),利用一種偏酸性丙烯酰胺緩沖液和一種偏堿性丙烯酰胺緩沖液根據(jù)所需pH 范圍按比例制得。這種膠具有機(jī)械性能好、重現(xiàn)性好、上樣量大等特點(diǎn),因而適于蛋白質(zhì)組研究用。,,第二相SDS-PAGE 是利用不同蛋
20、白質(zhì)相對分子質(zhì)量不同而進(jìn)行的分離。當(dāng)?shù)谝幌嚯娪就瓿珊笾璆 膠在SDS 平衡液中還原和烷基化,將蛋白質(zhì)由一相膠上轉(zhuǎn)移至一相膠上,然后進(jìn)行電泳。平衡液的主要作用是使第一相膠條上的蛋白質(zhì)變性。SDS (十二烷基磺酸鈉)是一種陰離子去污劑,在溶液中加人SDS ,使蛋白質(zhì)與SDS 的質(zhì)量比為1 : 1.4 時,蛋白質(zhì)分子帶過量的負(fù)電荷,此時各蛋白質(zhì)的遷移率與其相對分子質(zhì)量成正比。在平衡液中除含sDs 外,還必須加人尿素和還原劑,以破壞蛋白質(zhì)的高級
21、結(jié)構(gòu),烷化劑常用碘乙酰胺。,,③ 蛋白質(zhì)檢測電泳后膠上蛋白質(zhì)的檢測有多種方法,靈敏度和分辨率有一些差異。檢測某種蛋白質(zhì)是否存在時常用western 印跡,顯示蛋白質(zhì)全譜時多用銀染檢測。目前蛋白質(zhì)組研究常是兩種染色法相結(jié)合:經(jīng)銀染分析尋找有意義點(diǎn)后,再加大上樣量,用考馬斯亮藍(lán)染色,再作進(jìn)一步質(zhì)譜鑒定。,2 .圖像數(shù)字化分析,經(jīng)雙向電泳分離、染色后所得圖像需要經(jīng)過圖像掃描、計算機(jī)數(shù)字化處理,確定每個蛋白質(zhì)點(diǎn)的等電點(diǎn)和相對分子質(zhì)量,對蛋白質(zhì)作
22、出初步鑒定。這一套圖像處理系統(tǒng)已有現(xiàn)存的軟件,經(jīng)過分析鑒定,即可建立蛋白質(zhì)組數(shù)據(jù)庫。由于Internet 網(wǎng)上數(shù)據(jù)庫的構(gòu)建,不同實(shí)驗(yàn)室的研究結(jié)果可做對比研究,有的雙向電泳分析軟件可以設(shè)定直接進(jìn)人聯(lián)合電泳數(shù)據(jù)庫。,3 .質(zhì)譜分析技術(shù),質(zhì)譜技術(shù)是樣品分子經(jīng)離子化后,根據(jù)不同離子間質(zhì)荷比(m/z )的差異來分離并鑒定相對分子質(zhì)量。應(yīng)用于蛋白質(zhì)組研究的質(zhì)譜技術(shù),因?yàn)殍b定分析的是蛋白質(zhì)大分子,因而在離子化力法上主要采用了所謂“軟電離”的力法,即樣
23、品分子電離時,保留整個分子的完整性,不會形成碎片離子。常用的有兩種方法:電噴霧離子化(ESI )和基質(zhì)輔助的激光解離子化(MALDI )。根據(jù)這兩種離子化技術(shù)設(shè)計的兩類質(zhì)譜儀在實(shí)際應(yīng)用中各有特點(diǎn),效果上各有千秋,應(yīng)用范圍上各有側(cè)重,難以互相取代,可以互相補(bǔ)充。,4 .蛋白質(zhì)組數(shù)據(jù)庫的建立,經(jīng)過雙向電泳、質(zhì)譜分析等得到一系列圖譜和數(shù)據(jù)等大量信息后,最后必須建立蛋白質(zhì)組數(shù)據(jù)庫。目前應(yīng)用最多的蛋白質(zhì)組數(shù)據(jù)庫包括蛋白序列數(shù)據(jù)庫(如SWISS-P
24、ROT , TrEMBL)、蛋白模式數(shù)據(jù)庫(Prosite)、蛋白雙向電泳圖譜數(shù)據(jù)庫、質(zhì)譜數(shù)據(jù)庫、蛋白三維結(jié)構(gòu)數(shù)據(jù)庫(PDB , FSSP )、蛋白質(zhì)翻譯后修飾蛋白庫(O-GLYCBASE )、基因序列數(shù)據(jù)庫( Genbank , EMBL )、基因組數(shù)據(jù)庫(GOB , OMIM )、代謝數(shù)據(jù)庫(ENZYME )等。,三、蛋白質(zhì)組學(xué)的應(yīng)用前景,蛋白質(zhì)組學(xué)最初是對應(yīng)于基因組學(xué)而提出來的,針對一個基因組所表達(dá)的全部蛋白質(zhì)為研究對象,逐步衍生
25、出針對某此與特定生物學(xué)機(jī)理相關(guān)聯(lián)的蛋白質(zhì)組群的研究。例如,比較不同生長時期蛋白質(zhì)組的差異,正常細(xì)胞與異常細(xì)胞蛋白質(zhì)組的差異,細(xì)胞在用藥和不用藥的情況下蛋白質(zhì)組的差異等,這稱為比較蛋白質(zhì)組學(xué)或功能蛋白質(zhì)組學(xué)。研究正常與疾病狀態(tài)下某一組織的蛋白質(zhì)組,稱為疾病蛋白質(zhì)組學(xué),已進(jìn)行了多項(xiàng)研究。如發(fā)現(xiàn)Calgranlin B 僅在腫瘤組織中表達(dá);通過心肥大細(xì)胞與正常細(xì)胞比較,發(fā)現(xiàn)一些蛋白質(zhì)在這兩種細(xì)胞中表達(dá)量有差異;在進(jìn)行性老年癡呆癥患者的腦組織中
26、,發(fā)現(xiàn)與神經(jīng)發(fā)育有關(guān)的蛋白質(zhì)snap25 的表達(dá)量降低。,第三節(jié)生物信息學(xué),一、生物信息學(xué)的涵義二、生物信息學(xué)的基本研究方法 三、生物信息學(xué)的主要研究內(nèi)容,一、生物信息學(xué)的涵義,人類基因組計劃的完成,后基因組計劃及蛋白質(zhì)組計劃的實(shí)施,出現(xiàn)和積累了與日俱增的信息,生命科學(xué)將全面進(jìn)人信息提取和數(shù)據(jù)處理的全新階段。早在20 世紀(jì)80 年代末,在美國工作的馬來西亞華人林華安博士就認(rèn)識到將計算機(jī)科學(xué)與生物學(xué)結(jié)合起來的重要意義,并首次提出了“生
27、物信息學(xué)(bioinformatics ) ”的概念,并因此而獲得“生物信息學(xué)之父”的美譽(yù)。,二、生物信息學(xué)的基本研究方法,1 .生物學(xué)數(shù)據(jù)庫的建立生物學(xué)數(shù)據(jù)庫的建立一般由專門的機(jī)構(gòu)來完成。這些機(jī)構(gòu)包括一些國家支持的非盈利性機(jī)構(gòu)和一些知名大學(xué)的研究機(jī)構(gòu)。有的實(shí)驗(yàn)室為了研究工作的需要也可建立一些小型的數(shù)據(jù)庫。數(shù)據(jù)庫可分為一級數(shù)據(jù)庫和二級數(shù)據(jù)庫,一級數(shù)據(jù)庫的數(shù)據(jù)直接來源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和分析;二級數(shù)據(jù)庫是在一級數(shù)
28、據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定目標(biāo)而建立的。目前,世界著名的三人核心數(shù)據(jù)庫是PDB 生物大分子結(jié)構(gòu)數(shù)據(jù)庫、SWISS-PROT 蛋白質(zhì)序列數(shù)據(jù)庫和GenBank 核酸序列數(shù)據(jù)庫。,,2 .?dāng)?shù)據(jù)的檢索在研究中根據(jù)不同的實(shí)際需要,檢索不同的數(shù)據(jù)庫。如查找DNA 序列即選擇核酸序列數(shù)據(jù)庫,查找蛋白質(zhì)序列則選擇蛋白質(zhì)序列數(shù)據(jù)庫等。生物學(xué)數(shù)據(jù)庫的檢索包括收集和篩選兩個方面,根據(jù)研究者的實(shí)際需要而加以應(yīng)用。3 .?dāng)?shù)據(jù)的處理無論是實(shí)驗(yàn)
29、中產(chǎn)生的數(shù)據(jù),還是在數(shù)據(jù)檢索中查得的數(shù)據(jù)都要經(jīng)過處理,一般先是對數(shù)據(jù)進(jìn)行格式編輯,然后對大量的數(shù)據(jù)進(jìn)行分類和整理。為了使用的方便,根據(jù)需要也可建立一個自己的小型數(shù)據(jù)庫,以便于使用。,,4 .?dāng)?shù)據(jù)的利用對生物學(xué)數(shù)據(jù)的利用就是使用各種統(tǒng)計模型和算法,以便對數(shù)據(jù)進(jìn)行分析。如核酸和蛋白質(zhì)序列相似性比對分析、蛋白質(zhì)空間結(jié)構(gòu)比對分析、不同發(fā)育階段比對分析,正常與異常比對分析、生物進(jìn)化分析等。從這些分析研究中得出結(jié)果、疑問,為下一步研究提供參數(shù)等。
30、,三、生物信息學(xué)的主要研究內(nèi)容,1 .基因組測序的信息分析 2 .用于發(fā)現(xiàn)新基因3 .非編碼區(qū)結(jié)構(gòu)與功能研究4 .生物進(jìn)化的研究5 .比較基因組學(xué)研究 6 .基因功能的研究 7 .大分子結(jié)構(gòu)模擬與藥物設(shè)計 8 .遺傳疾病的研究,1 .基因組測序的信息分析,無論人或模式生物的基因組研究,都涉及大規(guī)模的測序,它的每一步都與信息分析緊密相關(guān)。在對一個基因組的測序中,首先必須將基因組打碎,再對每一個小片段測序,然后把它們重新拼接起
31、來。如果將這些片段拼接成完整的DNA 序列是測序研究中的一個難點(diǎn),尤其是重復(fù)序列,在人基因組中有大約30 %的重復(fù)序列,這就更增加了難度。在這種情況下借助生物信息學(xué)就顯得更重要了。生物信息學(xué)提供了自動而高速地拼接序列的算法,根據(jù)數(shù)據(jù)庫和相關(guān)軟件提供的信息進(jìn)行計算即可得出結(jié)果。不過,這個工作需要高性能計算機(jī)的大規(guī)模并行運(yùn)算,因此,實(shí)際上只有一些測序中心擁有這種計算能力。,2 .用于發(fā)現(xiàn)新基因,在基因組研究中,大部分新基因是靠理論方法預(yù)測出
32、來的。例如釀酒酵母完整基因組(約1300 萬堿基對)所包含的6000 多個基因,大約60 %是通過信息分析得到的。用理論方法預(yù)測基因使用的序列數(shù)據(jù)主要來自EST 序列數(shù)據(jù)庫和基因組測序數(shù)據(jù)庫。目前,用生物信息學(xué)尋找新基因的方法有以下兩種。① 通過計算分析,從表達(dá)序列標(biāo)志(EST )序列庫中拼接得到完整的新基因編碼區(qū)。由于ESf 是隨機(jī)產(chǎn)生的,所以屬于同一基因的很多EST序列間必然有大量重復(fù)小片段,利用這些小片段作為標(biāo)志,就可以把不同的E
33、ST 序列連起來,直到獲得全長基因。② 通過計算機(jī)分析,從基因組DNA 序列中確定新編碼區(qū)。這主要是根據(jù)編碼區(qū)與非編碼區(qū)的特點(diǎn),將二者進(jìn)行區(qū)別而鑒定新基因。有兩種方法,一種是基于編碼區(qū)所具有的獨(dú)特信號,如起始密碼子、終止密碼子等;另一種是基于編碼區(qū)的堿基組成與非編碼區(qū)的差異?,F(xiàn)已有許多有效算法和軟件用于識別編碼區(qū)。,3 .非編碼區(qū)結(jié)構(gòu)與功能研究,從高等和低等生物的基因組比較發(fā)現(xiàn),從生物進(jìn)化、生物體功能的完善和復(fù)雜化,基因組的非編碼序列明
34、顯增加的趨勢提示,這部分序列必定有重要的生物功能。在細(xì)菌中非編碼區(qū)序列占整個基因組序列的10 -20 % ,而人的基因組中約占95 -97 %。至今已知,這些序列包括內(nèi)含子、衛(wèi)星DNA 、小衛(wèi)星DNA 、微衛(wèi)星DNA 、短散布重復(fù)兀件(short in - terspersed elements , SINE )、長散布重復(fù)元件(long interspersed elements , LINE )、偽基因(pseudogenes )等
35、。如果把不同成分的序列分別搜集起來,建立專門的數(shù)據(jù)庫,對于了解非編碼區(qū)的功能將是十分有用的。,4 .生物進(jìn)化的研究,由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種的發(fā)育和生理,因此,不同物種的基因組總是存在差異,用生物信息學(xué)研究比較不同物種的核酸和蛋白質(zhì)的序列差異,在一定程度上可反映物種的進(jìn)化?;诖?,當(dāng)前生物進(jìn)化在分子水平的研究(稱為分子進(jìn)化)已建立了一套依賴于核酸和蛋白質(zhì)序列信息的理論方法,包括序列相似比較、序列同源性分析
36、、構(gòu)建系統(tǒng)進(jìn)化樹和穩(wěn)定性檢測等。在生物進(jìn)化的研究中,相似性(similarity ) 和同源性(homology )是兩個不同的概念。相似性只反映兩類類似,并不包含任何與進(jìn)化相關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。相似性研究是將待研究序列與DNA 序列庫或蛋白質(zhì)序列庫比較,用于確定該序列的生物種屬,用的力法是兩兩序列比較算法;同源性研究是將待研究序列加入到一組與之同源,但來自不同物種的序列中進(jìn)行多序列同時比較,以確定該序列與其他序
37、列間的同源性大小。,5 .比較基因組學(xué)研究,隨著基因組序列研究的廣泛開展,各種生物的完整基因組數(shù)據(jù)越來越多,生物信息學(xué)的研究不僅對單個基因,而且可以對不同生物的全基因組進(jìn)行比較分析,可能從遺傳本質(zhì)上解釋一些重大生物學(xué)問題。如生命是如何起源的,生命是怎樣進(jìn)化的,遺傳密碼是如何起源的,最小獨(dú)立生活的生物體至少需要多少基因等。只有通過在基因組水平上的比較分析才能解答這一系列重人問題。鼠和人的基因組人小相似,都含有約30 億堿基對,基因的數(shù)目也
38、類似,而且大部分同源。但人和鼠差異是如此之大,為什么?通過比較基因組學(xué)研究發(fā)現(xiàn),盡管兩者基因組大小和基因數(shù)目類似,但基因組的組織卻差別很大。例如存在于鼠1 號染色體的基因卻分布在人的7 個染色體上。不同人種間基因組的差別僅為0.1 % ,人與猿間的差別約為1%。但表型上的差異卻十分顯著。因此,表型差異不僅應(yīng)從基因、DNA 序列方面找原因,看來更應(yīng)當(dāng)考慮它們在基因組上的差異。此外,科學(xué)家通過幾個完整基因組的比較研究,統(tǒng)計出維持生命活動所需
39、要的最少基因的個數(shù)為250 個左右,并且從對多種細(xì)菌核糖體蛋白基因研究發(fā)現(xiàn),這種蛋白基因序列的差異能反映出物種間的親緣關(guān)系,親緣關(guān)系越近,基因排列順序越接近。,6 .基因功能的研究,通過基因組計劃,科研人員知道了基因,知道了核昔酸序列,但卻并不知道它們是如何發(fā)揮功能的?;蛟谑裁辞闆r下和什么時間表達(dá),表達(dá)產(chǎn)物的濃度是多少;是否存在翻譯后修飾,若存在是如何修飾的。這些研究內(nèi)容屬于后基因組計劃的范疇,在這個計劃執(zhí)行中必定又產(chǎn)生大量的生物信息
40、,必然應(yīng)用生物信息學(xué)的理論和規(guī)律來處理,才能了解某些基因的功能。實(shí)驗(yàn)表明,在不同組織中表達(dá)基因的數(shù)目差別很大,腦中表達(dá)基因的數(shù)目最多,可達(dá)3 萬左右,有的組織中只有幾十或幾百個基因表達(dá);同一組織在不同的個體生長發(fā)育階段表達(dá)基因的種類、數(shù)量也不相同,有些基因在幼年時期表達(dá),有些在中年階段表達(dá),有的則在老年階段才表達(dá);同一組織在不同環(huán)境條件下基囚表達(dá)的種類和數(shù)量也有很大差異。所有這些內(nèi)容除了基因組學(xué)研究外,還需要蛋白質(zhì)組學(xué)、生物芯片等方面的
41、研究,最后由生物信息學(xué)的研究來加以解決,甚至可以預(yù)測基因的功能。,7 .大分子結(jié)構(gòu)模擬與藥物設(shè)計,由序列測定和序列數(shù)據(jù)庫知道氨基酸的序列對了解蛋白質(zhì)的功能是不夠的,還必須知道它們的三維結(jié)構(gòu),因?yàn)椤皹?gòu)象決定功能”。目前雖有x 射線衍射、多維核磁共振、二維電子衍射和三維圖像重構(gòu)等技術(shù)為蛋白質(zhì)空間結(jié)構(gòu)研究提供了有效手段,但這些方法仍存在一定的局限性,現(xiàn)在還不能估計究竟有多少蛋白質(zhì)最終仍不能由實(shí)驗(yàn)測定。此時,理論模擬與結(jié)構(gòu)預(yù)測就顯得十分重要了。
42、理論研究不僅可提供生物大分子空間結(jié)構(gòu)的信息,而且還能夠提供電子結(jié)構(gòu)的信息,如能級、表面電荷分布、分子軌道相互作用以及動力學(xué)行為等的信息。如生物化學(xué)反應(yīng)中的能量變化、電荷遷移、構(gòu)象變化等,這是難以直接用實(shí)驗(yàn)手段加以研究的。,8 .遺傳疾病的研究,據(jù)估計,約有6000 種以上的人類疾患與人類各種基因的變化相關(guān)聯(lián),尋找各種疾病的相關(guān)基因及其相互作用與致病的關(guān)系,是分子生物學(xué)特別是醫(yī)學(xué)分子生物學(xué)的重大課題之一。隨著人類基因組計劃研究的深人,在了
43、解了人類全部基因在染色體上的位置、它們的序列特征以及它們表達(dá)產(chǎn)物的特征以后,就可以有效地判斷各種疾病的分子機(jī)制,進(jìn)而發(fā)展合適的診斷和治療手段。在這方面生物信息學(xué)有兩項(xiàng)工作要做:一是構(gòu)建與疾病相關(guān)的人類基因信息數(shù)據(jù)庫(包括SNP 數(shù)據(jù)庫);二是發(fā)展有效地分析基因分型數(shù)據(jù)的生物信息學(xué)算法,特別是將SNP 數(shù)據(jù)與疾病和致病因素相關(guān)的計算方法。,第四節(jié)生物芯片,一、生物芯片的類別和特點(diǎn) 二、生物芯片技術(shù)簡介 三、生物芯片的應(yīng)用,一、生物芯片
44、的類別和特點(diǎn),1 .生物芯片的類別 2 .生物芯片的特點(diǎn),1 .生物芯片的類別,生物芯片的概念來自計算機(jī)芯片。實(shí)際上是一種微型多參數(shù)生物傳感器。它通過微電子、微加工技術(shù)在芯片表面構(gòu)建的一種微型生物化學(xué)反應(yīng)系統(tǒng),即在一個微小的基片表面固定大量的分子識別探針或構(gòu)建微分析元件和系統(tǒng),實(shí)現(xiàn)對核酸、蛋白質(zhì)(酶)等細(xì)胞組分實(shí)行準(zhǔn)確、快速、大通量的篩選、分析或檢測,以實(shí)現(xiàn)測序、定向反應(yīng)、功能分析等。由于最初的生物芯片主要目的是用于DNA 序列測定、
45、基因表達(dá)譜鑒定和突變基因的檢測和分析,所以又將它稱為DNA 芯片或基因芯片。它是將許多特定的DNA 寡核苷酸(如SNP )或DNA 片段(稱為探針)固定在芯片的每個預(yù)先設(shè)置的區(qū)域內(nèi),將待測樣本標(biāo)記后同芯片進(jìn)行雜交,利用堿基互補(bǔ)配對原理進(jìn)行雜交,通過檢測雜交信號并進(jìn)行計算機(jī)分析,從而檢測與探針對應(yīng)片段是否存在和存在量的多少,以用于基因組研究、基因功能研究、疾病的臨床診斷和檢測等。,2 .生物芯片的特點(diǎn),生物芯片,尤其是現(xiàn)在用得最多的基因芯
46、片,在對生物分子及其功能的檢測、鑒定和分析中,與其他的基因或蛋白質(zhì)檢測技術(shù)相比,具有微型化、自動化、網(wǎng)絡(luò)化等特點(diǎn),它能同時定性、定量地檢測成千上萬的生物信息。所謂微型化,指的是它不僅所用樣品量?。總€點(diǎn)只需1nL ) ,而且成千上萬種探針分子僅僅點(diǎn)在幾平方厘米的介質(zhì)上,可以實(shí)現(xiàn)許多生物信息分析的并行化、多樣化;所謂自動化,是指測定分析的全過程,包括點(diǎn)樣、雜交、圖像處理和數(shù)據(jù)處理都可用計算機(jī)已知程序的自動化系統(tǒng)和半自動化系統(tǒng)完成,使整個過
47、程具有高效率;所謂網(wǎng)絡(luò)化,是指點(diǎn)樣、數(shù)據(jù)處理等步驟都需要利用Internet 網(wǎng)上龐大的生物信息庫,這樣既可以利用現(xiàn)存資源,又可提高分析鑒定的準(zhǔn)確度。,二、生物芯片技術(shù)簡介,1 .芯片制作2 .樣品準(zhǔn)備 3 .分子雜交 4 .檢測分析,1 .芯片制作,( 1 )載體材料用于連接、吸附或包埋各種生物分子使其以水不溶性狀行使功能的固相材料稱為載體。所用材料分為實(shí)性材料和膜性材料兩類。實(shí)性材料有硅片、玻片、瓷片等。膜性材料有聚丙烯膜、尼
48、龍膜、硝酸纖維素膜等。載體材料必須符合下列要求:① 載體表面必須具有可以進(jìn)行化學(xué)反應(yīng)的活性基囚,以便與生物分子進(jìn)行偶聯(lián);② 單位載體上結(jié)合的生物分子能達(dá)到最佳容量;③ 載體應(yīng)具化學(xué)惰性(不干擾生物分子的吸附)和穩(wěn)定性(不受酸、堿及機(jī)械力的影響);④ 載體具有良好的生物兼容性。,,( 2 )載體活化及芯片制作方法載體必須進(jìn)行預(yù)處理、即活化,使其表面帶上羥基、氨基等活性基團(tuán),這些基團(tuán)先用光敏材料的光敏保護(hù)基團(tuán)形成共價交聯(lián)而被保護(hù)起來;在連接
49、寡核酸探針時,用光照除去光敏保護(hù)基團(tuán),這時活性基團(tuán)即可與核苷酸發(fā)生反應(yīng)。膜性材料上通常包被氨基硅烷或多聚賴氨酸,使其帶上正電荷,以便與帶負(fù)電荷的DNA 探針結(jié)合。,2 .樣品準(zhǔn)備,制作生物芯片作為探針的樣品需經(jīng)過分離純化、擴(kuò)增和標(biāo)記等過程。用常規(guī)方法制備DNA 或mRNA 。用作探針的寡聚核昔酸一般采用傳統(tǒng)的DNA 合成方法(用DNA 合成儀),其末端需要進(jìn)行修飾,目前普遍是在5 ’端用氨基修飾。DNA 的合成用一般PCR 有一定局限
50、,現(xiàn)發(fā)展了一種固相PCR 系統(tǒng)可用于作為探針的DNA 合成。在芯片技術(shù)中因?yàn)闃悠酚昧勘仨氉銐颍绻胢RNA 作探針常難以滿足,因此使用cDNA 。目前主要采用兩種方法來解決mRNA 量的問題:一種是利用PCR 技術(shù)建立單細(xì)胞cDNA 文庫;另一種方法是聯(lián)合應(yīng)用。DNA 合成和模板指導(dǎo)下的體外轉(zhuǎn)錄反應(yīng)完成多重線性擴(kuò)增。,3 .分子雜交,樣品經(jīng)擴(kuò)增、標(biāo)記后即可與芯片上的DNA 探針進(jìn)行雜交。芯片上的雜交與常規(guī)經(jīng)典的分子雜交有所不同:常規(guī)經(jīng)
51、典的分子雜交是將待測樣品固定在濾膜上,與帶標(biāo)記的探針在一定雜交液中雜交,所需時間較長(4-24h ) ,每次只能檢測一個或幾個探針;基因芯片雜交則是將探針固定于載體表面上,將待測的帶標(biāo)記樣品與之雜交,由于基片上固定有各種各樣的探針,囚此一次可以檢測成百上千的樣品,雜交的時間較短,一般在30min 內(nèi)完成。,4 .檢測分析,最后一個步驟就是檢測分析,基本上就是進(jìn)行圖像處理和數(shù)據(jù)處理。待測樣品與芯片上探針陣列雜交后,結(jié)合在芯片的特定位置上,
52、未雜交的分子被除去。一般采用熒光雙標(biāo)記(例如探針用Cy3標(biāo)記,待測樣品用Cy5 標(biāo)記),這樣,在激光的激發(fā)下,二者均發(fā)射熒光。樣品與探針完全雜交的所發(fā)熒光最強(qiáng),不完全雜交的熒光信號較弱,完全不能雜交的則只能檢測到探針?biāo)l(fā)射的熒光。所發(fā)熒光強(qiáng)度與樣品中靶DNA 分子的含量有一定線性關(guān)系。,三、生物芯片的應(yīng)用,1 . DNA 序列測定2 .基因表達(dá)分析 3 .用于突變和多態(tài)分析檢測 4 .在疾病診斷中的應(yīng)用 5 .在藥物研究中的應(yīng)用
53、 6 .在微生物菌種鑒定及致病機(jī)制中的應(yīng)用7 .在農(nóng)林中的應(yīng)用,1 . DNA 序列測定,基因芯片技術(shù)通過大量固定化的探針與待測樣品DNA 進(jìn)行分子雜交,產(chǎn)生雜交圖譜,由雜交圖譜即可測定樣品的DNA 序列,這種測序方法稱為雜交測序(sequencing by hybyi dization , SBH )。一個含八核苷酸的探針(有48 = 65536 個陣列)可用于測定約200 個核苷酸的序列;含106 個十二核苷酸的陣列可以測定約1
54、000 個堿基的序列。將所得強(qiáng)光信號系統(tǒng)的序列進(jìn)行重疊排列,即可測得順序。例如,一個12 核苷酸的待測序列與原位合成的八核苷酸陣列上65536 個探針雜交后,發(fā)出最強(qiáng)熒光信號的有5 個探針:GcATGACT 、GACTGGAT 、TGACTGGA 、GATGACTG 和ATGACTGG ,將它們重疊排列:即得出待測DNA 的互補(bǔ)序列為:GCATGACTGGAT ,則待測樣品的DNA 序列為:CGTACTGACCTA 。,2
55、.基因表達(dá)分析,基因芯片對大規(guī)模的基因表達(dá)譜的分析是十分方便的。因?yàn)樗娜萘看蟆⒕_度好、靈敏度高、快速高效,用于對來源于不同個體、不同組織、不同細(xì)胞周期、不同發(fā)育階段、不同分化階段、不同病變、不同刺激下的細(xì)胞內(nèi)mRNA 或逆轉(zhuǎn)錄后產(chǎn)生的cDNA 進(jìn)行檢測,從而對基因表達(dá)的個體特異性、組織特異性、發(fā)育分化階段特異性、病變特異性、刺激特異性等進(jìn)行綜合分析和判斷,可以研究基因的功能,以及基因與基因間的相互關(guān)系。這與常規(guī)測定方法一次只能檢測一
56、個或少數(shù)幾個基因相比,可大大提高效率。目前的研究水平,一張芯片上可同時檢測幾萬個基因,也就是說人的全部基因可在一張芯片上進(jìn)行檢測分析,通過比較各種基因在特定條件下是否表達(dá)及其表達(dá)量,從中找出基因間的細(xì)微差異。,3 .用于突變和多態(tài)分析檢測,在標(biāo)記的樣品DNA 與芯片上固定的寡核昔酸探針雜交過程中,當(dāng)探針與樣品DNA 有小至一個堿基的差異時,其Tm 值的改變影響雜交結(jié)果的熒光信號值,從而可以根據(jù)信號來判斷待測樣品和芯片上哪個片段完全配對,
57、哪個片段上有堿基取代,從而得出待測DNA 序列上特定位點(diǎn)的堿基組成,以便對突變和多態(tài)性進(jìn)行分析研究。,4 .在疾病診斷中的應(yīng)用,用于感染性疾病診斷時,是將待測病原體的特征基因片段或病原體的特征寡核昔酸固定于芯片上,將從病人血清中抽提出的病原體DNA 或RNA 經(jīng)擴(kuò)增標(biāo)記熒光后與芯片進(jìn)行雜交,雜交信號掃描儀掃描,再經(jīng)計算機(jī)分析,判斷陰性或陽性。在遺傳性疾病的診斷中,由于人類基因組計劃和后基因組計劃的開展,越來越多的遺傳病相關(guān)基因被揭示出
58、來,而且由于突變檢測技術(shù)得到快速發(fā)展,已經(jīng)成為對多種遺傳病進(jìn)行診斷的常規(guī)手段。例如,已用芯片技術(shù)對血友病、地中海貧血、異常血紅蛋白病、苯丙酮尿癥等遺傳性疾病進(jìn)行了研究,并取得了可喜的成果。,5 .在藥物研究中的應(yīng)用,生物芯片用于藥物研究,目前主要在兩個方面:新藥篩選和指導(dǎo)臨床合理用藥。在新藥的篩選中,關(guān)鍵問題是低耗、高效地篩選出新藥或先導(dǎo)化合物,以便縮短新藥發(fā)現(xiàn)的過程。篩選的方法一般有兩種模式:一種是直接檢測化合物對生物在分子(如酶、抗
59、體、受體、離子通道等)的結(jié)合及作用;另一種是檢測化合物作用于細(xì)胞后(特別是mRNA )的變化。這兩種模式均涉及靶標(biāo)和篩選方法的選擇。在這方面基因芯片作為一種集成化的分析手段正好發(fā)揮它的作用?;蛐酒梢詮募膊〖八幬飪蓚€角度對人體的參量同時進(jìn)行研究以發(fā)掘篩選疾病相關(guān)分子。在這種情況下,任何一元化的分析方法均不及生物芯片這種集成化的分析手段更具有優(yōu)勢。基因芯片進(jìn)行藥物篩選就是通過用藥前后表達(dá)譜的變化找出靶基因及受靶基因調(diào)控的基因是否恢復(fù)到正
60、常狀態(tài),并研究是否影響其他基因的表達(dá)而帶來毒副作用。,6 .在微生物菌種鑒定及致病機(jī)制中的應(yīng)用,在基因芯片上篩選測定病原微生物的毒力基因、耐藥性基因和致病因子基因等??蓪ζ渚N和流行病學(xué)研究。比如,在研究感染病毒基因組中,分析感染病毒的多態(tài)性,了解病毒致病基因和致病機(jī)理,分析藥物作用下病毒基因表達(dá)情況,了解藥物作用機(jī)制與基因功能。還可用于監(jiān)測感染宿主基因表達(dá)改變,研究病原微生物致病機(jī)制,進(jìn)行細(xì)菌基因分型與菌種鑒定,篩選監(jiān)測細(xì)菌耐藥性基因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第17章 肝生物化學(xué)
- 生物化學(xué) 第11章 核酸的生物合成
- 第7章 生物化學(xué)習(xí)題
- 生物化學(xué)第章維生素與輔酶
- 生物化學(xué)技術(shù)與實(shí)驗(yàn)
- 生物化學(xué)13章習(xí)題
- 生物化學(xué)
- 《生物化學(xué)》
- 生物化學(xué)重點(diǎn)總結(jié)(15頁)
- 臨床生物化學(xué)和生物化學(xué)檢驗(yàn)試題
- 生物化學(xué)b第作業(yè)
- 生物化學(xué) 第12章 蛋白質(zhì)的生物合成
- 生物化學(xué)`
- 生物化學(xué)
- 《生物化學(xué)與生物物理進(jìn)展》
- 生物化學(xué)試題及答案15
- 【生物化學(xué)】第07章氨基酸代謝(改)
- 生物化學(xué)作業(yè)
- 生物化學(xué)筆記
- 生物化學(xué)歌訣
評論
0/150
提交評論