版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、藥物發(fā)現(xiàn)的虛擬篩選方法,第一節(jié) 概述,計算機模擬與化學合成、生物測試的結合構成了后基因組時代新藥研究的新策略。從已有的化合物,包括合成化合物和天然產(chǎn)物中尋找藥物或先導化合物,是藥物發(fā)現(xiàn)的一個重要途徑。到目前為止,人們只是針對大約500 種疾病的治療靶點,篩選了現(xiàn)已發(fā)現(xiàn)的2 000 多萬種有機化合物中大約10%的化合物,但仍然有大量的潛在活性化合物未被發(fā)現(xiàn)。,隨著科學技術的發(fā)展,各種先進技術應運而生(X 射線晶體衍射法、多維核磁共振法、掃
2、描隧道顯微技術等),使得越來越多生物靶標(蛋白質(zhì)、核酸、多糖等)的空間結構被解析。同時計算機科學的發(fā)展又極大地提高了計算和分析的速度和精度。因此,自上世紀90 年代起,合理藥物設計就逐漸成為一種實用技術接融入到藥物研發(fā)的各個環(huán)節(jié)。,一、合理藥物設計,成功例子,奈非那韋(nelfinavir) 抗艾滋病藥物 HIV-1蛋白酶抑制劑依馬替尼(imatinib) 治療慢性骨髓型白血病藥物,二、數(shù)據(jù)庫空間,研究對
3、象 化學信息學:小分子 生物信息學:小分子結構單元構成的基因和蛋白質(zhì)等大分子,本質(zhì)上都是 化學物質(zhì)。計算方法 基于回歸的聚類分析;支持向量機;神經(jīng)網(wǎng)絡;遺傳算法等。發(fā)揮作用方面 核酸和蛋白質(zhì)功能和結構;小分子配體和蛋白質(zhì)受體的相互作用;酶催化 等方面 。,化學信息學和生物信息學的共同點,是相互依存,相互影響,需結合在一起,才能解決大多數(shù)的實際問
4、題!,虛擬篩選的時間: 在化合物組合庫合成和/或篩選之前。虛擬篩選的空間: 在計算機上進行模擬設計和篩選。虛擬篩選的方法: 直接方法:基于分子對接(molecular docking)的虛擬篩選 間接方法:基于藥效基團(pharmacophore)的虛擬篩選,虛擬篩選(virtual screening, VS),虛擬篩選技術是藥物設計方
5、法的延伸和推廣,廣義地講只要是基于某種提問形式,從現(xiàn)有的小分子數(shù)據(jù)庫中,搜尋符合條件的化合物都可以稱之為虛擬篩選。這其中包括基于某些分子特性的數(shù)據(jù)庫搜索、基于分子對接的數(shù)據(jù)庫搜索、基于藥效團的數(shù)據(jù)庫搜索等,其目的是從幾十乃至上百萬個分子中篩選出新的先導化合物。由于實體的藥物篩選需要構建大規(guī)模的化合物庫,提取或培養(yǎng)大量實驗必須的靶酶或者靶細胞,并且需要復雜的設備支持,因而進行實體的藥物篩選要投入巨額資金。而虛擬藥物篩選是將藥物篩選的過程在
6、計算機上模擬,對化合物可能的活性作出預測,這樣就能夠集中目標,大大降低實驗篩選化合物的數(shù)量,從而縮短研發(fā)周期、節(jié)約經(jīng)費開支。雖然早在20 世紀70 年代虛擬篩選技術已經(jīng)得到應用,但由于技術本身的不成熟,使得在新藥開發(fā)上仍然主要依靠傳統(tǒng)的實驗篩選。近年來,隨著虛擬藥物篩選成功地發(fā)現(xiàn)了一些有開發(fā)價值的先導化合物,這項技術又重新引起大家的重視。,化學信息學,產(chǎn)生的背景 組合化學和高通量篩選,出現(xiàn)了巨大的信息,需要快速收集、存儲、分析和
7、處理,隨著信息技術向化學領域的滲透,形成了新的交叉學科——化學信息學。研究內(nèi)容 化合物信息在計算機中的表示 化合物數(shù)據(jù)庫的建立、使用和管理 化合物相似性、多樣性及分子類藥性分析 化合物定量構效關系,化學信息學 Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics,利用計算機信息處理技術對化學分子結構和相關信息
8、進行管理的一種綜合性技術和學科應用化學信息學可促進化學信息的獲取、轉(zhuǎn)化與共享,一、化學信息的表示方法,化學分子,一維結構:化合物名稱(俗名);線性符號表示法。,二維結構:原子用元素符號,鍵用短線,即化合物結構式。為平面結構。,三維結構:原子的空間位置、相互間距離、鍵角和二面角等。,分子表面:建立在三維結構基礎上,能與分子的三維結構一一對應。,苯丙氨酸分子結構表征層次,,,,(一)一維結構表示,SMILES(簡化分子線性輸入系統(tǒng))編
9、碼的基本原則,原子通常以大寫元素符號表示(省略氫原子),芳香結構原子則以小寫表示。相鄰原子依次排放在一起,單鍵通常省略,雙鍵和三鍵分別以“=”和“#”表示,芳香鍵以“:”表示,也可省略。分支部分放在括號內(nèi),環(huán)則打開,并賦予斷開鍵兩端的原子以相同的數(shù)值。雙鍵“/”表示順式,“\”表示反式。原子順時針排列用@表示,逆時針排列用@@表示。,甲烷 CH4
10、 C乙醇 C2H5OH CCO氰化氫 HCN C#N環(huán)已烷 C6H12 C1CCCCC1吡啶 C5H5N n1ccccc1異丁
11、酸 (CH3)2CHCO2H CC(C)C(=O)O反式二溴甲烷 Br/C=C/Br 或Br\C=C\Br順式二溴甲烷 Br\C=C/Br 或Br/C=C\BrL-丙氨酸 N[C@@H](C)C(=O)OD-丙氨酸 N[C@H](C)C(=O)O,舉例說明,苯丙氨酸,,,,NC(Cc1ccccc1)C(
12、O)=O,,C/C=C\C=\[C@@H](O)C#N,SMILES編碼的立體化學信息表示,SLN編碼(Sybyl線性標記法)的規(guī)則,原子以其元素符號表示,氫原子也要顯示;單鍵省略,雙鍵、三鍵和芳香鍵分別以“=” “#”和“:”表示;分支也采用括號表示;環(huán)也打開,依靠環(huán)上一個預先定義好的具有唯一編號的原子及@符號來識別,如環(huán)己烷表示為C[15]H2CH2CH2CH2CH2CH2@15;原子和鍵的屬性(如電荷、立體化學性質(zhì)等)可通過
13、方括號[ ]或尖括號在該原子后標記出;對大分子的原子,可使用縮寫,如氨基酸可以用其三個字母縮寫形式表示。,(二)二維結構表示,1、圖論基礎和圖的矩陣表示 一個簡單的圖由頂點(V)和邊(E)組成,因此圖被定義為一個三元組, φ為映射函數(shù)。在下面一個簡單的無向圖中, V={1,2,3,4}, E={e1,e2,e3,e4, e5, e6}。,圖也可用矩陣表示:設G=為無向圖,令mij等于頂點vi與邊ej的關聯(lián)次數(shù),
14、則稱(mij)n*m為G的關聯(lián)矩陣,記為M(G)。,用圖表示苯丙氨酸的結構,2、化合物結構的矩陣表示(1)鄰接矩陣(以乙醛為例),(2)距離矩陣:表示了相應原子之間的距離:幾何距離(用Å表示), 拓撲距離(兩原子之間連接的鍵的個數(shù)) (3)鍵矩陣:矩陣元素為相連接的兩個原子之間的鍵級。 雙鍵:2,三鍵:3。(4)關聯(lián)矩陣:是
15、一個n×m的矩陣。 頂點(原子)作為列(n),邊(化學鍵)作為行(m), 如果邊在頂點內(nèi),則相應的元素置為1。,3、連接表,20世紀80年代開始,成為化合物在計算機中表示的最主要方法。首先對每個原子進行編號并列表然后在另一表格中列出鍵的信息,鍵級用整數(shù)表示,1表示單鍵,2表示雙鍵。,(三)三維結構表示,1、直接坐標法 用迪卡爾
16、坐標直接存儲每個原子的三維坐標(x,y,z),2、內(nèi)坐標法,每個原子位置以與其他原子間的3個相對位置關系表示——相對距離、鍵角、二面角,(四)分子存儲格式及其相互轉(zhuǎn)換,基本存儲分子的元素組成、原子坐標、原子連接關系其他存儲分子子結構信息,適用于生物大分子原子電荷信息,調(diào)用時不必再計算確定特定原子化學環(huán)境的原子類型信息,二、化合物數(shù)據(jù)庫的生產(chǎn)和管理,目前有很多商業(yè)化合物數(shù)據(jù)庫可以利用 MDL藥物數(shù)據(jù)報告(MDDR)含有115
17、000個類藥性 化合物。 美國國家癌癥研究所(NCI)數(shù)據(jù)庫含有250000個 化合物。,MDL ISIS化學數(shù)據(jù)庫管理系統(tǒng),ISIS系統(tǒng)提供了基于Oracle 數(shù)據(jù)庫系統(tǒng)的各類化學信息系統(tǒng)的管理和開發(fā)工具,可以同時管理化學結構、化學反應、生物活性及譜圖等多種化學信息。ISIS已應用于全球超過80%的化學與制藥企業(yè),已成為事實上的化學信息管理系統(tǒng)的工業(yè)標準。,ISIS (Integrated Scientif
18、ic Information Management System)——MDL的綜合性結構和反應管理軟件,由三個主要模塊組成:(1) 化學信息管理系統(tǒng):ISIS/HOST——主服務器應用程序,進行通訊連接,集中數(shù)據(jù)庫數(shù)據(jù)并作處理(2) 化學信息生成和管理軟件:ISIS/BASE——用于生成局部數(shù)據(jù)庫及處理信息(3) 化學畫圖軟件:ISIS/DRAW——用于輸入結構式和搜尋詢問條件,2D結構輸入,——計算機繪制化學結構式 首先輸入原
19、子和鍵的骨架結構,原子數(shù)、電荷會自動變?yōu)樯舷聵?軟件的模板中收集大量分子片段 可智能分析結構式,處理結構式的編碼和變換 還可有附加功能,如自動命名、化學計算、光譜分析等,三維結構的轉(zhuǎn)化,3D結晶結構參數(shù)轉(zhuǎn)入3D數(shù)據(jù)庫,軟件將2D化學結構迅速地轉(zhuǎn)為3D模型,三、分子相似性和多樣性分析,分子相似性和多樣性分析方法的原則:結構相似的分子有著相似的性質(zhì)或活性。作用:在識別新的具有與已知化合物相同性質(zhì)或活性的化合物時具有十分重要的作用。
20、數(shù)據(jù)庫的化學多樣性(chemical diversity): 數(shù)量巨大的、結構不同的貯藏和檢索系統(tǒng)——適用于先導化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學相似性(chemical similarity) 適用于先導化合物優(yōu)化評價方法:通過計算分子的描述符,并比較化合物描述符的近似程度。,分子描述符,概念:在相似性和多樣性分析中,需要建立化合物結構和它們生 物活性或者理化性質(zhì)的映射,分子
21、描述符就是其中的一種映射。 作用:通常一個或多個描述符可以用來描述分子的結構、性質(zhì)等, 如lgP在一定程度上反映了分子穿透細胞膜的能力;拓撲指數(shù)描述 了結構的復雜性。 描述符的內(nèi)容是由兩方面決定的,一是化合物的分子表示,二是計 算描述符的算法。,分子描述的分類,分子相似性分析方法,基于定性特征的和基于定量特征的。對于兩個化合物A和B, a是A所具有而B不具有的特征數(shù)目 b是B
22、所具有而A不具有的特征數(shù)目 c是兩者共同的特征數(shù)目 d為兩者都不具有的特征數(shù)目 c和d表示了化合物A和B之間的相似性 a和b表示了化合物A和B之間的多樣性 所有的特征數(shù)目為n=a+b+c+d這樣,可以建立一種直觀的相似性評價方法:考察所有匹配的特征數(shù)目c+d在所有特征數(shù)目(c+d)+(a+b)中所占的比例,即(c+d)/(a+b+c+d)。這也被稱作為簡單匹配系數(shù)??梢钥闯?,A和B均不具有的特
23、征并沒有表達任何信息,所以,d可以從上面的方法中刪除,得到了Tanimoto相似度計算公式。,,化學多樣性的定量表達——Tanimoto系數(shù),用化學空間中電荷和電勢等描述符比較不同分子的性質(zhì) TC = c /(a+b+c) a為A中基礎片斷的描述符的數(shù) b為B中基礎片斷的描述符的數(shù)目 c為
24、A和B中共有的基礎片斷的描述符的數(shù)目相同分子TC = 1;分子沒有共同描述符時TC = 0,相似性搜尋,根據(jù)分子相似性原理,可以在數(shù)據(jù)庫中搜尋與目標分子具有一定相似性的分子,即相似性搜尋。步驟: 1、目標選擇 2、描述符選擇和編碼 3、相似性評價方法選擇 4、搜尋語句的輸入 5、相似性打分,四、互聯(lián)網(wǎng)上的化學信息資源,(一)化學搜索引擎1、大型通用搜索引擎:Google、百度等。
25、2、專門用于搜索化學信息的引擎:ChemFinder, MetaXchem…..(二)互聯(lián)網(wǎng)上的化學數(shù)據(jù)庫1、文獻數(shù)據(jù)庫(CA、Medline)2、化合物數(shù)據(jù)庫(Gmelin, CSD)3、綜合數(shù)據(jù)庫(Beilstein、PDB),常用化合物數(shù)據(jù)庫,FCD (Fine Chemicals Directory)—— MDL 維護。收載約90 000化合物和20 000化合物數(shù)據(jù),包括化學系統(tǒng)名、俗稱、分子式、分子量、供應商、價格、
26、CAS登錄號、純度等??赏ㄟ^結構式或其它任何數(shù)據(jù)檢索ACD (Available Chemicals Directory) ——MDL維護。FCD數(shù)據(jù)庫加上可大批量供貨的化學品信息。目前有25萬個化合物CSD(Cambridge Structure Database) —— 20多萬個結晶的3D結構實驗數(shù)據(jù)及相關數(shù)據(jù),常用數(shù)據(jù)庫的網(wǎng)址,生物信息學(bioinformatics),基于數(shù)學、生命科學、化學和計算機科學的交叉學科. 利用
27、計算機信息處理技術對大量生物大分子作信息獲取、加工、儲存、分類、檢索與統(tǒng)計分析,揭示生物大分子的分子結構、功能、同源性和進化關系. 推動生命科學的發(fā)展,為創(chuàng)新藥物的研究和開發(fā)奠定基礎.,生物信息學的應用,核酸序列分析指直接從基因組序列中獲取信息,同時為后者提供數(shù)據(jù);蛋白質(zhì)序列分析中,大部分是對同源蛋白序列進行比對分析,以得到不同蛋白質(zhì)之間的序列相關性,從而推測蛋白質(zhì)功能等。二者分析方法一致。,生物大分子結構預測,虛擬篩選,生物大分子包
28、括DNA、RNA、蛋白質(zhì)和脂類。它們的結構預測指建立精確的三維構象,這對于生物大分子功能的闡明十分重要。而尚無晶體結構數(shù)據(jù)的生物大分子,可采用分子模擬的方法預測大分子的三維結構。,在進行生物活性篩選之前,在計算機上對化合物分子進預篩選,以降低實際篩選化合物數(shù)目,同時提高先導化合物發(fā)現(xiàn)效率。,藥物發(fā)現(xiàn)中的生物信息學方法,一、核酸和蛋白質(zhì)的序列分析,(一) 單個序列分析 根據(jù)單個氨基酸物化性質(zhì)推測整個蛋白質(zhì)的性質(zhì)
29、,也可對序列進行統(tǒng)計分析,預測二級結構出現(xiàn)可能性. 20種氨基酸的疏水參數(shù),根據(jù)統(tǒng)計值:Glu經(jīng)常出現(xiàn)在α-螺旋中;Val常在β-折疊中發(fā)現(xiàn); Pro通常不出現(xiàn)于α-螺旋中和β- 折疊中而傾向于在回折中……,(數(shù)值=1代表偏好處于平均;>1代表偏好大于平均;<1代表偏好小于平均),(二) 雙重序列比較——序列比對,序列對比可以用各種矩陣表達并作相似性打分兩個殘基越
30、相似則打分值越高.,(三) 多重序列比對,多重序列比對可更多揭示相關蛋白質(zhì)序列中的保守區(qū)域,進而分析蛋白質(zhì)的結構和功能??刹捎枚喾N統(tǒng)計算法進行多重序列比對。,二、蛋白質(zhì)三維結構預測,蛋白質(zhì)二級結構預測的意義,蛋白質(zhì)的二級結構有α螺旋、β折疊、β轉(zhuǎn)角等。因為每一段相鄰的氨基酸殘基具有形成一定二級結構的傾向,而且所有蛋白質(zhì)中約85%的氨基酸殘基處于上述3種基本二級結構狀態(tài),所以從序列預測蛋白質(zhì)二級結構是可行的。,1、Chou-Fasman方
31、法2、GOR方法3、基于氨基酸疏水性的方法,蛋白質(zhì)二級結構預測的方法,主要預測方法,1、從頭預測法(ab initio prediction),采用理論計算(分子力學、分子動力學、量子化學)方法,直接從分子和原子參數(shù)計算出蛋白質(zhì)分子的穩(wěn)定構象,理論上最理想的方法,但計算量極大,對于實際分子的計算超過能力范圍,2、穿針引線法,根據(jù)已知的蛋白質(zhì)三維結構來預測可能的三維結構——基于知識的預測可應用于進化非常疏遠的結構預測未知蛋白序
32、列與折疊庫中已知結構的蛋白序列作匹配計算,將序列吻合的三維結構模塊串連起來,得到整個蛋白三維結構,同源蛋白模建法homologous model building比較分子模擬法comparative molecular modeling同源模建 homology modeling同源蛋白法 protein homology,根據(jù)已知的蛋白質(zhì)三維結構來預測可能的三維結構——基于知識的預測同源蛋白有著相似的來源、相似
33、的結構和生物功能。通過比較蛋白序列的相似性,按同源蛋白的三維結構為模板,構建未知蛋白的結構一般要求同源性在30%以上,特別是在結合區(qū)域同源性要好,步驟,(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白(2)二重或多重序列對比步驟(3)找出共同的二級結構區(qū)域,構建骨架(4)對初始模型作能量優(yōu)化(5)判斷結構合理性,三、代表性生物信息學數(shù)據(jù)庫,(一)核酸數(shù)據(jù)庫GenBank——NIH所屬國家生物技術信息中心NCBINucleic Ac
34、id Database(NDB)—— 由European Molecular Biology Laboratory( EMBL)創(chuàng)建,現(xiàn)由英國劍橋的歐洲生物信息學研究所( European Bioinformatics Institute, EBI)維護DNA Data Bank of Japan(DDBJ)——日本國立遺傳學研究所的日本信息生物學中心( Center for Information Biology, CIB)開發(fā)維
35、護三大庫可交互,(二)蛋白質(zhì)數(shù)據(jù)庫,PDB ( Protein Data Bank at Brookhaven National Laboratories ) —— 美國 Research Collaboration for Structural Bioinformatics, RCSB開發(fā)維護的多肽、酶、病毒、碳水化合物和核酸的三維結構數(shù)據(jù),基于藥效基團搜索的方法,藥效團的概念早在1909 年就由Ehrilich 提出,特
36、指載有活性必須特征原子的分子框架?,F(xiàn)在泛指生物活性分子(一般指小分子)中對活性起重要作用的“藥效特征元素”的空間排列形式。這些“藥效特征元素”可以是某些具體的原子或原子團,比如氧原子、苯環(huán)等;也可以指特定的功能結構,如疏水基團、氫鍵給體、氫鍵受體等。在得到某類抑制劑的藥效團模型后,就可以以藥效團作為提問結構進行數(shù)據(jù)庫搜索,從數(shù)據(jù)庫中篩選得到符合該藥效團的候選分子,而在這些候選分子中可能包含新的先導化合物。,(1)初篩:其作用是先篩去那些
37、不能與提問結構匹配的分子,減少進入下一個階段的候選分子數(shù)。大多數(shù)軟件都把在該藥效團中出現(xiàn)較多的原子或基團作為約束條件,含有這些基團的則通過初篩,否則被淘汰。(2)二維子結構匹配:其目的是確定測試分子中藥效模式間的連接方式是否符合提問結構,這是一個較為耗時的過程。(3)三維結構搜索:在通過二維子結構匹配證明其包含藥效團以后,就需要驗證它在數(shù)據(jù)庫中的構象和藥效特征元素是否滿足空間限制條件,如果滿足則該分子是一個命中結構。,基于藥效團的搜
38、索一般包含3 個基本步驟,基于藥效團的搜索軟件,CATALYST 是由美國Accelrys 公司面向藥物研究領域的綜合性開發(fā)軟件,由于這一軟件為藥效團模擬提供了完善的解決方案,使得CATALYST 成為近年來在基于藥效團模型的藥物開發(fā)方面使用最廣泛的軟件。它能將抽象的藥效特征元素與靈活的幾何約束條件相結合,尤其在定義藥效團模型時,能夠表達重要的化學概念。在進行基于藥效團模型的數(shù)據(jù)庫搜索時,其一維限制條件與某些數(shù)據(jù)相聯(lián)系,如分子量、lgP
39、 、pKa 等,從而把搜索限定在某些數(shù)值范圍內(nèi);二維約束支持定義包含子結構或排除子結構,如包含芳香環(huán),不包含羰基等;三維檢索時,對每個分子在生理條件下可能采取的各種構象進行搜索。為實現(xiàn)最佳的檢索性能,CATALYST 經(jīng)過了高度優(yōu)化,即使最抽象的(化學表達)檢索也不例外。,UNITY 是另一搜索化學或生物數(shù)據(jù)庫的搜索系統(tǒng),由美國Tripos 公司開發(fā)。包括2D(搜索特殊片段)、相似性、3D(搜索特征的三維結構或藥效團)、柔性(允許小分子
40、通過改變鍵角、二面角等方式符合3D 條件)搜索。UNITY 在進行藥效團搜索時,支持3D/Flex 搜索,檢索的藥效團特征包括給體原子(donor atom)、受體原子(accept atom)、給體位點(donor site)、受體位點(accept site)以及疏水中心(hydrophobic center)等。在對小分子數(shù)據(jù)庫進行藥效團搜索時,采用的特征限制條件可以是具體的原子或基團,如上述的給體原子、受體原子、疏水中心;也可以
41、是某些配體將與之發(fā)生作用的位點,即給體位點和受體位點等。,基于藥效基團的結構搜尋,1、二維藥效基團搜尋,以平面的提問結構搜尋化合物結構式,(1)二維子結構搜尋,搜尋具有與提問結構相同子結構的化合物分子,(2)二維相似性搜尋,搜尋與提問結構某些特征相似的化合物分子,2、三維藥效基團搜尋,搜尋具有與相同作用基團和空間排布的化合物分子,[例] 新抗生素的尋找,[例] D2/D3受體選擇性拮抗劑藥效基團模型,多巴胺D2類受體為抗帕金森癥和安定類
42、藥物的靶點D3/D4受體可能與精神分裂癥有關D2受體選擇性拮抗劑——取代哌嗪/哌啶類,D3受體選擇性拮抗劑——苯酰胺類和四氫萘類,藥效基團模型的建立,挑選26個D2受體選擇性和22個D3受體選擇性的化合物分別作為訓練集,分別產(chǎn)生D2受體D3受體模型 以Catalyst 將結構式轉(zhuǎn)化為三維構象, 用Best conformational analysis進行構象優(yōu)化用Catalyst/HypoGen產(chǎn)生藥效基團。選擇5個結構特征
43、作為藥效基團單元:HB Acceptor,HB Donor, HYDPHOBIC , HYDROPHOB aromatic , RING AROMATIC 為D2/D3受體選擇性拮抗劑分別產(chǎn)生了10個得分從高到低的Hypothesis,藥效基團模型的可信度,對于D2受體和D3受體產(chǎn)生的藥效團模型,每個藥效基團模型的得分與理想模型的得分差值均大于40,說明數(shù)據(jù)關聯(lián)的可能性較大所建立的D2受體和D3受體藥效團模型可用于虛擬篩選,未知化合
44、物的活性預測,以未知化合物作為驗證集大部分預測值與實驗值處于同一個數(shù)量級,并反映D2/D3受體的選擇性,D2(左)和D3(右)受體拮抗劑藥效基團MAPPING圖,[例] Muscarinic M3 受體拮抗劑的篩選,過敏性腸道綜合癥與慢性阻塞性氣管病均與受體Muscarinic M3 有關。1999 年,Marriott 等采用基于藥效團搜索的方法進行了Muscarinic M3 受體拮抗劑的篩選。他們從文獻中選出3 個已知的抑制劑,
45、利用DISCO 程序構建藥效團模型,最終有2 個四點模型用于數(shù)據(jù)庫搜索(圖)。數(shù)據(jù)庫搜索使用UNITY 程序,數(shù)據(jù)庫為自己課題組所構建,2 個藥效團模型篩選得到177 個完全不同的分子,生物活性檢測發(fā)現(xiàn)其中有3 個分子具有較高的活性。,[例]對MC 增生抑制劑的篩選,腎小球毛細血管中的血管系膜細胞(mesangial cell,MC)的增生與許多血管疾病的發(fā)生有關。2001年,Kurogi 等采用基于藥效團的數(shù)據(jù)庫搜索對MC 增生抑制劑
46、進行了篩選,研究組從現(xiàn)有抑制劑出發(fā),藥效團識別采用CATALYST,構建了包含7 個藥效特征元素的藥效團模型。然后CATALYST 搜索了包含47 045 個分子的數(shù)據(jù)庫,得到41 個命中結構,生物活性檢測其中4 個化合物具有明顯的MC 增生抑制活性。,三、基于定量構效關系的虛擬篩選,定量構效關系方法及篩選,定量構效關系(quantitative structure-activity relationship,QSAR)研究方法在現(xiàn)
47、代藥物設計方法中占有重要的地位,也是應用最為廣泛的藥物設計方法。其目的是采用數(shù)理統(tǒng)計的方法研究和揭示化合物的活性與其分子理化性質(zhì)之間的定量變化規(guī)律。傳統(tǒng)的二維定量構效關系方法,如Hansh 法、模式識別Free-Wilson 法、電子拓撲法等早已為大家所熟知。隨著QSAR 理論及統(tǒng)計方法的發(fā)展,反映更加豐富信息的三維定量構效關系方法如比較分子場分析(CoMFA)方法、距離幾何法及分子形狀分析方法等都迅速得到了廣泛應用。,基于定量構效關系
48、篩選的方法也是最早發(fā)展起來的虛擬篩選方法,并已由平面的2D 發(fā)展至空間的3D 模式。利用軟件(如Tripos 公司的CoMFA 或Accelrys 公司的CATALYST)分析一系列已知化合物的各種性質(zhì)、理化指標,構建定量構效關系。在構效關系確定之后,即可應用于搜索各類數(shù)據(jù)庫,篩選常使用的有Cerius2 中的Diversity 模塊。,實 例,磺酰脲類除草劑最初開發(fā)在20 世紀70 年代,當時由于目標受體ALS 酶的三維結構尚不確
49、定,南開大學李正名教授課題組從配體出發(fā),選定了32 個化合物進行構效關系研究。利用分子模擬與設計軟件包SYBYL 中的CoMFA 構建了相應的三維定量構效關系模型。利用此模型以及Cerius2 的Diversity 模塊進行數(shù)據(jù)庫的虛擬篩選及活性預測,并挑選出20 個預測活性高的化合物進行合成,取得了較好的結果。,四、 基于藥代動力學的虛擬篩選,在傳統(tǒng)的藥物設計流程中,對于候選化合物最關心的往往是其能否與靶酶的活性位點結合,至于這個化
50、合物能否在腸道溶解、透過細胞膜達到有效部位等問題考慮的并不多。這也直接導致了在過去20 年,世界前50 強制藥企業(yè)每年平均花費75 億美元僅開發(fā)出21 個上市新藥,而真正能上市的藥物與候選藥物的比例始終保持在1/10,其中原因絕大部分出在藥代動力學或安全(化合物毒性)問題上。因此,在藥物研制的早期階段對化合物的藥代動力學和毒性進行全面的評價也是十分重要的。,得到藥代動力學模型通常包含3 個步驟:(1)利用小型化技術(miniatur
51、ization)制作一系列體外培養(yǎng)基。(2)借助計算機虛擬篩選一系列化合物,并對這些培養(yǎng)基進行評價。(3)對預測模型進行實際檢驗并修正,從而這些虛擬模型將最終取代真實體內(nèi)或體外實驗,成為篩選的模型。,Chris Lipinski 及其合作者通過高通量篩選以及組合化學取樣,分析了WDI 中的2 245 個藥物。為了查明普通口服藥物的共同特性,總結出了著名的Chris Lipinski “5 規(guī)則”,包括分子量不能超過500、油水分配系
52、數(shù)CLogP 小于5 等。,基于藥代動力學篩選較快捷,主要針對整個數(shù)據(jù)庫,通常先于藥效團篩選、對接篩選。因此篩選條件應盡量完善,否則很可能剔除潛在先導化合物。除上述“5 規(guī)則”之外,可極化表面積(PSA,一般應小于140.2)、在生理條件下油水分配系數(shù)、溶解度、在小腸及腦滲透率都應是被考慮的篩選條件,這樣才能保證整個虛擬篩選過程準確性、高效性。,除了上述4 種篩選方法外,還有其它數(shù)據(jù)庫搜索技術,如子結構匹配篩選、相似性搜索等,這些技術都
53、已經(jīng)在一些虛擬篩選實例中得到應用。,虛擬藥物篩選面臨的問題,(1)整個化學空間十分龐大,人們對于絕大部分化合物的生物性質(zhì)還不是很清楚或知之甚少。因此所篩選的數(shù)據(jù)庫通常是依據(jù)經(jīng)驗選擇自己所了解的庫,從而給篩選結果帶來很大的局限性。(2)受體模型經(jīng)常是一個十分復雜的結構,例如蛋白質(zhì)、多糖,包含成千上萬個原子,而且在正常體液中一般處于流動狀態(tài),因此時刻都在改變其構象。假如以某個受體采用基于分子對接的篩選,則必須考慮受體構象以及配體構象的變化
54、情況。然而分子的構象數(shù)隨著柔性鍵的數(shù)目成指數(shù)增長,并且虛擬篩選通常面對的是包含眾多數(shù)目化合物的數(shù)據(jù)庫,因此計算量十分巨大。在現(xiàn)有的計算條件下,仍是一個值得考慮的問題。(3)結合自由能是評價藥物與受體結合的指標,雖然結合自由能的計算較為復雜,但是用熱力學積分法計算同類配體與受體的結合自由能還是可行的。然而數(shù)據(jù)庫中小分子數(shù)量很多,而且相互之間基本無關聯(lián),因而計算如此多的小分子與受體結合自由能的計算量是十分驚人的。,結語,虛擬篩選是創(chuàng)新藥物
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥物發(fā)現(xiàn)及靶向虛擬篩選的算法與程序設計.pdf
- 抗腫瘤藥物的篩選方法
- 基于失衡數(shù)據(jù)分類模型的藥物蛋白質(zhì)虛擬篩選方法.pdf
- 降血糖藥物篩選方法
- 新型抗代謝綜合征藥物的篩選及發(fā)現(xiàn).pdf
- 生物相空間中的適配體和藥物虛擬篩選.pdf
- 抗HIV-1多靶點藥物的虛擬篩選.pdf
- 基于受體結構的虛擬篩選在先導化合物發(fā)現(xiàn)中的應用.pdf
- 抗藥物依賴功效藥效團模型的構建及其虛擬篩選.pdf
- 天然抗腫瘤藥物篩選方法的研究進展
- 進化啟發(fā)的藥物發(fā)現(xiàn).pdf
- 保肝藥物活性篩選方法的建立及應用.pdf
- 抗菌藥物篩選的實驗方法與技術教案
- APJ受體的生物信息學分析及藥物靶點虛擬篩選.pdf
- 金屬藥物的設計與應用-藥物發(fā)現(xiàn)簡史課程論文
- 藥物篩選及細胞凋亡的熒光分析新方法研究.pdf
- ARIs篩選模型的建立及相關藥物的篩選.pdf
- 藥物先導化合物發(fā)現(xiàn)新策略-基于受體靶點的小分子抑制劑虛擬篩選和基于抗體結構的多肽模擬物的設計.pdf
- 靶向流感M2質(zhì)子通道藥物篩選方法的研究.pdf
- 抗病毒藥物的合成篩選與質(zhì)量檢測方法研究.pdf
評論
0/150
提交評論