版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 摘要</b></p><p> 隨著 X 射線晶體衍射以及多維核磁共振等實(shí)驗(yàn)技術(shù)的進(jìn)步,越來(lái)越多的疾病 相關(guān)生物大分子的結(jié)構(gòu)得以測(cè)定?;诮Y(jié)構(gòu)的藥物設(shè)計(jì)方法已成為藥物設(shè)計(jì)領(lǐng)域 中的常用方法?;诮Y(jié)構(gòu)的藥物設(shè)計(jì)主要分為虛擬篩選和全新設(shè)計(jì)兩個(gè)方向。雖 然從理論上說(shuō),全新設(shè)計(jì)方法不依賴于化合物庫(kù),更容易設(shè)計(jì)出具有化學(xué)多樣性 和高生物活性的分子,但與近二十年來(lái)虛擬篩
2、選方法所獲得的巨大成功相比,全 新設(shè)計(jì)方向的進(jìn)展乏善可陳。主要原因在于全新藥物設(shè)計(jì)方法給出的分子難于合 成,而且即使可以合成,合成的時(shí)間和經(jīng)濟(jì)代價(jià)也往往比虛擬篩選策略僅需要購(gòu) 買分子要高,使得無(wú)法進(jìn)行大規(guī)模的實(shí)驗(yàn)測(cè)試。這兩個(gè)原因給全新藥物設(shè)計(jì)方法 進(jìn)入實(shí)用階段帶來(lái)很大困難。</p><p> 本論文構(gòu)建了一個(gè)完整的全新藥物設(shè)計(jì)系統(tǒng),該系統(tǒng)可以完成全新藥物設(shè)計(jì) 的全過(guò)程,包括:蛋白質(zhì)結(jié)合位點(diǎn)探測(cè)、可藥性分析、全新
3、分子設(shè)計(jì)、結(jié)合能預(yù) 測(cè)、后篩選以及化合物合成分析,同時(shí)解決了全新藥物設(shè)計(jì)領(lǐng)域中設(shè)計(jì)化合物可 合成性差和成功率低的兩個(gè)主要困難。該系統(tǒng)在親環(huán)素 A 抑制劑研究中成功地 設(shè)計(jì)得到了全新藥物設(shè)計(jì)方法迄今為止有報(bào)道的活性最高的分子,證實(shí)了該系統(tǒng) 的有效性和實(shí)用性。隨著全新藥物設(shè)計(jì)方法的發(fā)展,將會(huì)逐漸成為基于結(jié)構(gòu)藥物 設(shè)計(jì)的首選方法。</p><p> 論文工作主要分以下六個(gè)部分:</p><p>
4、; 1、開發(fā)了一個(gè)蛋白質(zhì)配體結(jié)合位點(diǎn)探測(cè)程序 Cavity。提出了一種新的 蛋白質(zhì)配結(jié)合位點(diǎn)幾何探測(cè)法“球擦除法”進(jìn)行初步探測(cè),在此基礎(chǔ)上利用一種新 的基于格點(diǎn)的算法,即“收縮、擴(kuò)張”算法來(lái)更為精確的定義結(jié)合位點(diǎn)邊界。根據(jù) 配體結(jié)合部位的幾何、物理化學(xué)屬性,定義了有較明確物理意義的“CavityScore”, 用以衡量配體結(jié)合位點(diǎn)結(jié)合能力的強(qiáng)弱,并得到一條線性方程,可以用于預(yù)測(cè)配 體與結(jié)合位點(diǎn)作用可能達(dá)到的最大結(jié)合能力。對(duì)排名前三的
5、結(jié)果預(yù)測(cè)準(zhǔn)確率分別 為 86%,92%,97%,在精度和準(zhǔn)確率上都優(yōu)于現(xiàn)有的探測(cè)程序。</p><p> 2、在本實(shí)驗(yàn)室早年開發(fā)的全新藥物設(shè)計(jì)程序 LigBuilderV1.2 基礎(chǔ)上, 發(fā)展了 LigBuilderV2.0 版本。采用了三種新的全新藥物設(shè)計(jì)策略,即探索模式,</p><p> 集合生長(zhǎng)模式和集合連接模式。探索模式是 LigBuilderV2.0 的核心算法,通過(guò)自
6、動(dòng)提取生長(zhǎng)起始種子并進(jìn)化種子庫(kù),然后以之為基礎(chǔ)進(jìn)行多輪設(shè)計(jì),完全避免了 以往的全新設(shè)計(jì)方法中,依賴于人工給定起始種子而使得設(shè)計(jì)分子的新穎性和多 樣性受到限制的問(wèn)題,可以說(shuō)是嚴(yán)格意義上的從頭設(shè)計(jì)方法。集合生長(zhǎng)模式可以 用于優(yōu)化先導(dǎo)化合物,集合連接模式能夠?qū)⒍鄠€(gè)小片段連接形成新的分子。所發(fā) 展的集合連接模式具有遠(yuǎn)超以往分子片段連接算法的計(jì)算效率,使得多片段的連 接也變得可行。結(jié)合 LigBuilderV2.0 中的片段提取功能,這兩種模式都
7、可以進(jìn)行 仿制設(shè)計(jì),特別是集合連接模式,能夠有效的設(shè)計(jì)與已知抑制劑有類似相互作用 模式,同時(shí)具有新骨架結(jié)構(gòu)的分子,因此它也是一種新穎的藥物仿制策略。</p><p> 3、在本實(shí)驗(yàn)室已發(fā)展的蛋白質(zhì)-配體打分函數(shù) Score2.0 和 Score3.0 基礎(chǔ) 上,發(fā)展了新一代的蛋白質(zhì)-配體經(jīng)驗(yàn)打分函數(shù) Score4.0。氫鍵是蛋白受體與配 體特異性相互作用最重要的因素之一,氫鍵的本質(zhì)是質(zhì)子與孤對(duì)電子間的靜電作
8、用,但當(dāng)前打分函數(shù)中對(duì)氫鍵的計(jì)算往往忽略了孤對(duì)電子的方向問(wèn)題。Score4 不但對(duì)氫原子進(jìn)行精細(xì)的重新裝配,而且也考慮到孤對(duì)電子的方向,同時(shí)還能處 理氫鍵簇并構(gòu)建水橋,能夠?qū)滏I進(jìn)行較為精確的計(jì)算。此外,根據(jù)分子結(jié)合的 鎖鑰模型,如果存在良好的蛋白-配體相互作用,其間也應(yīng)該具備較好的幾何互 補(bǔ)性。為此本文定義了結(jié)構(gòu)匹配分,通過(guò)計(jì)算配體分子在結(jié)合位點(diǎn)附近的可運(yùn)動(dòng) 空間大小,衡量?jī)烧唛g的幾何互補(bǔ)性,并將這個(gè)參數(shù)加入到打分函數(shù)的計(jì)算中。 在以
9、 210 個(gè)蛋白為測(cè)試集的計(jì)算中,Score4 的預(yù)測(cè)相關(guān)系數(shù) R 為 0.694,標(biāo)準(zhǔn)差 為 1.61,優(yōu)于現(xiàn)有的打分方法。</p><p> 4、在 LigBuilderV2.0 中發(fā)展了一個(gè)內(nèi)置的同步式可合成性分析模塊。 設(shè)計(jì)分子的可合成性是制約全新藥物設(shè)計(jì)方法的關(guān)鍵瓶頸之一,全新藥物設(shè)計(jì)方 法產(chǎn)生的分子往往較為復(fù)雜而難于合成,無(wú)法進(jìn)行下一步的實(shí)驗(yàn),而使設(shè)計(jì)結(jié)果 變得毫無(wú)意義。因此本文發(fā)展了基于數(shù)據(jù)庫(kù)搜
10、索和特征反應(yīng)結(jié)構(gòu)匹配的逆向合成 分析方法,同時(shí)構(gòu)建了一個(gè)可擴(kuò)充的有機(jī)合成反應(yīng)數(shù)據(jù)庫(kù)以及反應(yīng)原料數(shù)據(jù)庫(kù)。 為了適應(yīng)全新藥物設(shè)計(jì)方法高通量的特性,本文運(yùn)用了可進(jìn)化的哈希鏈表等方法 加快計(jì)算速度,第一次在全新藥物設(shè)計(jì)算法中實(shí)現(xiàn)了同步的合成路徑分析。</p><p> 5、在 LigBuilderV2.0 中發(fā)展了后篩選模塊對(duì)所設(shè)計(jì)的分子進(jìn)行后篩選。</p><p> 對(duì)于全新藥物設(shè)計(jì)方法來(lái)
11、說(shuō),由于合成的高代價(jià),對(duì)于挑選分子的成功率有非常 高的要求。后篩選模塊能夠?qū)⒃O(shè)計(jì)結(jié)果中可靠性較低的結(jié)果剔除掉,再對(duì)分子進(jìn) 行綜合排序,從巨量的設(shè)計(jì)結(jié)果中挑選出少量綜合屬性最佳的分子生成設(shè)計(jì)報(bào)告, 供使用者進(jìn)行人工挑選。本文發(fā)展的后篩選模塊主要由幾個(gè)過(guò)濾模型組成:(1) 鎖鑰模型;(2)穩(wěn)定性模型(剩余自由度模型);(3)結(jié)合勢(shì)能面形貌模型。為 此分別定義了結(jié)構(gòu)匹配分,分子穩(wěn)定性,平均離散性以及最大離散性等參數(shù),對(duì) 模型進(jìn)行描述。符合這些
12、模型的分子在使用靜態(tài)的打分函數(shù)計(jì)算時(shí),能夠使與結(jié) 合和解離動(dòng)力學(xué)相關(guān)的因素對(duì)于打分函數(shù)精度的影響減小。同時(shí),后篩選模塊大 幅度減少了最終設(shè)計(jì)的分子數(shù),因此可以引入更為精細(xì)的自由能計(jì)算方法對(duì)設(shè)計(jì) 結(jié)果進(jìn)行最終的排序。</p><p> 6、 使用本論文發(fā)展的 LigBuilderV2.0 對(duì)親環(huán)素 A 進(jìn)行了全新抑制劑設(shè) 計(jì)。親環(huán)素 A 是親環(huán)素家族的重要成員,在許多生物過(guò)程中有著非常重要的作 用。目前針對(duì)親環(huán)素
13、 A 的小分子抑制劑結(jié)構(gòu)多樣性低,活性也較低。本文中使 用 LigBuilderV2.0 設(shè)計(jì)出一系列具有酰脲結(jié)構(gòu)的化合物,最終經(jīng)過(guò)篩選得到 98 個(gè)結(jié)構(gòu),而其中 38 個(gè)結(jié)構(gòu)具有一致的骨架。合作者從中挑選了一個(gè)化合物進(jìn)行 合成和測(cè)活,該化合物的 IC50 達(dá)到 31.6nM ,高于上市藥物環(huán)孢菌素 A</p><p> ?。↖C50=40.7nM)。到目前為止,這也是已報(bào)道的使用全新藥物設(shè)計(jì)方法設(shè)計(jì)得到 的活
14、性最高的化合物。而且經(jīng)過(guò)合作者進(jìn)一步的化學(xué)修飾,IC50 提高到了 1.52nM。 本文通過(guò)計(jì)算設(shè)計(jì),僅合成一個(gè)分子就得到了 10nM 級(jí)別的抑制劑,標(biāo)志著全新 藥物設(shè)計(jì)方法進(jìn)入了實(shí)用化的新階段。</p><p> 關(guān)鍵詞:結(jié)合位點(diǎn)探測(cè);打分函數(shù);全新設(shè)計(jì);后篩選;可合成性分析;</p><p><b> Abstract</b></p><p
15、> With the technological advances of X-ray crystallography and multidimensional NMR, many structures of disease-related biological macromolecules have been solved. Therefore, structural based drug design methods has
16、become a common practice in drug discovery. Methods for structural based drug design can be classified into two groups: virtual screening and de novo design. As de novo design methods do not depend on available compound
17、libraries, higher chemical diversity and biological activity of mo</p><p> This thesis aims to overcome the main difficulties in de novo drug design and build an integrated de novo drug design system, which
18、 includes: protein binding cavity detection and druggability prediction, de novo molecule design, binding energy estimation, post-filtering, and compound synthesis accessibility analysis. This system can not only perform
19、 all required functions in de novo drug design, but also solved the two major problems in de novo drug design, that is, synthesis difficulty and low </p><p> This thesis mainly contains six parts:</p>
20、<p> A protein-ligand binding site detection program, Cavity was developed. A novel geometric detection approach, “ball erase” and a geometric split algorithm “Shrink-Expand” for determining the accurate boundary
21、 of binding sites were developed, which can provide more precise information of the geometric shapes of binding sites. In order to predict the maximum binding capacity of the cavities detected, an evaluation parameter to
22、 predict the binding capabilities, named "CavityScore" was introduced,bas</p><p> Based on the LigBuilderV1.2, a de novo drug design program, formerly developed in the author’s laboratory, a new g
23、eneration of the program, LigBuilderV2.0, has been developed. LigBuilderV2.0 includes three new de novo design strategies: the exploring mode, the ensemble growing mode and the ensemble linking mode. Exploring mode can a
24、utomatically extract seed structures from the growing population, and update the seed library. With the evolution of seed library, the exploring mode becomes an infin</p><p> Based on the Score2.0 and Score
25、3.0 formerly developed in the author’s laboratory, a new generation of empirical scoring function, Score4.0 was developed. Hydrogen bonds play key role in the specific interactions between the target and its</p>&
26、lt;p> ligand. The nature of hydrogen bonding is the electrostatic interaction between the proton and the lone pair. Directions of the lone pairs are not considered well in most scoring functions. Score4 re-assembles
27、hydrogen atoms and at the same time take the direction of the lone pair electrons into consideration. Furthermore, Score4 also handles the hydrogen bond cluster and detects potential water bridges. In addition, according
28、 to the lock-key model of molecular binding, good geometric complement</p><p> An embedded synchronous synthesis accessibility analysis module was introducted in LigBuilderV2.0. Synthesis accessibility is o
29、ne of the critical bottlenecks of de novo drug design method. As the molecules generated by de novo drug design method are often complicated and difficult to be synthesized, making experimental validation impossible. The
30、refore, we have developed a retro-synthesis system based on reaction feature matching and database, while constructed a scalable organic reactions databa</p><p> A post-filter module in LigBuilderV2.0 was d
31、eveloped. As the expensive synthesis cost of new chemical scaffolds, we have extraordinarily demands on low false positive rate compared with virtual screening. The post-filter module will eliminate none-confident result
32、s, and then sort the molecules by an integrated estimation rule, which can be used to select refined molecules for generating the final report from a huge amount of designed results. The post-filter module is composed&
33、lt;/p><p> by several filter models: (1) Lock and key model; (2) Stability model (the remaining degree of freedom model); (3) Binging energy landscape profile. These filters consider the influences of binding
34、 kinetics to certain extent to improve the accuracy of the scoring function.</p><p> LigBuilderV2.0 has been successfully applied in designing novel Cyclophilin A inhibitors. Cyclophilin A plays important r
35、oles in many biological processes. A naturally occuring cyclophilin A inhibitor, cyclosporin A has been used as clinical immuno-repressor. In order to discover Cyclophilin A inhibitors with novel chemical structures, we
36、used LigBuilderV2.0 to design a series of compounds with a ureide linker, and 38 of the final 98 filtered structures have a consistent scaffold. One of these m</p><p> Key Words:binding site detection; scor
37、ing function; de novo design;post-filter; synthesis accessibility analysis;</p><p><b> 目錄</b></p><p><b> 第一章緒論1</b></p><p> 1.1基于結(jié)構(gòu)的藥物設(shè)計(jì)1</p>
38、<p> 1.2本論文的工作設(shè)想8</p><p> 第二章蛋白質(zhì)配體結(jié)合位點(diǎn)預(yù)測(cè)10</p><p><b> 2.1引言10</b></p><p> 2.2計(jì)算方法11</p><p> 2.2.1深度的定義及應(yīng)用11</p><p> 2.2.2
39、球擦除法12</p><p> 2.2.3伸縮算法15</p><p> 2.2.4CavityScore16</p><p> 2.2.5蛋白結(jié)構(gòu)處理18</p><p> 2.2.6數(shù)據(jù)集與結(jié)果19</p><p><b> 2.3討論23</b></p&
40、gt;<p> 第三章化合物設(shè)計(jì)算法25</p><p><b> 3.1引言25</b></p><p> 3.2計(jì)算方法28</p><p> 3.2.1片段庫(kù)構(gòu)建28</p><p> 3.2.2片段提取31</p><p> 3.2.3探索模
41、式32</p><p> 3.2.4集合生長(zhǎng)模式35</p><p> 3.2.5集合連接模式36</p><p> 3.2.6能量?jī)?yōu)化40</p><p> 3.2.7遺傳算法40</p><p> 3.2.8評(píng)價(jià)方法41</p><p> 3.2.9結(jié)構(gòu)控
42、制43</p><p> 3.2.10雜環(huán)替換45</p><p> 3.2.11全自動(dòng)化設(shè)計(jì)與可視化報(bào)告46</p><p><b> 3.3討論47</b></p><p> 第四章打分函數(shù)50</p><p><b> 4.1引言50</b&g
43、t;</p><p> 4.2SCORE 451</p><p> 4.2.1氫鍵計(jì)算51</p><p> 4.2.2鎖鑰匹配56</p><p> 4.2.3數(shù)據(jù)集57</p><p> 4.2.4結(jié)果58</p><p><b> 4.3討論6
44、0</b></p><p> 第五章后篩選62</p><p><b> 5.1引言62</b></p><p> 5.2后篩選方法64</p><p> 5.2.1穩(wěn)定性打分64</p><p> 5.2.2結(jié)構(gòu)匹配分68</p><
45、p> 5.2.3組合篩選模型(Filter)與分子挑選器(Recommender)69</p><p> 5.2.4結(jié)合勢(shì)能面判定71</p><p> 5.2.5MM/PBSA 計(jì)算77</p><p> 5.2.6結(jié)果79</p><p><b> 5.3討論83</b></
46、p><p> 第六章化合物可合成性分析85</p><p><b> 6.1引言85</b></p><p> 6.2內(nèi)置同步合成分析86</p><p> 6.2.1基本原理87</p><p> 6.2.2算法實(shí)現(xiàn)89</p><p> 6.
47、2.3反應(yīng)庫(kù)構(gòu)建95</p><p><b> II</b></p><p> 6.2.4原料庫(kù)構(gòu)建103</p><p> 6.3討論103</p><p> 第七章親環(huán)素 A 抑制劑設(shè)計(jì)105</p><p> 7.1引言105</p><p&
48、gt; 7.2設(shè)計(jì)步驟106</p><p> 7.2.1結(jié)合位點(diǎn)探測(cè)106</p><p> 7.2.2第一輪設(shè)計(jì)108</p><p> 7.2.3第二輪設(shè)計(jì)109</p><p> 7.2.4實(shí)驗(yàn)驗(yàn)證109</p><p> 7.3討論113</p><p&
49、gt; 第八章論文工作總結(jié)115</p><p><b> 參考文獻(xiàn)121</b></p><p><b> 致謝131</b></p><p> 論文期間發(fā)表文章列表:133</p><p><b> 第一章緒論</b></p><p
50、> 1.1 基于結(jié)構(gòu)的藥物設(shè)計(jì)</p><p> 藥物分子設(shè)計(jì)作為化學(xué)、物理學(xué)、生命科學(xué)、計(jì)算機(jī)和信息科學(xué)等幾大學(xué)科 交叉、綜合的產(chǎn)物,于 20 世紀(jì)奠定了發(fā)展基礎(chǔ)。發(fā)展到今天,不僅在理論和方 法上取得了豐碩成果,而且也已邁開實(shí)際應(yīng)用的步伐。目前,隨著人類基因組計(jì) 劃的完成、蛋白質(zhì)組學(xué)迅猛發(fā)展以及大量的疾病相關(guān)基因被發(fā)現(xiàn),使得藥物設(shè)計(jì) 的可用靶標(biāo)分子數(shù)急劇增加;另一方面,計(jì)算機(jī)技術(shù)發(fā)展日新月異,計(jì)算能力
51、得 到極大提高,使得從前由于計(jì)算資源不足而無(wú)法進(jìn)行的藥物分子設(shè)計(jì)變得可行。 在這兩方面的推動(dòng)下,計(jì)算機(jī)輔助藥物設(shè)計(jì)技術(shù)在過(guò)去二十年中取得了巨大進(jìn)展 (陳凱先 and 羅小民, 2000)。</p><p> 早期以結(jié)構(gòu)為基礎(chǔ)的藥物設(shè)計(jì)是通過(guò)對(duì)一系列配體構(gòu)效關(guān)系的分析,間接的 得到靶位點(diǎn)結(jié)構(gòu)信息,然后指導(dǎo)新配體的設(shè)計(jì)。隨著 X-射線衍射、核磁共振技 術(shù)完善和發(fā)展,越來(lái)越多的生物大分子的三維結(jié)構(gòu)被測(cè)定,并直接應(yīng)用到
52、藥物分 子的設(shè)計(jì)上去。位于美國(guó)加州大學(xué)圣地亞哥分校超級(jí)計(jì)算機(jī)中心的蛋白質(zhì)結(jié)構(gòu)數(shù) 據(jù)庫(kù)(PDB)是目前最大的蛋白質(zhì)三維結(jié)構(gòu)信息數(shù)據(jù)庫(kù)(Berman, Westbrook et al., 2000)(http://www.rcsb.org),數(shù)據(jù)庫(kù)的數(shù)據(jù)量從 1993 年以來(lái)增長(zhǎng)趨勢(shì)不斷加速。 PDB 的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)豐富準(zhǔn)確,是絕大多數(shù)計(jì)算機(jī)輔助藥物設(shè)計(jì)的直接出發(fā) 點(diǎn)。</p><p> 基于結(jié)構(gòu)的藥物設(shè)計(jì)具有非
53、常明確的設(shè)計(jì)目標(biāo),效率遠(yuǎn)高于傳統(tǒng)的藥物發(fā)現(xiàn) 過(guò)程。有人曾形象的用鎖和鑰匙關(guān)系來(lái)說(shuō)明基于結(jié)構(gòu)藥物設(shè)計(jì)的優(yōu)越性:傳統(tǒng)的 藥物發(fā)現(xiàn)好比是大量制造鑰匙,以便尋找到一把正好能打開位置形狀的鎖的鑰匙; 而基于結(jié)構(gòu)的藥物設(shè)計(jì)是先研究鎖的形狀,在此基礎(chǔ)上來(lái)尋找鑰匙。為了尋找這 些鑰匙,通常有兩種策略,即數(shù)據(jù)庫(kù)搜索法和結(jié)構(gòu)生成法,前者可以看做在大量 鑰匙中找合適的鑰匙,后者則是重新打造一把合適的鑰匙。自從九十年代以來(lái), 二十年間發(fā)展了大量基于結(jié)構(gòu)藥物設(shè)計(jì)
54、程序,設(shè)計(jì)策略多種多樣,但最為基本的</p><p> 仍然是數(shù)據(jù)庫(kù)搜索法里面的三維數(shù)據(jù)庫(kù)搜索(Docking)以及結(jié)構(gòu)生成法中的生 長(zhǎng)法(Growing)和連接法(Linking)。</p><p> 三維數(shù)據(jù)庫(kù)搜索根據(jù)結(jié)合位點(diǎn)的物化性質(zhì)與幾何形狀,嘗試將巨大的有機(jī)化 合物分子庫(kù)的每一個(gè)分子與結(jié)合位點(diǎn)進(jìn)行匹配。由于數(shù)據(jù)庫(kù)中的分子是商品化的 化合物,可以直接購(gòu)買,從而可以較快地進(jìn)入生物
55、測(cè)試階段,提高新藥開發(fā)的效率。 I.D.Kuntz 開發(fā)的 DOCK(Kuntz, Blaney et al., 1982; Kuntz, 1992)程序就是典型代 表。</p><p> DOCK 程序首先對(duì)受體結(jié)合位點(diǎn)進(jìn)行分析,定位結(jié)合部位,然后在結(jié)合部位 中以不同大小的圓球填充,而這些圓球也就構(gòu)成結(jié)合部位的負(fù)像,也即是結(jié)合部 位最大的容納空間。然后 DOCK 順次選取數(shù)據(jù)庫(kù)中的分子,進(jìn)行旋轉(zhuǎn)、平移等 方法
56、尋找可能的結(jié)合方式,然后根據(jù)打分函數(shù)對(duì)其取向和位置進(jìn)行優(yōu)化。打分函 數(shù)一般考慮的是范德華相互作用和靜電相互作用,可以通過(guò)分子力學(xué)公式進(jìn)行計(jì) 算。據(jù)文獻(xiàn)報(bào)道,DOCK 程序的成功率可以達(dá)到 2~20%,并且可以得到?M 級(jí)別 的化合物(DesJarlais, Seibel et al., 1990)。隨著基于三維數(shù)據(jù)庫(kù)搜索算法的大量成 功,這種方法已經(jīng)成為基于結(jié)構(gòu)藥物設(shè)計(jì)的主流。</p><p> 近十年來(lái),結(jié)構(gòu)
57、生成法(也即全新藥物設(shè)計(jì))越來(lái)越得到人們的重視,它根據(jù) 受體結(jié)合部位的幾何形狀和物化性質(zhì),由計(jì)算機(jī)自動(dòng)構(gòu)建出形狀互補(bǔ)、性質(zhì)匹配 的新分子,使其與受體活性部位很好地契合,從而有望成為新的先導(dǎo)化合物或者 抑制劑。全新藥物設(shè)計(jì)課題得到實(shí)驗(yàn)驗(yàn)證的數(shù)目在逐年增加(由圖 1.1 ) (Kutchukian and Shakhnovich, 2010)。</p><p> 圖 1.1 2005 至 2010 年間全新藥物設(shè)
58、計(jì)結(jié)果得到實(shí)驗(yàn)驗(yàn)證的報(bào)道。</p><p> (Kutchukian and Shakhnovich, 2010)</p><p> 最近二十年,已經(jīng)有包括 HSITE/2D(Danziger and Dean, 1989) , LEGEND(Nishibata and Itai, 1991), LUDI(Böhm, 1992), SPROUT(Gillet, Johnso
59、n et al., 1993), HOOK(Eisen, Wiley et al., 1994), PRO LIGAND(Clark, Frenkel et al.,</p><p> 1995),GrowMol(Bohacek and McMartin, 1994), PRO-LIGAND(Clark, Frenkel et al.,</p><p> 1995), CONCERTS
60、(Pearlman and Murcko, 1996), RASSE(Luo, Wang et al., 1996), SmoG(DeWitte and Shakhnovich, 1996),LeapFrog (Tripos Inc., St. Louis, MO, http://www.tripos.com.), DycoBlock(Liu, Duan et al., 1999),TOPAS(Schneider, Lee et al.
61、, 2000),LigBuilder(Wang, Gao et al., 2000),CoG(Brown, McKay et al., 2004), LEA3D(Douguet, Munier-Lehmann et al., 2005),F(xiàn)LUX(Fechner and Schneider, 2006; Fechner and Schneider, 2007) , MHC-Ant(Hiss, Bredenbeck et al., 200
62、7) , BOMB(Barreiro, Kim et al., 2007)</p><p> COLIBREE(Hartenfeller, Proschak et al., 2008),MEGA(Nicolaou, Apostolakis et al., 2009),AutoGrow(Durrant, Amaro et al., 2009),e-LEA3D(Douguet, 2010)
63、以及 BIBuilder(Teodoro and Muegge, 2011)等大量程序被發(fā)展出來(lái)。 Gisbert Schneider、 Hartenfeller、Jan A. Hiss 等人對(duì)當(dāng)前的全新藥物設(shè)計(jì)方法進(jìn)行較為細(xì)致的分類和 綜述(Schneider and Fechner, 2005; A Hiss, Hartenfeller et al., 2010)。</p><p> 從分子構(gòu)建單元來(lái)說(shuō),包
64、括基于原子和基于片段兩類。原子是化學(xué)分子的基 元,構(gòu)建、發(fā)展新的分子也即是添加新的基元的過(guò)程。較為早期的全新設(shè)計(jì)方法 有很多是直接將原子拼接到目標(biāo)分 子上以獲得新的結(jié)構(gòu),包括 LEGEND(Nishibata and Itai, 1991)、CONCERTS(Pearlman and Murcko, 1996)等。 然而,研究者逐漸發(fā)現(xiàn),使用原子作為構(gòu)建單元雖然能夠能夠有更大的多樣性, 但很多時(shí)候未必具有化學(xué)合理性,同時(shí)在分子穩(wěn)定性方面
65、也很有問(wèn)題。Danziger 等人最早在 HSITE/2D(Danziger and Dean, 1989)使用了片段作為構(gòu)建基元代替單 個(gè)的原子。通常來(lái)說(shuō),片段法使用的分子片段源于化學(xué)分子中的常見子結(jié)構(gòu),同 樣也可以看做是化學(xué)分子的基元。使用片段法構(gòu)建分子,因?yàn)樗铇?gòu)建的次數(shù)大 幅度減少,很大程度上緩解了原子法構(gòu)建分子化學(xué)合理性低的問(wèn)題。此外,一些 計(jì)算方法雖然并不直接構(gòu)建分子,而是通過(guò)片段替換或者突變的方法演化分子結(jié) 構(gòu),例如 TO
66、PAS(Schneider, Lee et al., 2000),從本質(zhì)上來(lái)說(shuō)也可以看做是片段法。</p><p> 從約束條件來(lái)說(shuō),分為基于受體和基于配體兩類。使用打分函數(shù)來(lái)對(duì)設(shè)計(jì)的 分子進(jìn)行評(píng)價(jià)是全新設(shè)計(jì)過(guò)程的核心步驟,需要一種方法來(lái)分辨設(shè)計(jì)分子的優(yōu)劣, 并以此來(lái)指引設(shè)計(jì)的方向。打分函數(shù)實(shí)際上反映的就是設(shè)計(jì)結(jié)果對(duì)約束條件適應(yīng) 度的評(píng)估。</p><p> 二十年前,全新藥物設(shè)計(jì)方法
67、中所使用的約束條件僅僅局限于受體的信息 (Lewis, Roe et al., 1992; Rotstein and Murcko, 1993; Tschinke and Cohen, 1993),不 過(guò)很快就有更為復(fù)雜的方法發(fā)展出來(lái)。基本上來(lái)說(shuō),這種基于受體的打分函數(shù)主 要分為三類:基于力場(chǎng)的打分函數(shù)、經(jīng)驗(yàn)打分函數(shù)以及基于知識(shí)的打分函數(shù), 本質(zhì)上來(lái)說(shuō),都是對(duì)結(jié)合自由能的估算方法。其中,基于力場(chǎng)的打分函數(shù)從計(jì)算 上來(lái)看效率較低,LEG
68、END(Nishibata and Itai, 1991),是第一個(gè)在全新設(shè)計(jì)中使用</p><p> 力場(chǎng)來(lái)作打分函數(shù)的方法,然而這么多年來(lái),使用力場(chǎng)作為打分函數(shù)的方法只有 GroupBuild(Rotstein and Murcko, 1993),Concerts(Pearlman and Murcko, 1996), DycoBlock(Liu, Duan et al., 1999)等寥寥幾個(gè)。LUDI(
69、Böhm, 1992)是最早在全新設(shè) 計(jì)中使用基于經(jīng)驗(yàn)打分函數(shù)的方法。經(jīng)驗(yàn)打分函數(shù)是把與相互作用的能量拆分為 若干因素,然后通過(guò)對(duì)已知結(jié)合能的訓(xùn)練集進(jìn)行線性回歸,擬合出各個(gè)因素的貢 獻(xiàn),也即是權(quán)重,用以構(gòu)建打分函數(shù)。雖然因?yàn)閿M合數(shù)據(jù)集質(zhì)量的限制,基于經(jīng) 驗(yàn)的打分函數(shù)比較容易出現(xiàn)系統(tǒng)偏差,但其高速的特性使得其在全新藥物設(shè)計(jì)方 面 有 了 較 廣 泛 的 應(yīng) 用 , 例 如 CONCEPTS(Pearlman and Murcko
70、, 1993),GrowMol(Bohacek and McMartin, 1994),LigBuilder(Wang, Gao et al., 2000) 等等。近年來(lái)基于知識(shí)的打分函數(shù)在虛擬篩選方面運(yùn)用較多,但到目前為止,在 全新設(shè)計(jì)領(lǐng)域僅有 SmoG(D</p><p> 如果不知道目標(biāo)受體的三維結(jié)構(gòu)信息,但知道一些配體的結(jié)構(gòu),則可以考慮 使用基于配體的打分函數(shù)。PRO LIGAND(Clark, Fre
71、nkel et al., 1995)利用配體三 維信息進(jìn)行藥效團(tuán)模型預(yù)測(cè)并獲取一個(gè)較為粗糙的受體模型,并以模型作為新的 約束條件。其實(shí)這仍然是用基于受體的打分函數(shù)的思路來(lái)構(gòu)建基于配體的打分函 數(shù)。我們知道,對(duì)基于受體的打分函數(shù)來(lái)說(shuō),必須考慮分子具體的構(gòu)象,相比之 下,基于配體的打分函數(shù)僅需考慮分子的拓?fù)浣Y(jié)構(gòu)。因此,另一種方法是只考慮 分子的二維結(jié)構(gòu),通過(guò)計(jì)算分子間的相似性構(gòu)建打分函數(shù),例如 TOPAS(Schneider,</p&
72、gt;<p> Lee et al., 2000),CoG(Brown, McKay et al., 2004)。 因?yàn)閷?duì)從頭設(shè)計(jì)來(lái)說(shuō),分子的每一步構(gòu)建,都會(huì)有大量的可能性,因此必然</p><p> 會(huì)面對(duì)組合爆炸的問(wèn)題。因此需要使用合理的搜索策略,在盡量短的時(shí)間內(nèi)獲得</p><p> 盡量?jī)?yōu)秀的解?;氐角懊嬗懻摰姆诸悊?wèn)題,全新設(shè)計(jì)中構(gòu)象搜索策略分類較多, 較為簡(jiǎn)單
73、的包括深度優(yōu)先搜索、廣度優(yōu)先搜索以及隨機(jī)搜索,此外大部分全新藥 物設(shè)計(jì)方法都運(yùn)用遺傳算法來(lái)進(jìn)行優(yōu)化。</p><p> 深度優(yōu)先搜索,顧名思義,指的是搜索過(guò)程中每一步搜索都僅考慮一種可能 性,然后不斷深入直到結(jié)束。使用深度優(yōu)先搜索,即使每一步都是當(dāng)前狀態(tài)的最 優(yōu)解(局部最優(yōu)解),也不能保證搜索過(guò)程能夠到達(dá)全局最優(yōu)解。不過(guò)這種方法 的優(yōu)點(diǎn)是大大減小了搜索空間。使用深度優(yōu)先搜索的全新設(shè)計(jì)程序包括 GroupBuil
74、d(Rotstein and Murcko, 1993),SPROUT(Gillet, Johnson et al., 1993)等。</p><p> 廣度優(yōu)先搜索則是先確定一個(gè)水平的搜索面,然后在這個(gè)平面中順次搜索每 個(gè)位置的最優(yōu)解,最終合起來(lái)就是整個(gè)搜索面的最優(yōu)解,這種算法實(shí)際上搜索了 所有的可能性,是一種遍歷算法。一般來(lái)說(shuō)只有小規(guī)模的問(wèn)題才會(huì)使用廣度優(yōu)先 搜索,將之應(yīng)用于全新設(shè)計(jì)方法,則必須先減小問(wèn)題的
75、規(guī)模。比如在連接算法中, 幾個(gè)關(guān)鍵片段已經(jīng)被固定放置,搜索空間大大減小,則這種遍歷算法也變得可行。 RASSE(Luo, Wang et al., 1996)使用了一種改進(jìn)的廣度優(yōu)先算法,也就是在每一步 中只考慮 100 個(gè)最優(yōu)解,使得搜索空間變小。SPROUT(Gillet, Johnson et al., 1993) 通過(guò) A-star 算法估算當(dāng)前位置搜索到結(jié)束的代價(jià),然后進(jìn)行深度優(yōu)先算法的計(jì)算, 可以看做一種廣度優(yōu)先和深度優(yōu)先的
76、混合算法。</p><p> 另一種簡(jiǎn)單的搜索方法是隨機(jī)采樣,完全的隨機(jī)采樣也稱為蒙特卡洛搜索, LEGEND(Nishibata and Itai, 1991)就使用了這種搜索方法。蒙特卡洛方法也可以 和模擬退火結(jié)合,在分子改變時(shí)根據(jù)分子的打分判斷接不接受這個(gè)改變。如果這 個(gè)改變使得打分提升,則直接接受,如果使得打分下降,則只以一定的概率接受, 這個(gè)概率取決于打分下降的幅度,幅度越大,概率越低。CONCEPT
77、S(Pearlman and Murcko, 1993)是第一個(gè)使用蒙特卡洛模擬退火的全新設(shè)計(jì)方法,后來(lái)也有 GrowMol(Bohacek and McMartin, 1994),CONCERTS(Pearlman and Murcko, 1996), 等方法繼續(xù)使用這種搜索算法。</p><p> 遺傳算法(Holland, 1975)是全新設(shè)計(jì)方法里面運(yùn)用較多的算法,它是基于 1895 年達(dá)爾文提出的生
78、物進(jìn)化論而發(fā)展出來(lái)的一種優(yōu)化方法。達(dá)爾文的進(jìn)化論 指出,自然選擇是生物物種進(jìn)化的動(dòng)力。遺傳算法模仿生物進(jìn)化中,基因間進(jìn)行 優(yōu)勝劣汰適者生存的斗爭(zhēng),不斷適應(yīng)環(huán)境的特性,實(shí)現(xiàn)對(duì)整個(gè)種群的優(yōu)化。遺傳 算法中把分子抽象為一個(gè)個(gè)的基因,然后根據(jù)打分函數(shù),判斷分子在環(huán)境中的適</p><p> 應(yīng)度。因?yàn)檫m應(yīng)度高的分子在種群中繁衍速度高于適應(yīng)度低的分子,因此隨著一 代代的繁衍下去,最終淘汰掉差的分子,保留優(yōu)勢(shì)的分子。使用這
79、種策略的方法 有 LigBuilder(Wang, Gao et al., 2000),TOPAS(Schneider, Lee et al., 2000),等等。</p><p> 分子構(gòu)建方式也多種多樣,包括生長(zhǎng)法,連接法,動(dòng)力學(xué)模擬,分子對(duì)接以 及隨機(jī)法等。但占據(jù)主流的還是片段生長(zhǎng)法以及片段連接法。</p><p> 生長(zhǎng)法是先將起始片段置入目標(biāo)位置,然后在其基礎(chǔ)上逐步添加新的片
80、段或 原子,直到具有足夠的大小或者長(zhǎng)滿了結(jié)合位點(diǎn)。片段連接法是將多個(gè)起始片段 置入目標(biāo)位置,然后在其上逐步添加新片段或原子,以使得這些起始片段連接成 一個(gè)整體。起始片段可以源于拆分已知抑制劑、分子對(duì)接、基于 NMR 或 X-ray 的小片段篩選,甚至可以由用戶自己創(chuàng)作。然后從一個(gè)分子片段庫(kù)中提取片段, 取代起始片段上的氫原子,并對(duì)片段進(jìn)行構(gòu)象優(yōu)化,作為下一步生長(zhǎng)的起始片段。 連接法在片段生長(zhǎng)方面與生長(zhǎng)法相同,但是會(huì)嘗試將靠近的片段進(jìn)行融
81、合或者連 接。包括 LEGEND(Nishibata and Itai, 1991),LUDI(Böhm, 1992),LigBuilder(Wang, Gao et al., 2000),CoG(Brown, McKay et al., 2004),AutoGrow(Durrant, Amaro et al., 2009),BOMB(Barreiro, Kim et al., 2007)等大量程序都屬于這兩類方法。</
82、p><p> 全新設(shè)計(jì)方法往往很容易產(chǎn)生新的結(jié)構(gòu)類型,但由于所設(shè)計(jì)的化合物需要進(jìn) 行合成,有時(shí)甚至是全合成,往往有很大難度。這樣一來(lái),設(shè)計(jì)出的分子無(wú)法進(jìn) 行實(shí)驗(yàn)也就失去了意義。同時(shí),即使是合成較容易合成的分子,時(shí)間與經(jīng)濟(jì)成本 仍然遠(yuǎn)高于直接購(gòu)買已有分子。受限于這個(gè)原因,使用全新設(shè)計(jì)方法所能合成的 分子數(shù)非常有限,因此還必須保證設(shè)計(jì)結(jié)果的準(zhǔn)確性。全新藥物設(shè)計(jì)方法發(fā)展至 今,依然沒(méi)有很好的解決這兩個(gè)關(guān)鍵問(wèn)題,因此,本文
83、嘗試發(fā)展新的方法,降低 設(shè)計(jì)分子的復(fù)雜度,以利于進(jìn)行實(shí)驗(yàn)合成,同時(shí)盡量提高設(shè)計(jì)的成功率。</p><p> 圖 1.2分子對(duì)接與全新設(shè)計(jì)的比較</p><p> 1.2 本論文的工作設(shè)想</p><p> 如前所述,與虛擬篩選相比,全新藥物設(shè)計(jì)方法有著多方面的優(yōu)勢(shì)。特別是, 采用全新藥物設(shè)計(jì)方法,理論上能夠直接得到納摩爾甚至皮摩爾級(jí)活性的化合物, 省去虛擬篩
84、選方法得到低活性片段后再反復(fù)進(jìn)行優(yōu)化的步驟,而這個(gè)步驟在基于 虛擬篩選方法的藥物設(shè)計(jì)階段中占據(jù)了最大的比重。但是,雖然全新藥物設(shè)計(jì)方 法有著諸多優(yōu)點(diǎn),但與虛擬篩選方法在近二十年間獲得的巨大成功相比,全新藥 物設(shè)計(jì)方法更多的還是停留在一個(gè)輔助方法的地位,少有成功的案例。</p><p> 本論文工作的核心是發(fā)展一個(gè)完整的全新藥物設(shè)計(jì)系統(tǒng),對(duì)全新藥物設(shè)計(jì)方 法的各個(gè)環(huán)節(jié)進(jìn)行針對(duì)性的優(yōu)化,最終目標(biāo)是希望能將全新藥物設(shè)
85、計(jì)方法推入實(shí) 用階段。一個(gè)藥物設(shè)計(jì)系統(tǒng)所涵蓋的范圍非常廣泛,我們不可能也沒(méi)有必要獨(dú)立 開發(fā)所有環(huán)節(jié)。本文在借鑒一些優(yōu)秀方法的同時(shí),著重于針對(duì)全新藥物設(shè)計(jì)方法 的特點(diǎn),對(duì)其進(jìn)行優(yōu)化。本文的主要優(yōu)化目標(biāo)如下:</p><p> 1.優(yōu)化結(jié)合位點(diǎn)探測(cè)方法,為全新藥物設(shè)計(jì)提供更精確的結(jié)合位點(diǎn)幾何形</p><p> 狀以及精確的邊界劃分。</p><p> 2.
86、優(yōu)化分子設(shè)計(jì)算法,使全新藥物設(shè)計(jì)方法真正具備無(wú)限的創(chuàng)造性,而不 再受限于任何起始結(jié)構(gòu)。</p><p> 3. 優(yōu)化打分函數(shù),全新藥物設(shè)計(jì)對(duì)低假陽(yáng)性率有非常高的需求,因此主要 對(duì)引起假陽(yáng)性的因素進(jìn)行優(yōu)化,盡量減少預(yù)測(cè)偏差。</p><p> 4. 優(yōu)化后篩選方法,全新藥物設(shè)計(jì)方法非常低通量,因此必須過(guò)濾高風(fēng)險(xiǎn) 分子,并進(jìn)行綜合評(píng)價(jià)以挑選最具潛力的分子進(jìn)行合成。</p>
87、;<p> 5.優(yōu)化可合成性分析,簡(jiǎn)化分析系統(tǒng)并大幅度提高分析速度,以適應(yīng)全新 藥物設(shè)計(jì)的高計(jì)算量。</p><p> 第二章蛋白質(zhì)配體結(jié)合位點(diǎn)預(yù)測(cè)</p><p><b> 2.1 引言</b></p><p> 蛋白質(zhì)是執(zhí)行許多生命過(guò)程的重要分子,比如酶的催化、信號(hào)的轉(zhuǎn)導(dǎo)和代謝 調(diào)節(jié)等。蛋白質(zhì)分子表面的結(jié)構(gòu)、物化屬
88、性對(duì)其行使生物功能有著重要的作用。 起催化小分子作用的蛋白質(zhì)表面通常都具備一個(gè)疏水性的凹陷部位(后面稱為口 袋),作為結(jié)合小分子并行使催化功能的催化中心。普通的藥物結(jié)合位點(diǎn)一般在 蛋白的活性部位,比如酶的催化位點(diǎn)、受體的配體結(jié)合位點(diǎn)等。因此,蛋白質(zhì)的 小分子結(jié)合位點(diǎn)是藥物設(shè)計(jì)以及研究蛋白功能的關(guān)鍵。結(jié)構(gòu)基因組學(xué)和高通量結(jié) 構(gòu)生物學(xué)領(lǐng)域的飛速進(jìn)展使得已知蛋白結(jié)構(gòu)數(shù)量大大增加(Congreve, Murray et al., 2005).
89、雖然可以得到蛋白質(zhì)與其配體結(jié)合的復(fù)合物晶體結(jié)構(gòu),但因?yàn)槠渑潴w 往往并不能完全占據(jù)結(jié)合位點(diǎn),直接根據(jù)配體來(lái)描述結(jié)合位點(diǎn)并不能得到精確的 結(jié)合位點(diǎn)信息。同時(shí),有很多蛋白質(zhì)的功能具有多樣性,有多個(gè)底物結(jié)合位點(diǎn), 或者在一個(gè)底物結(jié)合位點(diǎn)中可以結(jié)合多種底物,而這些底物占據(jù)區(qū)域只有部分重 合,這種現(xiàn)象被稱作蛋白的"moonlighting"(Jeffery, 1999)。由實(shí)驗(yàn)得到復(fù)合物結(jié)構(gòu) 信息,并不足以幫助我們確認(rèn)是否還有其
90、他可能的"moonlighting"</p><p> 蛋白結(jié)合位點(diǎn)的探測(cè)與預(yù)測(cè)程序有許多,近年來(lái)發(fā)展了大量不同的方法,并 且已經(jīng)有了幾篇綜述進(jìn)行歸納總結(jié)(Laurie and Jackson, 2006; Henrich, Salo-Ahen</p><p> et al., 2010; Leis, Schneider et al., 2010)。這些方法主要可以
91、分為兩類:(a) 基于結(jié) 構(gòu)的和 (b)基于能量的。 基于結(jié)構(gòu)的方法往往速度較快,而基于能量的方法在</p><p> 探測(cè)分子結(jié)合位點(diǎn)時(shí)更有優(yōu)勢(shì)?;诮Y(jié)構(gòu)的探測(cè)方法主要有 POCKET(Levitt and Banaszak, 1992), SurfNet(Laskowski, 1995), APROPOS(Peters, Fauck et al., 1996), LIGSITE(Hendlich, Ripp
92、mann et al., 1997), PASS(Brady and Stouten, 2000), LigandFit(Venkatachalam, Jiang et al., 2003), CASTp(Dundas, Ouyang et al., 2006),</p><p> 以及 fpocket(Le Guilloux, Schmidtke et al., 2009);而基于能量的方法主要有&
93、lt;/p><p> GRID(Goodford, 1985), Pocket finder(An, Totrov et al., 2005), Q-SiteFinder(Laurie and Jackson, 2005)以及 SiteMap(Halgren, 2007), 去溶劑化自由能模型(Coleman, Salzberg et al., 2006) 以及溶劑分布模型(Landon, Lancia Jr et
94、 al., 2007)等。 另外, Roterman 及其合作者報(bào)道了一種基于疏水性空間分布的模糊油滴探測(cè)模型 (Brylinski, Kochanczyk et al., 2007)。 這些方法考慮了結(jié)合位點(diǎn)的不同屬性,例如 體積、疏水性、氫鍵、勢(shì)能、溶劑可及表面、去溶劑化能或者結(jié)合位點(diǎn)殘基的組 成,選擇不同的描述屬性也會(huì)影響預(yù)測(cè)的結(jié)果。本論文所發(fā)展的蛋白質(zhì)表面結(jié)合 位點(diǎn)探測(cè)方法 Cavity,主要基于幾何形狀分析,同時(shí)兼顧考慮氫鍵
95、、疏水性屬性, 并計(jì)算 CavityScore 對(duì)結(jié)合位點(diǎn)進(jìn)行評(píng)價(jià)。</p><p><b> 2.2 計(jì)算方法</b></p><p> 2.2.1深度的定義及應(yīng)用 蛋白質(zhì)的表面是一個(gè)凸凹不平的不光滑曲面,沒(méi)有簡(jiǎn)單的方法可以加以描述。</p><p> 因此在這樣一個(gè)不光滑曲面上探測(cè)口袋,關(guān)鍵就在于如何定義一個(gè)口袋和如何確 定它的邊界
96、。在這里本文引入一個(gè)深度的概念。在使用可視化程序查看和分析蛋 白結(jié)合位點(diǎn)時(shí),深度往往是一個(gè)直覺(jué)性的概念,無(wú)法使用準(zhǔn)確的方式描述。目前 文獻(xiàn)中有兩種深度定義方法,一是把殘基的某個(gè)代表性原子與最近的表面水分子 的距離定義為殘基的深度(Chakravarty and Varadarajan, 1999), 二是定義為一個(gè)非 氫原子與其最近的溶劑可及表面原子的距離(Pintar, Carugo et al., 2003; Varrazzo,&l
97、t;/p><p> Bernini et al., 2005)。這兩種方法定義的都是定義原子在蛋白內(nèi)部的深度,主要用 于研究蛋白的折疊與穩(wěn)定性,它們與蛋白、殘基以及原子屬性相關(guān),可以反映平 均蛋白結(jié)構(gòu)域體積,蛋白穩(wěn)定性,復(fù)合物結(jié)合自由能,氨基酸殘基疏水性,殘基 保守性以及氨基質(zhì)子交換率等等方面(Pintar, Carugo et al., 2003)。 但在判定結(jié)合 位點(diǎn)時(shí),所需要定義的深度是用于描述結(jié)合位點(diǎn)的凹陷
98、程度。例如(Del Carpio,</p><p> Takahashi et al., 1993)直接使用蛋白原子到蛋白質(zhì)心的距離來(lái)定義深度的變化。 雖然許多文獻(xiàn)中認(rèn)為深度是比溶劑可及表面更為重要的信息,然而這些方法</p><p> 實(shí)際上并不能很好的描述深度這個(gè)概念,結(jié)果并不盡如人意。Coleman 和 Shape 定義了 Travel Depth 來(lái)描述結(jié)合位點(diǎn)以及通道的深度(
99、Coleman and Sharp, 2006), 它們定義一個(gè)溶劑分子從蛋白表面點(diǎn)到另一個(gè)選定的參考表面點(diǎn)之間的距離為 這個(gè)表面點(diǎn)的深度。這種深度定義方法能夠反映結(jié)合位點(diǎn)中的原子或殘基到結(jié)合 位點(diǎn)外的表面點(diǎn)的距離,可以看一定程度上反映了深度的信息。然而,這種方法 得到的深度實(shí)際上結(jié)合位點(diǎn)開口處邊界到結(jié)合位點(diǎn)中心沿著蛋白表面的長(zhǎng)度,是 一個(gè)三維面上的距離,而深度實(shí)際上應(yīng)該指結(jié)合位點(diǎn)開口的界面與結(jié)合位點(diǎn)最深 處的一個(gè)三維空間中的距離。結(jié)合
100、位點(diǎn)最深處可以被定義為距離開口界面最遠(yuǎn)的 位置,所以一旦定義了開口界面,深度就很容易定義。因此,深度的定義可以轉(zhuǎn) 換為如何探測(cè)結(jié)合位點(diǎn)開口界面的問(wèn)題。</p><p> 2.2.2球擦除法 為了定義結(jié)合位點(diǎn)的開口界面,我們不能局限于蛋白表面的殘基,而必須直</p><p> 接考慮結(jié)合位點(diǎn)的空間幾何構(gòu)型。因此本文發(fā)展了一種球擦除算法,直接從空間 幾何形狀上確定結(jié)合位點(diǎn)的邊界以及開口界
101、面。為了便于程序處理,先給整個(gè)蛋 白質(zhì)分子占據(jù)的空間打上網(wǎng)格,因?yàn)榈鞍踪|(zhì)分子的晶體結(jié)構(gòu)分辨率一般大于 2.0Å, 網(wǎng)格的邊長(zhǎng)定為 0.5Å 即可。生成網(wǎng)格后,程序使用一個(gè)水分子(半徑定為 1.4Å)</p><p> 作為探針?lè)旁诿恳粋€(gè)格點(diǎn)上,檢查它們所處的位置。這里蛋白原子的屬性由 Tripos 力場(chǎng)(Clark, Cramer III et al., 1989)賦值。這時(shí)會(huì)出現(xiàn)
102、兩種情況:一是格點(diǎn) 上的水分子探針與蛋白質(zhì)原子(忽略氫原子)之間發(fā)生范德華碰撞,說(shuō)明格點(diǎn)被 蛋白質(zhì)原子占據(jù),則把這個(gè)格點(diǎn)標(biāo)記為 E(Excluded),二是探針沒(méi)有發(fā)生碰撞,</p><p> 則標(biāo)記為 V(Vacant)。與 V 格點(diǎn)相鄰的 E 格點(diǎn)組成蛋白質(zhì)的表面,改標(biāo)記為 S</p><p> ?。⊿urface)。(見圖 2.1)。使用水分子作為探針探測(cè)每一個(gè)格點(diǎn)與蛋白質(zhì)原子之間
103、 的相互作用,可以避免蛋白質(zhì)原子間形成的小孔隙對(duì)蛋白表面情況的影響,實(shí)際 得到的是蛋白質(zhì)溶劑可及表面。</p><p> 圖 2.1 結(jié)合位點(diǎn)處的網(wǎng)格標(biāo)記</p><p> 程序生成一個(gè)半徑為 6.0Å 的球,將距離蛋白表面距離大于 5.5Å 范圍的格點(diǎn) 都定義為可能的球心,然后 “擦除”掉所有球可及的 V 格點(diǎn)(圖 2.2)。</p><p&g
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 橋梁博士論文
- 博士論文評(píng)語(yǔ)模板
- 博士論文開題報(bào)告
- 博士論文如何構(gòu)思
- 博士論文——大學(xué)電腦技巧
- 優(yōu)秀博士論文 環(huán)境 列表
- 《優(yōu)秀博士論文》doc版
- 博士論文答辯-ippc
- 博士研究生博士論文開題報(bào)告
- 陳瑞華如何做好博士論文
- 河海大學(xué)博士論文模板
- 博士論文的選題與寫作
- 13205.tate博士論文介紹
- 博士論文開題科技查新
- 感人的博士論文致謝詞
- 馮軍旗-中縣干部-北大博士論文
- 博士論文評(píng)閱專家推薦表
- 2011級(jí)博士論文中期答辯
- 碩士論文和博士論文的關(guān)系來(lái)源
- 32位risc微處理器設(shè)計(jì)研究博士論文
評(píng)論
0/150
提交評(píng)論