- 智海芯算
- 介绍、教程
AutoDock软件基础培训
Autodock是一款开源的分子模拟软件,最主要应用于执行配体—蛋白分子对接。它由Scripps研究所的Olson实验室开发与维护,工作原理大致为:
任何对接计算都有两个相互矛盾的方面需要平衡:在尽可能精准的计算与合理(有限)的计算资源之间达到一个平衡。理想的步骤是通过搜索整个系统可能的自由度,在底物和目标蛋白的结合能中找到全局能量极小值。然而这样的工作只能在大型的工作站上实现,并且耗费和结构生物学家进行晶体结构修饰相当的时间。为了解决这一问题,很多对接软件简化了对接的步骤。Autodock 通过两种方法的结合使用解决了以上的问题:快速的基于格点能量的计算方法(rapid grid-based energy evaluation)和有效的扭转自由度搜索方法(efficient search of torisional freedom)。
AutoDock软件由 AutoGrid 和 AutoDock两个程序组成。其中 AutoGrid 主要负责格点中相关能量的计算,而 AutoDock 则负责构象搜索及评价。
AutoDock 在早期版本中使用的是模拟退火算法(Simulated Annealing Algorithm)来寻找配体与受体最佳的结合位置状态,而从 3.0 版本开始使用一种改良的遗传算法,即拉马克遗传算法(Lamarckian Genetic Algorithm,LGA)。测试结果表明,LGA 比传统的遗传算法和模拟退火具有更高的效率。在 LGA 方法中,作者把遗传算法和局部搜索(Local search)结合在一起,遗传算法用于全局搜索,而局部搜索用于能量优化。LGA 算法引入了拉马克的遗传理论,这个操作过程如图1。
同时在AutoDock中配体和受体之间结合能力采用能量匹配来评价。在1.0和2.0版本中,能量匹配得分采用简单的基于AMBER力场的非键相互作用能。非键相互作用来自于三部分的贡献:范德华相互作用,氢键相互作用以及静电相互作用。而在3.0之后的版本中AutoDock提供了半经验的自由能计算方法来评价受体和配体之间的能量匹配。
为了加快计算速度,AutoDock 采用格点对接的方法,但与 DOCK中格点对接的处理方法有明显的区别。DOCK 中,格点上保存的不是能量,而是仅与受体有关的特征量。而在 AutoDock 中,格点上保存的是探针原子和受体之间的相互作用能。
对于范德华相互作用的计算, 每个格点上保存的范德华能量的值的数目与要对接的配体上的原子类型(表 3)的数目一样。如果一个配件中含有 C、O 和 H 三种原子类型,那么在每个格点上就需要用三个探针原子来计算探针原子与受体之间的范德华相互作用值。当配体和受体进行分子对接时,配体中某个原子和受体之间的相互作用能通过周围 8 个格点上的这种原子类型为探针的格点值用内插法得到。
静电相互作用的计算采用了一个静电势格点,在格点上储存受体分子的静电势。当配体和受体分子对接时,某个原子和受体之间的静电相互作用能通过周围格点上静电势以及原子上的部分电荷就可以计算得到。
计算氢键相互作用时,格点的处理和范德华相互作用有点类似,每个格点上需要保存配体分子中所有氢键给体与氢键受体之间的相互作用能量,而且这些能量都是在氢键在最佳情况下的氢键能量值。
以上格点能量的计算都是由 AutoDock 中的 AutoGrid 程序计算得出的,AutoDock 格点对接示意图如图2所示。AutoDock 格点对接的基本流程如下:首先,用围绕受体活性位点的氨基酸残基形成一个范围更大的 Box,然后用不同类型的原子作为探针(probe)进行扫描,计算格点能量,此部分任务由 AutoGrid 程序完成。然后 AutoDock 程序对配体在 Box 范围内进行构象搜索(conformational search),最后根据配体的不同构象(conformation),方向(orientation)、位置(position)及能量(energy)进行评分(scoring),最后对结果进行排序(ranking)。