(转载) 分子动力学攻略
动力学系列之八(如何设计动力学)
今天下午没有课程,可以闲下来写点东西,上面谈了那么多技术,说到底,应该为了解决问题.动力学的课题我大大小小也作了不少,当然目的不同,设计也不同.这次我讲一下怎么设计动力学的整个课题,主要是思路方面,细节就不谈了,例子就讲我在JACS发过的一篇文章(J. AM. CHEM. SOC., 127, 11709-11719 ,2005),希望作的不好的地方大家指正
这是一个典型的配体诱导open-closed运动的文章,为后面的抑制剂设计打下了基础,在这个机理上,获得了36/60的活性化合物,最好的几个正在结构改造中(有的是相当的麻烦啊,痛啊).设计这个题目的目的就是为了根据ATP和TNPATP的不同来设计抗生素的先导化合物.
采用方法:GMD (gromacs), PCA, QM, Homology, Protein-Protein docking
1. 首先通过GMD解析两个小分子构象变化
2. 从结构入手分析产生变化的原因
3. 设计QM来验证ATP变化的假说
4. 设计PCA来分析蛋白的变化,并通过PCA将小分子变化与蛋白变化关联起来
5. 分析得出大分子打开的根本原因来自于小分子的构想周期性变化
6. 利用Protein-Protein docking进行反应初始环境的构建,并用GMD来考证结构的正确性
7. 总结整个磷酸化机制,并提出设计抑制剂的关键性氨基酸(控制蛋白口袋开合)
基本上开始时值是设计了前几步,随着课题的深入不断对问题深化,最后得出结论。在同时进行的药物设计上采用了这个机制的关键氨基酸限制性搜寻,获得36个阳性化合物,从一个侧面证明机制的正确性。
在上面这个例子中,动力学起了一个串联起各项技术桥梁的作用,当然,最后的机制还是由根据综合各项技术提出的。作一个计算课题的关键我个人觉得是知道什么时候选用什么样的技术,理解这个技术的算法和机理,这样才能心中有雄兵。
一家之谈,不足之处请大家指正
动力学系列之九(动力学发展方向)
今天embo整个结束了,我断断续续的听的(因为最近实在是太忙而且有的听不懂)。前面谈了许多技术阿,思路阿,对于中国从事计算生物学,计算化学的人来说,最重要的是在国外已经有的基础上发展自己的东西,不能亦步亦趋。自从六七十年代Karplus发展动力学以来,动力学经过了几次大的波折,开始的时候模拟真空中几十个氨基酸,慢慢的可以模拟大一些的蛋白,随着计算资源的发展和算法的改进,水环境可以加入到模拟当中。进入90年代,膜蛋白,尤其是GPCR和离子通道的模拟成功进一步推动了整个动力学的应用范围。回头来我们看一看整个发展历程,表面上动力学的一个大的方向是模拟越来越大的体系,模拟越来越长的时间,模拟越来越多的次数来满足动力学原理上的随机问题。如果我们眼光只看着这些,我们永远也无法超越国外的水平,因为国外新生代比较好的动力学组已经不是把应用作为主要目标了,他们在反思动力学到底可以为科学的发展贡献什么,怎么用动力学来预测想要的东西,计算/生物/化学怎么结合起来,相互验证着进行解决实验无法测得尺度上的微观问题。国外的人来参观,你说你模拟了多长,多少条轨迹,实际人家不是真正的佩服你,只是佩服你能搞到这么多的计算资源。如果你能在算法或者动力学本身原理上提出见解;你通过动力学发现了一些东西,结果实验证明是正确的,人家才是由衷的说fine,这次embo课程中,象clark,grummuller等都是将生物和计算结合的比较好的组,用到的手段包括AFM,荧光,NOE,NMR 等等。 许多做实验的朋友可能觉得动力学好发文章,可以make story,所以趋之若鹜,实际冷静一下,你要考虑一下如果你要做动力学,你应该怎么做,怎么和你的实验结合起来,把一个课题,一个体系,一个机制完整的呈现出来,我提几个自己的想法,大家指正:
1. 结构生物学结合动力学(最容易)进行结构功能研究
2. 酶学结合动力学进行残基突变,酶反应机理的研究
3. 蛋白组学结合动力学进行partner的识别
4. 信号传导通过动力学研究构象如何变化实现信号传输
5. 其他,包括folding, 蛋白演化这些原来纯粹的计算生物学的方向,现在可以结合AFM, Biocore等仪器来验证你的idea
说了这么多,最后有几个建议,送给想做动力学的朋友
1. 不要只解释别人的实验结果,提出机制。从去年年底到今年,发现动力学的文章最大的变化就是这个,只解释的文章被拒稿率猛增,QSAR的今天就是md的明天
2. 不要局限于细节,要有大局观,从整体入手考虑文章构架
3. 给出预测,并用实验验证它,如果你没有条件,一定要提出你的建议,没有建议的文章不要投4分以上的杂志
4. 数据分析不是目的,整理思路才是关键,我有海量数据,但是人家没有海量时间听你讲,看你的罗罗嗦嗦象唐僧一样,马上给你kill,理由就是你的文章没有新颖性,没有条理性
5. 建议一定要做重复,就是同一条轨迹最好多跑几边,从统计学意义上说明问题,不要保侥幸心里
分子动力学简介及在药物化学中应用
分子动力学是一门结合物理,数学和化学的综合技术,我做过一点这方面的工作,谈一点自己的感受,对大家可能有些帮助吧
1. 动力学可以解决什么问题
做药物化学最重要是要有有前途的先导化合物,而先导化合物的来源两大支柱之一就是虚拟筛选技术,作为虚拟筛选技术串连技术的最终一步,动力学有着可以选择最有前途分子进行合成的作用,提高靶酶先导化合物的阳性成功率;另外动力学还可以对已知的化合物进行研究,获得进一步改造的空间;在生物化学领域,更多的蛋白性质可以被探索,这样动态设计药物分子先导成为可能。
2.什么样的体系适合做动力学
不是所有的体系都适合做动力学,有的体系跑了分析了快一年才发现原来并不适合做动力学(组里有过这样的先例),轨迹扔了可惜,不扔是垃圾,还占空间,被人骂(组里硬盘空间太少,才几个T)。动力学最重要的是选择体系,这也就是说什么样的体系适合做动力学(或者说适合发文章的).
以下几类都是比较好作的:
a. ligand induced conformation
b. open-closed mechanism
c. binding mechanism
d. large-scale mechnism
e. free energy evaluation(这个对做药物化学的人很重要)
不好做的有(但是作出来会很好)
a. membrane protein
b. ion-channel protein
c. Protein-DNA/RNA interaction
千万不要去尝试(会让你做完欲哭无泪的)
a. homoloy-based MD(especillay <30%),几乎文章做一个拒一个,除非你自己组里有人给作实验验证
b. independent stable protein,分析不出什么东西,小东西比方说水啊什么的,这个都已经过时了,不要扣细节了
c. Super large-scale MD, 这个我不用说了吧,估计我们作不了的呵呵,别的地方也很难做
d. 不知道自己为什么去作MD,先跑上再说的那种(最危险的一个),没有人指点你会迷失在分析的海洋中。
2.选择什么样的软件做动力学
动力学的软件多如牛毛,选择哪个去做哪?我只谈主流的自己摸过的几个(排名不分先后),Gromacs, amber, charmm, gromose和macromodel。NAMD我没有摸过,不敢评价。
a. Gromacs大家问的最多,我先说。一个字!快。其他的优点还有分析傻瓜,简单易学(我自己带人的话,一个上午之内保证学会,大家不要板砖啊,确实是缺乏内涵,傻瓜的很),可以pull(而且可以想怎么pull就怎么pull,还可以多个pull)。我说说缺点:结果可靠性差,重复性难,高档次分析工具欠缺,分析工具中bug多(仔细看就会知道,结果一看就知道不对),并行通信量大.....。这个软件只适合没有经济能力购买商业软件和需要长时间动力学(微秒)的同学使用
b. amber和charmm(偷懒了,放在一起),两者差不多,但是前者商业化程度更好,做得比较容易上手;后者还是老样子,脚本复杂,分支狂多,这也和karplus学生众多有关(孩子多了就是不好管啊)。优点都是结果相对准确,可信度高,具有高档次分析工具。缺点是上手难,跑的慢,理论基础要好,狂占空间(我都被管理员说了无数次了,唉)
c. gromose,拥有和CPMD的无缝接口是最大的优点。什么,不知道CPMD是什么,算我没说,跳过这个软件吧
d. macromodel,商业化最好,拥有能力最强,号称动力学黄金标准的MD软件。一个字,贵。但是人家薛定额做的就是好,结果被各大公司使用频率最高,药物化学个人推荐首选。
e. 其他,还有很多动力学软件,NAMD是比较出名的一个,但是我没有摸过,没有什么特色主要是。更小的大家如果感兴趣,一句话:小玩贻情,大作伤身。
3.应该做什么样的分析
rmsd,rmsf, t, e,dis, angle这些俗套就算了,最重要的是你对你的体系精通,各种实验结果了然于胸,机制脱口欲出,靶标分子的作用方式才是分析改造化合物的关键。最好掌握一些发展前沿的分析手段,一两句话说不清楚,这个我下次有时间再开个贴说说。
洋洋洒洒写了半天,后来写困了,可能前言不搭后语了,大家不要拍我啊,仅供大家参考