技术背景

关于增强采样（Enhanced Sampling）算法的具体原理，这里暂不做具体介绍，感兴趣的童鞋可以直接参考下这篇综述文章：Enhanced sampling in molecular dynamics。大致的作用就是，通过统计力学的方法，使得目标分子的CV（Collective Variables）具有一个尽可能大的采样子空间，并且可以将其还原回真实的自由能面。常用的增强采样算法，有早期的伞形采样，到后来大家常用的MetaDynamics以及高老师的温度积分增强采样算法（ITS）。在MindSponge中已经实现了MetaDynamics算法和ITS算法，本文我们使用MetaDynamics算法来做一个演示。

准备工作

使用MindSponge，可以参考本系列文章先了解一下MindSponge的安装和基本使用方法。这里我们用一个比较简单的多肽体系进行一个测试，相应的pdb文件为：

CRYST1    0.000    0.000    0.000  90.00  90.00  90.00 P 1           1

ATOM      1  H1  ACE A   1      -1.838  -6.570  -0.492  0.00  0.00      

ATOM      2  CH3 ACE A   1      -0.764  -6.587  -0.283  0.00  0.00      

ATOM      3  H2  ACE A   1      -0.392  -7.533  -0.746  0.00  0.00      

ATOM      4  H3  ACE A   1      -0.592  -6.446   0.740  0.00  0.00      

ATOM      5  C   ACE A   1      -0.006  -5.404  -0.828  0.00  0.00      

ATOM      6  O   ACE A   1      -0.544  -4.619  -1.673  0.00  0.00      

ATOM      7  N   ALA A   2       1.278  -5.323  -0.423  0.00  0.00      

ATOM      8  H   ALA A   2       1.622  -5.845   0.368  0.00  0.00      

ATOM      9  CA  ALA A   2       2.284  -4.164  -0.399  0.00  0.00      

ATOM     10  HA  ALA A   2       2.098  -3.653   0.505  0.00  0.00      

ATOM     11  CB  ALA A   2       3.651  -4.787  -0.566  0.00  0.00      

ATOM     12  HB1 ALA A   2       4.274  -4.031  -0.972  0.00  0.00      

ATOM     13  HB2 ALA A   2       3.977  -5.106   0.419  0.00  0.00      

ATOM     14  HB3 ALA A   2       3.697  -5.612  -1.274  0.00  0.00      

ATOM     15  C   ALA A   2       1.995  -3.152  -1.576  0.00  0.00      

ATOM     16  O   ALA A   2       1.544  -2.065  -1.221  0.00  0.00      

ATOM     17  N   NME A   3       2.255  -3.614  -2.845  0.00  0.00      

ATOM     18  H   NME A   3       2.788  -4.485  -2.929  0.00  0.00      

ATOM     19  CH3 NME A   3       1.991  -2.802  -4.055  0.00  0.00      

ATOM     20 HH31 NME A   3       2.561  -1.891  -3.988  0.00  0.00      

ATOM     21 HH32 NME A   3       1.897  -3.419  -4.937  0.00  0.00      

ATOM     22 HH33 NME A   3       0.985  -2.388  -3.930  0.00  0.00      

END

该构象可以保存成pdb文件然后直接用VMD进行可视化：

其他的力场文件我们直接使用MindSponge已经自带的amber.ff14sb力场即可。

普通MD案例

在测试增强采样算法之前，我们可以先跑一段普通的分子模拟测试一下：

from mindspore import nn, context

import mindspore as ms

# 固定随机种子，确保朗之万控温的随机数可以被复现

ms.set_seed(0)

# 这里使用的是一个未编译版本的mindsponge，所以要把sponge所在路径添加到系统路径中

import sys

sys.path.insert(0, '../..')

from sponge import ForceField, Sponge, set_global_units, Protein, UpdaterMD, WithEnergyCell

from sponge.callback import RunInfo, WriteH5MD

from sponge.colvar import Torsion

from sponge.function import PI

context.set_context(mode=context.GRAPH_MODE, device_target='GPU')

set_global_units('A', 'kcal/mol')

system = Protein('mol.pdb', template=['protein0.yaml'], rebuild_hydrogen=False)

energy = ForceField(system, parameters=['AMBER.FF14SB'], use_pme=False)

min_opt = nn.Adam(system.trainable_params(), 1e-03)

dihedrals = Torsion([[4, 6, 8, 14], [6, 8, 14, 16]])

run_info = RunInfo(20)

opt = UpdaterMD(system=system,

                time_step=1e-3,

                integrator='velocity_verlet',

                temperature=300,

                thermostat='langevin')

sim = WithEnergyCell(system, energy)

md = Sponge(sim, optimizer=opt, metrics={'dihedrals': dihedrals})

cb_h5md = WriteH5MD(system, 'test_meta.h5md', save_freq=10, write_image=False)

md.run(5000, callbacks=[run_info, cb_h5md])

运行之后会在本地保存一个h5md格式的轨迹文件，可以在vscode中使用h5web拓展工具打开：

找到dihedral的value，用matrix的形式查看，然后可以导出csv格式（如：path_sink.csv）：

导出csv之后，可以使用如下的python脚本进行绘图：

import numpy as np

import matplotlib.pyplot as plt

def gaussian2(x1, x2, sigma1=1.0, sigma2=1.0, A=0.5):

    return np.sum(A*np.exp(-0.5*(x1**2/sigma1**2+x2**2/sigma2**2))/np.pi/sigma1/sigma2, axis=-1)

def potential_energy(position, psi, phi, sigma1, sigma2):

    # (A, )

    psi_, phi_ = position[:, 0], position[:, 1]

    # (A, R)

    delta_psi = psi_[:, None] - psi[None]

    delta_phi = phi_[:, None] - phi[None]

    # (A, )

    Z = -np.log(gaussian2(delta_psi, delta_phi, sigma1=sigma1, sigma2=sigma2, A=2.0)+1)

    return Z

data = np.genfromtxt('./path_sink.csv', delimiter=',')

phi = data[:, 0]

psi = data[:, 1]

num_grids = 100

num_levels = 10

psi_grids = np.linspace(-np.pi, np.pi, num_grids)

phi_grids = np.linspace(-np.pi, np.pi, num_grids)

grids = np.array(np.meshgrid(psi_grids, phi_grids)).T.reshape((-1, 2))

Z = potential_energy(grids, phi, psi, 1.0, 1.0).reshape((psi_grids.shape[0], phi_grids.shape[0])).T

X,Y = np.meshgrid(psi_grids, phi_grids)

levels = np.linspace(np.min(Z), np.max(Z), num_levels)

plt.figure()

plt.title("Biased MD Traj")

plt.xlabel(r'$\phi$')

plt.ylabel(r'$\psi$')

fc = plt.contourf(X, Y, Z, cmap='Greens', levels=levels)

plt.colorbar(fc)

plt.xlim(-np.pi, np.pi)

plt.ylim(-np.pi, np.pi)

plt.plot(phi, psi, 'o', alpha=0.4, color='red')

plt.savefig('meta.png')

画出来的轨迹效果如下图所示：

可以发现，在不加任何的Bias的时候，整个轨迹还是比较集中的在一个区域，一般该区域就是对应了一个能量极小值点附近的区域。

MetaDynamics案例

从上一个章节的结果中可以看出，常规的分子模拟采样方法很容易陷入到一个局部区域中，这样使得我们很难可以观测到其他采样子空间所对应的构象和相关信息，因此我们可以引入一个MetaDynamics增强采样算法，做一个有偏估计：

from mindspore import nn, context

import mindspore as ms

ms.set_seed(0)

import sys

sys.path.insert(0, '../..')

from sponge import ForceField, Sponge, set_global_units, Protein, UpdaterMD, WithEnergyCell

from sponge.callback import RunInfo, WriteH5MD

from sponge.colvar import Torsion

from sponge.function import PI

from sponge.sampling import Metadynamics

context.set_context(mode=context.GRAPH_MODE, device_target='GPU')

set_global_units('A', 'kcal/mol')

system = Protein('mol.pdb', template=['protein0.yaml'], rebuild_hydrogen=False)

energy = ForceField(system, parameters=['AMBER.FF14SB'], use_pme=False)

min_opt = nn.Adam(system.trainable_params(), 1e-03)

# 这里定义的CV是phi和psi角，是一个2维的CV

dihedrals = Torsion([[4, 6, 8, 14], [6, 8, 14, 16]])

run_info = RunInfo(20)

# 配置Meta的参数，主要是高斯波包的高度、宽度、更新频率、CV范围、CV格点数等等

metad = Metadynamics(

    colvar=dihedrals,

    update_pace=10,

    height=2.5,

    sigma=0.4,

    grid_min=-PI,

    grid_max=PI,

    grid_bin=50,

    temperature=300,

    bias_factor=100,

    use_cutoff=True,

)

opt = UpdaterMD(system=system,

                time_step=1e-3,

                integrator='velocity_verlet',

                temperature=300,

                thermostat='langevin')

sim = WithEnergyCell(system, energy, bias=metad)

md = Sponge(sim, optimizer=opt, metrics={'dihedrals': dihedrals})

cb_h5md = WriteH5MD(system, 'test_meta.h5md', save_freq=10, write_image=False)

md.run(5000, callbacks=[run_info, cb_h5md])

用类似的方法，可以计算得增强采样之后的CV轨迹：

可以看到，采样子空间在Meta的作用下已经扩展到几乎整个CV空间，这使得我们可以更快的去分析整个采样空间各处的自由能的相对大小。

总结概要

本文介绍了在MindSponge中进行分子动力学模拟以及增强采样的实现方法。通过使用MetaDynamics增强采样算法，我们可以将分子模拟的采样子空间，从某个能量极小值区域，扩大到尽可能大的采样子空间。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/mindsponge-meta.html

作者ID：DechinPhy

更多原著文章：https://www.cnblogs.com/dechinphy/

请博主喝咖啡：https://www.cnblogs.com/dechinphy/gallery/image/379634.html

MindSponge分子动力学模拟——增强采样（2024.11）的更多相关文章

增强采样软件PLUMED的安装与使用
技术背景增强采样(Enhanced Sampling)是一种在分子动力学模拟中常用的技术,其作用是帮助我们更加快速的在时间轴上找到尽可能多的体系结构及其对应的能量.比如一个氢气的燃烧反应,在中间过程 ...
Gromacs分子动力学模拟流程概述
Gromacs分子动力学模拟主要可以分为以下几个步骤,不同的体系步骤可能略有不同. 在开始之前,先简单了解一下预平衡: 分子动力学模拟的最终目的是对体系进行抽样,然后计算体系的能量,各种化学键,成分分 ...
分子动力学模拟软件VMD的安装与使用
技术背景在分子动力学模拟过程中会遇到一些拓扑结构非常复杂的分子模型,所谓的复杂不仅仅是包含众多的原子,还有各种原子之间的成键关系与成键类型等.这时候就非常能够体现一个好的可视化软件的重要性了,这里我 ...
分子动力学模拟之基于自动微分的LINCS约束
技术背景在分子动力学模拟的过程中,考虑到运动过程实际上是遵守牛顿第二定律的.而牛顿第二定律告诉我们,粒子的动力学过程仅跟受到的力场有关系,但是在模拟的过程中,有一些参量我们是不希望他们被更新或者改变 ...
分子动力学模拟之SETTLE约束算法
技术背景在上一篇文章中,我们讨论了在分子动力学里面使用LINCS约束算法及其在具备自动微分能力的Jax框架下的代码实现.约束算法,在分子动力学模拟的过程中时常会使用到,用于固定一些既定的成键关系.例 ...
Noip模拟74 2021.10.11
T1 自然数考场上当我发现我的做法可能要打线段树的时候,以为自己百分之百是考虑麻烦了但还是打了,还过掉了所有的样例,于是十分自信的就交了正解还真是线段树,真就第一题数据结构但是包括自己造的小样 ...
Noip模拟36 2021.8.11
刚题的习惯还是改不了,怎么办??? T1 Dove打扑克考场上打的动态开点线段树+并查集,考后发现自己像一个傻子,并查集就行.. 这几天恶补数据结构疯了用树状数组维护后缀和,$siz_i$表示编号 ...
Noip模拟7 2021.6.11
前言考试时候der展了,T1kmp没特判(看来以后还是能hash就hash),T2搜索细节没注意,ans没清零,130飞到14.... T1 匹配(hash/kmp) 这太水了,其实用个hash随便 ...
NOIP模拟赛(洛谷11月月赛)
T1 终于结束的起点题解:枚举啊... 斐波那契数第46个爆int,第92个爆long long.... 发现结果一般是m的几倍左右....不用担心T. #include<iostream ...
GMOJ5409.【GDOI2017模拟一试4.11】平行宇宙
https://gmoj.net/senior/#main/show/5051 Solution 首先注意到每个点有且只有一条出边,也就是说这是一个环套树(森林). 那么我们可以贪心. 首先这个森林里 ...

随机推荐

Apache SeaTunnel 社区 3 月月报
各位热爱 SeaTunnel 的小伙伴们,SeaTunnel 社区 3 月月报来啦!这里将记录 SeaTunnel 社区每个月的重要更新,并评选出月度之星,欢迎关注. SeaTunnel 月度 Mer ...
【单调栈+倍增】[P7167 [eJOI2020 Day1] Fountain
[单调栈+倍增][P7167 [eJOI2020 Day1] Fountain 思路用单调栈处理每个圆盘溢出后流到的第一个位置,然后倍增优化. 代码 #include <bits/stdc++ ...
Maven经验分享（五）Maven拷贝资源
上一章介绍使用ant拷贝资源,这里介绍maven拷贝资源,使用maven-resources-plugin插件. <plugin> <groupId>org.apache.ma ...
fofa开放免费教育账号类比专业账号!
用户须知 1.免责声明:本教程作者及相关参与人员对于任何直接或间接使用本教程内容而导致的任何形式的损失或损害,包括但不限于数据丢失.系统损坏.个人隐私泄露或经济损失等,不承担任何责任.所有使用本教程内 ...
最短路之Dijkstra
Dijkstra算法: Dijkstra是一种求解非负权图上单源最短路径的算法. 思路:将所有结点分为两个集合:已经确定最短路径的点(S)和未确定最短路长度的点集(T),开始时所有点都属于T 初始 ...
Terraform中的for_each和count
通过Terraform创建云主机时,在某些业务场景下,一个机器需要挂载多个云盘,一般云厂商都是单独创建云主机和云硬盘然后通过attachment的资源去挂载,因此我们的模板大致如下: resource ...
Linux 更新 TeX Live
更新 TeX Live 假设你的旧版 TeX Live 版本号为 2023,新版 TeX Live 版本号为 2024.你需要在下面的命令中相应地更改实际版本号.TeX Live 版本可以通过 tlm ...
MyBatis分页实现
目录分页实现 limit实现分页 RowBounds分页分页实现 limit实现分页为什么需要分页? 在学习mybatis等持久层框架的时候,会经常对数据进行增删改查操作,使用最多的是对数据库进 ...
JavaScript Library – Swiper
前言官网已经有很好的教程了, 这篇只是记入一些我用过的东西和冷门知识. 参考官网安装官网 Demo 安装 yarn add swiper JS import Swiper from 'swipe ...
java_day1_认识计算机，java环境，Java关键字、标识符、注释
一.认识计算机 1.组成: 硬件:cpu,内存,显卡,... 软件: 系统软件:WPS, wegame, steam, IDEA,..... 应用软件:WPS, wegame, steam, IDEA ...

MindSponge分子动力学模拟——增强采样（2024.11）