enzyme design 整体流程及感想
想起什么来写什么吧。
整体流程(以Ceas2, TPP, G3P为例):
准备蛋白即配体参数文件(pdb文件需要有header,header的顺序符合cst block的顺序,且residue1和residue2的顺序也必须符合cst block);
设置CST文件;
准备protocol和flag文件;
运行enzyme_design;
结果处理。
CST文件准备:
要想准备好cst文件,需要的先决条件有两个,一个是对CST文件格式的了解,一个是对rosetta参数文件(.params)的了解。
首先,CST格式可见另外一篇博客https://www.cnblogs.com/wq242424/p/9463703.html;
其次,.params文件格式里面,主要注意我们感兴趣的原子,比如HIS的Nhis,确定A1,A2和A3,Nhis作为A1,A2和A3则由.params文件里对应ICOOR行的parent原子决定,A2是A1的parent,A3是A2的parent。如HIS里Nhis对应的原子及A1是ND1,A2为A1的parent为CG,A3为A2的parent为CB,.params文件格式参见.param文件格式,标准氨基酸的.params文件存放在$ROSETTAHOME/main/database/chemical/residue_type_sets/下。
最后,设置好CST文件后,一定要用 CstfileToTheozymePDB.linuxgccrelease 对CST进行验证,因为有时候随着标准氨基酸.params文件的更新,不同原子的定义可能会有改变,命令用法如下:
CstfileToTheozymePDB.linuxgccrelease -extra_res_fa G3P.params -match:geometric_constraint_file G3P.cst
命令会产生出 PDB_Model_G3P.cst_1.pdb 文件,删除pdb文件里的CONNECT行后,使用 pymol PDB_Model_G3P.cst_1.pdb 命令查看motif是否符合设定。
下面列举我遇到过的几种氨基酸的原子信息:
侧链信息:

骨架信息:

上述是列举的官方文档种的残基原子信息。
下面是自己应用过程种用到的:
Ntrp,和Nhis,

OH ,(注意逗号前有空格)

Narg,

结果处理:
对设计出来的众多结果进行筛选,筛选规则的原文如下:
One approach currently used in the Baker group is the following: first, a subset of the - most important criteria is picked, i.e. total_score, ligand binding energy/SR_interface_E_1_2, total constraint score of the catalytic residues (all_cst), packstat, and buried unsatisfied polars of the ligand. Then, for each of these criteria, a minimum value is decided, which all designs considered for expression have to exceed ( i.e. total_score has to be lower than the corresponding Rosetta score of the undesigned scaffold, ligand_binding energy has to be < -10.0, and all_cst has to be < 1.0 ).
大体过程是:
首先,确定4-5个重要的对设计重要的特征,如total_score, ligand binding energy/SR_interface_E_1_2, total constraint score of the catalytic residues (all_cst), packstat, buried unsatisfied polars of the ligand等;
然后,确定每一个特征标准或者称为临界值,例如ligand_binding energy has to be < -10.0,又如 all_cst has to be < 1.0等;
最后,使用 DesignSelect.pl 脚本筛选出符合标准的设计。
DesignSelect.pl脚本的用法:
首先,需要准备一个标准或者临界值文件,如下:
req all_cst value < 1.0
req SR_4_interf_E_1_2 value < -10.0
output sortmin total_score
然后,使用命令:
DesignSelect.pl -d design.out -c <requirements file> -tag_column last > filtered_designs.out
对结果处理,得到的文件filtered_designs.out里包含符合我们条件的entry。
故障报错:
1. ERROR: unknown atom_name: TPP C
准备好flag文件,xml文件等后,运行 rosetta_scripts.linuxgccrelease @flags :
出现错误:ERROR: unknown atom_name: TPP C
没有排查出错误出处,由低版本(2016)换高版本rosetta_scripts(2018)运行后,问题解决。
enzyme design 整体流程及感想的更多相关文章
- 使用git整体流程
一.git提交代码走meger请求的整体流程 工作中使用git推代码时,如果走merge请求,那么也就是说拉代码时拉公共代码库的代码,但是提交时需要先提交到自己的代码库,然后在gitlab上提交mer ...
- Mybatis技术原理理——整体流程理解
前言:2018年,是最杂乱的一年!所以你看我的博客,是不是很空! 网上有很多关于Mybatis原理介绍的博文,这里介绍两篇我个人很推荐的博文 Mybatis3.4.x技术内幕和 MyBaits源码分析 ...
- iOS开发从申请开发账号到APP上架的整体流程详解
应公司要求,写一份文档从申请账号一直到APP上架的整体流程,下面进入正文. https://blog.csdn.net/qq_35612929/article/details/78754470 首先第 ...
- 【驱动】input子系统整体流程全面分析(触摸屏驱动为例)【转】
转自:http://www.cnblogs.com/lcw/p/3294356.html input输入子系统整体流程 input子系统在内核中的实现,包括输入子系统(Input Core),事件处理 ...
- vue框架整体流程
1.整体流程 (1)模板解析成render函数 (2)响应式监听 (3)首次渲染,显示页面,绑定依赖 (4)data属性变化,触发rerender 2.模板解析为render函数 参考上一篇博客. 模 ...
- linux input输入子系统分析《四》:input子系统整体流程全面分析
1 input输入子系统整体流程 本节分析input子系统在内核中的实现,包括输入子系统(Input Core),事件处理层(Event Handler)和设备驱动层.由于上节代码讲解了设备 ...
- 微信APP支付整体流程记录备忘
支付整体流程见文档:https://pay.weixin.qq.com/wiki/doc/api/app.php?chapter=8_3 商户系统和微信支付系统主要交互说明: 步骤1: ...
- (转)linux内存源码分析 - 内存回收(整体流程)
http://www.cnblogs.com/tolimit/p/5435068.html------------linux内存源码分析 - 内存回收(整体流程) 概述 当linux系统内存压力就大时 ...
- 三、直播整体流程 五、搭建Nginx+Rtmp直播流服务
HTML5实现视频直播功能思路详解_html5教程技巧_脚本之家 https://m.jb51.net/html5/587215.html 三.直播整体流程 直播整体流程大致可分为: 视频采集端:可以 ...
随机推荐
- Maven项目:Malformed POM expected START_TAG or END_TAG ........
今天在执行maven命令 mvn assembly:assembly -Dmaven.test.skip=true的时候报了个错,大概是Malformed POM expected START_TAG ...
- Gephi 网络图可视化工具
官网: https://gephi.org/ 背景: Gephi 是一款开源,免费, 跨平台的的graph 和 network 可视化工具,同时也提供了数据挖掘 ...
- 【2019年03月29日】股票的滚动市盈率PE最低排名
仅根据最新的市盈率计算公式进行排名,无法对未来的业绩做出预测. 深康佳A(SZ000016) - 滚动市盈率PE:2.51 - 滚动市净率PB:1.68 - 滚动年化股息收益率:2.9% - - - ...
- 使用DDL触发器同步多个数据库结构
使用DDL触发器同步多个数据库结构 背景:当开发组比较大时,势必会分布到不同的地理位置,若无法在同一个快速网络中工作,就会造成多个开发库并存的局面,这样就需要多个开发库结构的同步,甚至是开发测试数据的 ...
- [Benchmark] Codeflaws: A Programming Competition Benchmark for Evaluating Automated Program Repair Tools
Basic Information Publication: ICSE'17 Authors: Shin Hwei Tan, Jooyong Yi, Yulis, Sergey Mechtaev, A ...
- 求问ps如何导出单个切片及PS导出所有的切片图像
在ps里面对图片进行切片,并根据需要弄好切片,利用shift键,可以选择其中部分的切片: 弄好以后,点击“文件”,选择“存储为WEB和设备所用格式”:. 在打开的“存储为WEB和设备所用格式”界面上点 ...
- react 路由导航栏 withRouter
codesandbox https://codesandbox.io/s/9l6prnyxjy app.js import React, { Component, Fragment } from &q ...
- Linux提权:从入门到放弃
*原创作者:piece of the past,本文属Freebuf原创奖励计划,未经许可禁止转载 日站就要日个彻底.往往我们能拿下服务器的web服务,却被更新地比西方记者还快的管理员把内网渗透的种子 ...
- 【持续集成】GIT+jenkins+sonar——GIT
一.GIT基础 1.1 git简介 linus用C语言编写 2005年诞生 分布式管理系统 速度快.适合大规模.跨地区多人协同开发 1.2 本地管理.集中式.分布式 1.3 git安装 #CentOS ...
- 一些关于SQL优化的总结
由于这个项目一直都是mysql所以写点mysql的 1.数据存储引擎的选择,MyISAM 和 InnoDB 的选择 InnoDB 一般都会选择这个,但是如果真的涉及到一些不涉及增删的表,可以考虑下My ...