转载至:http://blog.sina.com.cn/s/blog_3f6403290100rb61.html(感谢原文作者)

HMMPfam的安装使用手记
前言

简要介绍一下 HMMPfam吧。这还要从HMMER说起,HMMER是基于隐马尔可夫模型(profile HMMs),用于生物序列分析工作的一个非常强大的软件包,而hmmpfam就是HMMER软件包中的一个重要组成部分。同时,我们还需要了解Pfam (Protein families database of alignments and HMMs),它实际上是一个涵盖了生物蛋白质序列中常见结构域的序列及其相对应的隐马尔科夫模型的数据库,由英国的Sanger Institute维护。hmmpfam的工作原理简单的说就是将用户所提交的查询序列在Pfam库中做比对计算,然后预测出查询序列中所隐含的结构域信息。

正文

通过前面的简介,我们知道要使hmmpfam能成功运行,需要同时安装HMMER软件包和Pfam数据库。下面就让我们开始吧:)

HMMER软件包从http://hmmer.janelia.org/下载,现在的版本为2.3.2。下载下来的应该是源码压缩包,放在任意目录下解压
$ tar xvf hmmer.tar.gz

切换到解压后的目录
$ cd hmmer-2.3.2

下面运行configure进行配置,其实默认配置很简单,直接用./configure 就行了,不用加任何参数。但我自己装的时候设了以下两个参数。--enable-threads 是多线程支持,因为我是在服务器上安装,我们实验室的服务器为4颗双核CPU,因此在这里开启了HMMER对多线程的支持(默认可以使用所有可用的cpu 同时进行运算),第二个参数--enable-lfs是开启对大于2G的文件的读写支持,以备不时之需。其它参数可以根据自己需要设置,我这里没有特别设定。
$ ./configure --enable-threads --enable-lfs

后面就很简单了,按部就班三步走。其中make install要在root权限下进行,默认安装路径为(程序:/usr/local/bin/ ,帮助文件: /usr/local/man/man1)
$ make
$ make check
# make install

这样HMMER就装好了,还是很简单的吧:)

下面从ftp://ftp.sanger.ac.uk/pub/databases/Pfam/current_release/上下载Pfam的数据库,现在的最新版本是23.0。Pfam的数据库主要有两个,Pfam_ls和Pfam_fs,我们主要使用Pfam_ls,所以就只下了这一个:Pfam_ls.gz ,解压后实际大小约700M。这里建议新建一个名字叫Pfam的工作文件夹,并把解压后的库文件放在这个文件夹下,以后做hmmpfam分析时的输入输出序列也放在这个文件夹下,这样使用起来不用特别指定目录,比较方便,个人经验,仅供参考,呵呵。

这样一切准备工作就都做好了,可以运行hmmpfam做分析啦:P

切换到Pfam目录下,并运行hmmfam程序。
$ hmmpfam --cpu 4 -E 0.0001 Pfam_ls InputSeq.fas >OutResults.fas

运行hmmpfam时我一般会设这两个参数,--cpu <n> 用于指定本次hmmpfam程序运行时使用的cpu个数,-E <n> 用于设定E-value的阈值。其实hmmpfam还提供了其它很多参数,具体使用时根据需要选用,下面简要列几个:

Usage: hmmpfam [-options]

Available options are:
-h : help; print brief help on version and usage
-n : nucleic acid models/sequence (default protein)
-A : sets alignment output limit to best domain alignments
-E : sets E value cutoff (globE) to ; default 10
-T : sets T bit threshold (globT) to ; no threshold by default
-Z : sets Z (# models) for E-value calculation

后记

回头看看这个安装过程,其实还是挺简单的,只要认真看看Manual文件,绝对没问题。
我对Linux其实也是一知半解,所以基本就是在摸着石头过河,在摸索中前进,在前进中提高嘛,呵呵。

另外,以上安装所使用的OS平台为:
Redhat Enterprise Linux Server Release 5.2 (Tikanga)

HMMPfam的安装使用手记(转载)的更多相关文章

  1. 项目管理工具 Redmine 安装试用手记

    原文:项目管理工具 Redmine 安装试用手记 项目管理工具 Redmine 安装试用手记 分类: Redmine2009-06-01 10:12 996人阅读 评论(1) 收藏 举报 项目管理工具 ...

  2. Debian 安装 vmware-tools 手记

    debian 8.5 源 deb http://ftp.de.debian.org/debian jessie main http://mirrors.163.com/.help/debian.htm ...

  3. 加密通信软件Signal 2.92版本编译安装折腾手记(Ubuntu 18.04)

    加密通信软件Signal 2.92版本编译安装折腾手记(Ubuntu 18.04) 前言 加密通信软件Signal是开源的,安全性很高,号称斯诺登也推荐大家使用.既然这么好,那必然会有不少人去尝试复制 ...

  4. Apache Kafka 分布式消息队列中间件安装与配置 转载

    bin/zkServer.sh start /home/guym/down/kafka_2.8.0-0.8.0/config/zookeeper.properties& bin/kafka-s ...

  5. CentOS下RPM方式安装MySQL5.6(转载)

    之前的项目全都在windows系统环境下部署的,这次尝试在Linux系统环境下部署,于是这次我们组织在7台主机上安装了JDK.Maven.Jboss其中一台安装了Mysql,并将局域网配置好,终于大功 ...

  6. Linux系统下JDK安装配置(转载)

    转载出处:http://www.cnblogs.com/xuliangxing/p/7066913.html 本文主要介绍的是如何是Linux环境下安装JDK的,因为Linux环境下,很多时候也离不开 ...

  7. CentOS下安装Redis(转载)

    Redis是一个高性能的,开源key-value型数据库.是构建高性能,可扩展的Web应用的完美解决方案,可以内存存储亦可持久化存储.因为要使用跨进程,跨服务级别的数据缓存,在对比多个方案后,决定使用 ...

  8. Windows下Mongodb安装及配置(转载)

    转载(https://blog.csdn.net/liang377122210/article/details/79062681) MongoDB的安装很简单,设置好安装路径后,一直Next直到安装结 ...

  9. ZooKeeper-3.3.4集群安装配置(转载)

    ZooKeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization).命名服务(Naming S ...

随机推荐

  1. CAPI HTTP服务搭建(文件在本机)

    南康HTTP服务器搭建步骤如下: 1.环境准备 2.添加应用程序 3.访问测试 4.添加虚拟目录 5.下载测试 6.上传测试 7.最终效果 8.权限设置 有问题请留言.

  2. ios中,长按Webview中的图片

    我们所要解决的问题如题目所示:ios中,长按Webview中的图片,将图片保存到本地相册. 解决方案:对load的html网页,执行js注入,通过在webview中执行js代码,来响应点击事件,通过j ...

  3. HTML 5缓存机制:Cache Manifest配置实例

    Cache Manifest是HTML 5的一种缓存机制,文章作者直接用博客当测试环境,虽然[color=#444444 !important]应用起来非常简单,但效果却出奇的好.缓存后的速度,简直是 ...

  4. 实现Java JTable的应用案例

    代码如下 import Java.awt.Component; import java.awt.Dimension; import java.awt.FontMetrics; import javax ...

  5. 一个学生分数表,用sql语句查询出各班级的前三名

    昨天去一家公司面试,被这道题难住了,哎,又失去一次好的机会. 回来 之后就再想这个问题 表结构及数据如下:

  6. ASPX页面包含inc文件、用户控件、普通html文件

    如果你是从asp程序员转过来一定不习惯.net的编程风格吧,代码和页面时分离的,asp和php里面时常是引入, 比如<!--#include File="xxxxxxx"-- ...

  7. C#使用结构来传递多个参数

    当参数超过5个时,建议用结构来传递多个参数. 示例代码如下: public struct MyStruct { public string str; public int number; } clas ...

  8. ARC————自动引用计数

    一.内存管理/引用计数 1.引用计数式内存管理的方式(下面四种) 对象操作 OC方法 生成并持有对象 alloc/new/copy/mutableCopyd等方法 持有对象 retain方法 释放对象 ...

  9. linux基本使用(一)

    分区1./ 根分区2. swap 交换分区(大小建议是内存的1~2倍)3. /home 分区4./boot 引导文件(启动加载)分区5./var 等,最低 要有前2个分区吧,最好有home分区,因为没 ...

  10. 用友二次开发之U810.1销售预订单导入