生物信息学软件: NCBI:BLAST,设定k-mer 默认是全局比对,Blastn是局部比对. PSI-BLAST最灵敏的BLAST,选中部分矩阵后在数据库中查找相应蛋白. PHI-BLAST找氨基酸motif ,参数有-db 数据库,-query 输入文件,-cut输出文件 Ensembl模式生物数据库:biomark UCSC genome browser,各种基因组参数:CG content等可以展开. Ebi:ensembl也在其中. 一个gene: DNA水平:基因名字UCSC找位置…
1. Blast (1)格式化数据库 formatdb -i db.seq -p T -o T -l logfile 主要参数: -i 输入需要格式化的源数据库名称 -p 文件类型,是核苷酸序列数据库(F - nucleotide)/蛋白质序列数据库(T – protein),default = T -a 输入数据库的格式是否为ASN.1/FASTA [T/F],default = F -o 解析选项:解析序列标识并且建立目录[T/F],default = F -l 自定义log文件命令defa…
参考链接: FTP README 如何下载 NCBI NR NT数据库? 下载blast:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 先了解BLAST Databases:BLAST FTP Site   如何下载NCBI blast数据库? NCBI提供了一个非常智能化的脚本update_blastdb.pl来自动下载所有blast数据库. 脚本使用方法: perl update_blastdb.pl nr 有哪些可供下载的blast…
详细可参考https://www.jianshu.com/p/2f125cdf8262:https://blog.csdn.net/qq_34296043/article/details/54427786两篇文章 1)下载网址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 2)解压到文件夹.此处为E:\software\blast_2.8.0_alpha\.会自动出现一个bin文件夹(放置程序,如下图),一个doc文件夹(放置文件).然后…
1)wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.8.0alpha/ncbi-blast-2.8.0-alpha+-x64-linux.tar.gz 2)tar -zxvf ncbi-blast-2.2.30+-x64-linux.tar.gz 3)mv  ncbi-blast-2.8.0+/ blast 4)echo 'PATH=/home/jxdong/biosoft/blast/bin:$PATH' >> ~/.ba…
1 下载程序 在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/下载 ncbi-blast-2.2.25+-x64-linux.tar.gz 2 解压 如解压到用户的主目录(/home/***)下,把解压后的文件夹重新命名为blast,则BLAST+的所有程序在目录/home/***/blast/bin下. 3 添加环境变量 打开终端(Terminal),切换为root用户,执行vim /etc/profile 在最末尾添加e…
下载数据 #此处下载对应物种的数据库ftp://ftp.ncbi.nih.gov/genomes/,下载fna格式的即可   wget ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/CHR_I/NC_003070.fna #将数据改名为Arabidopsis_thaliana.fna mv NC_003070.fna Arabidopsis_thaliana.fna #我下载的是拟兰介的1号染色体,取其前100000行作为我的测试数据 h…
链接:http://blog.sciencenet.cn/home.php?mod=space&uid=830496&do=blog&quickforward=1&id=640600 Linux下BLAST+的本地化(NCBI-BLAST 2.2.29+): 1.  下载软件BLAST: 在以下网址  ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ 下载:   ncbi-blast-2.2.29+-x6…
http://blog.sina.com.cn/s/blog_670445240102uxwy.html 一 COG简介 COG,即Clusters of Orthologous Groups of proteins.构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs.Orthologs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能.Paralogs是那些在一定物种中的来源于基因复制的蛋白,可…
主要内容: gOMP的算法流程 gOMP的MATLAB实现 一维信号的实验与结果 稀疏度K与重构成功概率关系的实验与结果 一.gOMP的算法流程 广义正交匹配追踪(Generalized OMP, gOMP)算法可以看作为OMP算法的一种推广.OMP每次只选择与残差相关最大的一个,而gOMP则是简单地选择最大的S个.之所以这里表述为"简单地选择"是相比于ROMP之类算法的,不进行任何其它处理,只是选择最大的S个而已. gOMP的算法流程: 二.gOMP的MATLAB实现(CS_gOMP…