全基因组关联分析除了找到显著的关联位点,我们还可以做基因优化.geneset富集分析.组织富集分析,下面具体讲一讲怎么利用GWAS的summary数据做这个分析. summary数据就是关联分析的结果文件 1 软件安装前请确保需要满足的系统环境 1.1 支持Mac OS X 或者 UNIX, 不支持windows系统 1.2 Java SE 6(或者更高),没有安装Java请自行安装 1.3 需要PIP 怎么确定系统有没有安装PIP呢,输入命令which pip,如果没有路径弹出,说明没有PIP…
查询速度慢的原因很多,常见如下几种 : .没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) .I/O吞吐量小,形成了瓶颈效应. .没有创建计算列导致查询不优化. .内存不足 .网络速度慢 .查询出的数据量过大(可以采用多次查询,其他的方法降低数据量) .锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷) .sp_lock,sp_who,活动的用户查看,原因是读写竞争资源. .返回了不必要的行和列 .查询语句不好,没有优化 解决方法汇总如下:…
在开发中UI布局是我们都会遇到的问题,随着UI越来越多,布局的重复性.复杂度也会随之增长.Android官方给了几个优化的方法,但是网络上的资料基本上都是对官方资料的翻译,这些资料都特别的简单,经常会出现问题而不知其所以然.这篇文章就是对这些问题的更详细的说明,也欢迎大家多留言交流. 一.include 首先用得最多的应该是include,按照官方的意思,include就是为了解决重复定义相同布局的问题.例如你有五个界面,这五个界面的顶部都有布局一模一样的一个返回按钮和一个文本控件,在不使用in…
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习原理就像一个小黑洞. 很多人花了好几个月的时间在看原理,一旦丢给他数据去分析,依旧束手无策. 不会跑流程,内心依旧会很恐慌.就像从来没有入门一样. 所以,我的建议是咱们先不去管原理,直接从分析入手. 等把数据跑出来了,整个流程的技能点满了,再去看看它的原理. 入门:学习GWAS的在线网站: 对于没有…
paper:cepip: context-dependent epigenomic weighting for prioritization of regulatory variants and disease-associated genes Genotype-Tissue Expression Project (GTEx) - genome上的eQTL位点及其对特定组织的特定基因表达的影响,同时包含了不同eQTL之间的LD关系.这个整合多个疾病的数据.正如其名,该数据包含了genotype.…
RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析.WGCNA network以及一些没卵用的花式分析.DEG分析是基础,up and down,做个富集,了解一下处理后到底是什么通路被改变了:WGCNA主要就是根据相关性来找出一些co-express的gene module. 单细胞的转录组的玩法就比较多了,可以理解为超多样本的普通转录组,普通转录…
gene ontology为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,更糟糕的是,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样,这让信息查找更加麻烦,尤其是使得机器查找无章可循.Gene Ontology就是为了解决这种问题而发起的一个项目.    Gene Ontology中最基本的概念是term.GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term名,比如"cell", "fibroblast gro…
参考:高通量测序相关名词 Isotig 指在转录组de novo测序时,用454平台测序完成后组装出的结果,一个isotig可视为一个转录本. Isogroup 指转录组de novo测序中,用454平台测序完成后组装出的结果获得的可聚类到同一个基因的转录本群. alternative splicing:可变剪切 gene loci:基因座(wiki), 转录表达谱:又叫基因表达谱,翻译表达谱的话,就是蛋白表达谱. 表达谱差异分析(differential expression profilin…
无生物学重复RNA-seq分析 CORNAS: coverage-dependent RNA-Seq analysis of gene expression data without biological replicates BMC Bioinformatics 的一篇文章中提出了一种新的差异基因分析方法. 这篇文章提出了CORNAS(COverage-dependent RNA-Seq) 方法,利用贝叶斯方法来推断真实基因表达数的  后验分布. 其创新型之一该方法包括了由RNA样品浓度决定的…
题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=1027 http://poj.org/problem?id=1080 解题报告: 1.类似于LCS 2.gene[i][j]表示str1[i-1]和str2[j-1]的分值串没有,则应该扣分 3.递推公式 temp1=gene[i-1][j-1]+score[_map[str1[i-1]]][_map[str2[j-1]]]; temp2=gene[i-1][j]…