paper:cepip: context-dependent epigenomic weighting for prioritization of regulatory variants and disease-associated genes

Genotype-Tissue Expression Project (GTEx) - genome上的eQTL位点及其对特定组织的特定基因表达的影响,同时包含了不同eQTL之间的LD关系。这个整合多个疾病的数据。正如其名,该数据包含了genotype、tissue和gene表达的数据。

Roadmap Epigenomics Project - 测了成人各个组织以及胚胎发育过程中多个组织的表观数据(DNA甲基化、组蛋白修饰、开放染色质等),相当于ENCODE的补充,可以用于解读GWAS的变异数据。browser

这个研究的思路是什么?怎么构思的?可行性分析?预测regulatory variants在特定tissue或celltype里对基因调控的影响。

优势是什么?有的位点没有eQTL,但是我还是可以根据roadmap来预测

输入输出是什么?输入就是一个一个的SNP的数据,输出就是每一个SNP在每一个tissue里面的regulatory potential score

如何整合各种数据库的? 两个:epigenomic和eQTLs,identify chromatin features来预测变异的调控潜能。estimating a variant’s regulatory probability

RoadMap里面有疾病样本吗?没有,只有正常的组织样本。

context-dependent是什么意思?这里明显再装逼,context就是tissue。highly context-specific gene regulation,context-dependent manner,Genes are regulated in a highly context-specific manner. Both genetic and epigenetic gene regulations are tissue/cell type-specific and depend on chromatin states and interactions.

如何评价此方法的优劣?significant GWAS signal enrichment,using phenotypically relevant epigenomes to weight the GWAS singlenucleotide polymorphisms, we improve the statistical power of the gene-based association test

这个工具不针对任何疾病,只是利用了现有的GTEx的数据,最终就是输入SNP的数据,通过表观的打分,告诉你你某个组织里基因表达调控受影响的概率(是吗?)。

compute the composite likelihood of a given variant affecting the gene regulation,早就有人在做的打分工作了。

In this study, we used epigenomic maps of 127 tissues/cell types from the Roadmap Epigenomics Project [33] to develop a context-dependent model that could examine important chromatin features surrounding an eQTL and predict its regulatory potential.

对于复杂性状,通常会由很多遗传因素来控制,从而影响到表型。GWAS鉴定出了很多SNP,但是却只能解释部分heritability。

怎么鉴定带有一定effect size的causal的变异来解释缺失的heritability是现在的研究热点。大白话就是现在的GWAS只关注 pvalue < 5x10^-8 的SNP,但这些SNP只能解释很小一部分的遗传性,现在普遍认为缺失的那部分就是pvalue略小的SNP中。

这些SNP大部分都坐落在非编码区,覆盖了大量的基因调控元件,说明这些causal SNPs是通过影响基因表达来影响表型的。

Identifying causal variants with moderate effect size underlying the missing heritability is currently one of the biggest challenges

The majority of GWAS risk loci, as well as loci with subgenome-wide significance (P values between 1 × 10−5 and 5 × 10−8), localize to non-coding genomic regions with many gene regulatory signals [3], suggesting that most trait/disease causal SNPs exert their phenotypic effects by altering gene expression

另一个证据就是这些SNPs会富集在eQTL和开放染色质区域。

This is further supported by GWAS risk loci being enriched in genomic regions with many expression quantitative trait loci (eQTLs) and open chromatins

基因调控具有高度的tissues and celltypes特异性。

进阶:

epigenomic feature as predictors to predict eQTL,这是在训练的时候

tissue matching between two database,three method to do matching

variant变异 | Epigenome表观基因组 | Disease-susceptible gene 疾病易感基因的更多相关文章

  1. 综述 - 染色质可及性与调控表观基因组 | Chromatin accessibility and the regulatory epigenome

    RNA-seq这个工具该什么时候用?ATAC-seq该什么时候用?有相当一部分项目设计不行,导致花大钱测了一些没有意义的数据. 还是在中心法则这个框架下来解释,这是生物信息的核心.打开华大科技服务官网 ...

  2. 表观 | Enhancer | ChIP-seq | 转录因子 | 数据库专题

    需要长期更新! 参考:生信修炼手册 enhancer的基本概念: 长度几十到几千bp,作用是提高靶基因活性,属于顺式作用原件,DNA作用到DNA,转录因子就是反式,是结合到DNA的蛋白. 1981年, ...

  3. 项目文章|DNA(羟)甲基化研究揭示铁离子依赖表观调控促进狼疮致病性T细胞分化|易基因

    易基因(羟)甲基化DNA免疫共沉淀测序(h)MeDIP-seq研究成果见刊<Journal of Clinical Investigation> 2022年5月2日,中南大学湘雅二医院赵明 ...

  4. DNA methylation|Transcription factors|PTM|Chromosome conformation|表观遗传学测序技术

    生物医疗大数据-DNA element functions and identification Genetic vs epigenetic GENETICS  遗传学 DNA Code: 64 tr ...

  5. (转载)RNA表观遗传学开创者何川

    何川,RNA表观遗传学开创者.早年毕业于中国科技大学,2000年获麻省理工学院博士学位,2000到2002年在哈佛大学做博士后研究,2002年至今执教芝加哥大学化学系, 是芝加哥大学生物物理动态研究所 ...

  6. 基于基因调控网络(Hopfield network)构建沃丁顿表观遗传景观

    基因调控网络的概念在之前已经简要介绍过:https://www.cnblogs.com/pear-linzhu/p/12313951.html 沃丁顿表观遗传景观(The Waddington's e ...

  7. Landsat TM DN值转为表观反射率

    日地距离计算参见<中华人民共和国气象行业标准太阳能资源评估方法>  

  8. JQuery表单验证插件EasyValidator,超级简单易用!

    本插件的宗旨是:用户无需写一行JS验证代码,只需在要验证的表单中加入相应的验证属性即可,让验证功能易维护,可扩展,更容易上手. DEMO中已经包含了常用的正则表达式,可以直接复用,为了考虑扩展性,所以 ...

  9. 单细胞测序|单细胞基因组|单细胞转录组|Gene editing|

    单细胞测序 单细胞基因组学 测量理由是单细胞的时间空间特异性. Gene expression&co-expression 比较正常cell与疾病cell,正常organ与疾病organ,看出 ...

随机推荐

  1. sqlalchemy之基础操作

    原文链接:https://www.cnblogs.com/DragonFire/p/10166527.html

  2. go工程组织规范

    go编码以workspace形式管理,一个workspace包含所有的Go编码,包含多个版本控制仓库(例如使用git管理的多个仓库).每个仓库包含多个包package,每个package是一个单独的路 ...

  3. centos7小命令

    修改时区:timedate [root@centos2 ~]# timedatectl set-timezone Asia/Shanghai 修改语言:localectl [root@centos2 ...

  4. Linux操作系统的文件查找工具locate和find命令常用参数介绍

    Linux操作系统的文件查找工具locate和find命令常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.非实时查找(数据库查找)locate工具  locate命 ...

  5. 2013.5.2 - KDD第十四天

    今天早上来了之后就处理语料,然后发现处理好后的gbk编码的语料在HPC上没法训,而utf8在上面训练可以.后来就让它在上面训着,学长还没来. 学长回来之后问他怎么回事,他说不应该,然后我们看了一下第一 ...

  6. 微信小程序~调试

    小程序调试面板 模拟器 模拟器模拟微信小程序在客户端真实的逻辑表现,对于绝大部分的 API 均能够在模拟器上呈现出正确的状态. 自定义编译 点击工具栏中的编译按钮或者使用快捷键 Ctrl(⌘) + B ...

  7. [08001] Could not create connection to database server. Attempted reconnect 3 times. Giving up.

    使用idea连接数据库的时候,报错为 [08001] Could not create connection to database server. Attempted reconnect 3 tim ...

  8. Python开发笔记之-字符串函数

    1.首字母大写 >>> s = 'yuanzhumuban' >>> s.capitalize() 'yuanzhumuban'  2.replace,替换 > ...

  9. 语义(Semantics)

    流计算语义(Semantics)的定义 每一条记录被流计算系统处理了几次 有三种语义: 1.At most once 一条记录要么被处理一次,要么没有被处理 2.At least once 一条记录可 ...

  10. Hibernate框架的查询方式

    技术分析之Hibernate框架的查询方式        1. 唯一标识OID的检索方式        * session.get(对象.class,OID)    2. 对象的导航的方式       ...