Finding Enriched Motifs in Genomic Regions (findMotifsGenome.pl) 在指定区域做motif enrichment,大大降低了假阳性. MEME也可以做,但是设定更加复杂. 转录因子的表达具有高度的组织特异性,而且已知的TF只有1000多个,基因有30000多个,所以一个TF的靶基因可能有几百个,而且具有高度的时空组织特异性. 实验的方法就不说了,可靠.成本高.耗费劳力. 以下只说高通量数据的预测方法. 最简单的预测就是基于基因表达,c…
miRNA分析--数据过滤(一) miRNA分析--比对(二) 根据miRNA Target Prediction in Plants, miRNA并非所有区域都要求严格匹配,其中第1位碱基和第14位以后的碱基是允许错配(以miRNA 5'为始). miRNA 文件提交不管是U或者T都是可以的 miRNA 靶基因预测我采用了3个工具 1.psRNATarget: A plant Samll RNA Target Analysis Server 进去以后,提交自己miRNA文件,fasta格式,并…
转载:http://www.oebiotech.com/Article/mirnabjyyc.html http://www.ebiotrade.com/newsf/2014-9/201492594150379.htm miRNA自从被发现以来,一直备受关注,俨然已成为非编码RNA家庭中永不凋零的“玫瑰”.关于miRNA,主要有两个研究方向,其一是作为biomarker,这方面研究仅需足够庞大的临床样本支撑即可:miRNA的另一研究方向为功能机制研究,此时必须有miRNA靶基因的参与,可是如何确…
PASA, acronym for Program to Assemble Spliced Alignments, is a eukaryotic genome annotation tool that exploits spliced alignments of expressed transcript sequences to automatically model gene structures, and to maintain gene structure annotation cons…
SVM软件包 LIBSVM -- A Library for Support Vector Machines(本项目所用到的SVM包)(目前最新版:libsvm-3.21,2016年7月8日) C-SVC(C-support vector classification), nu-SVC(nu-support vector classification), one-class SVM(distribution estimation), epsilon-SVR(epsilon-support vec…
TargetScan 是一个miRNA 靶基因预测的网站, 包括了 人, 小鼠,果蝇 , 线虫, 斑马鱼 共5个物种的miRNA 靶基因结果, 人 : TargetScanHuman 小鼠 :TargetScanMouse 果蝇:TargetScanFly 线虫:TargetScanWorm 斑马鱼 : TargetScanFish 以human 为例,进行说明,网址如下: http://www.targetscan.org/vert_71/ 最新版本为release 7.1, 2016年6月更…
MicroRNA (miRNA)  是一类内生的.长度约为20-24个核苷酸的小 RNA,其在细胞内具有多种重要的调节作用.每个 miRNA 可以有多个靶基因的表达,而几个 miRNA 也可以调节同一个基因的表达.据推测,miRNA 调节着人类三分之一的基因. miRNA命名 1.物种 hsa.mmu.rno分别代表人.小鼠.大鼠. 2.类别 mir.MIR.miR分别代表动物未成熟miRNA.植物未成熟miRNA.成熟 RNA. 3.序号 即阿拉伯数字.代表miRNA发现的先后顺序.一般情况下…
miRNA MicroRNA (miRNA)  是一类内生的.长度约为20-24个核苷酸的小 RNA,其在细胞内具有多种重要的调节作用.每个 miRNA 可以有多个靶基因的表达,而几个 miRNA 也可以调节同一个基因的表达.据推测,miRNA 调节着人类三分之一的基因. 1.物种 hsa.mmu.rno分别代表人.小鼠.大鼠. 2.类别 mir.MIR.miR分别代表动物未成熟miRNA.植物未成熟miRNA.成熟 RNA. 3.序号 即阿拉伯数字.代表miRNA发现的先后顺序.一般情况下,数…
目录 流程使用 问题 记录下braker2的使用要点,以备忘记. 流程使用 braker2有很多流程,根据你的数据:组装的基因组.转录组.蛋白(同源,包括近缘或远缘)选择不同流程,官网有说明: https://github.com/Gaius-Augustus/BRAKER 现在的动植物组装,大多数都含有以上三类数据吧,因此可选择如下流程,用公共数据库OrthoDB中的直系同源蛋白,根据自己的物种选择,有动物植物微生物等,如我选择植物就有300多万条序列. 作者指出,braker2并非证据越多越…
需要长期更新! 参考:生信修炼手册 enhancer的基本概念: 长度几十到几千bp,作用是提高靶基因活性,属于顺式作用原件,DNA作用到DNA,转录因子就是反式,是结合到DNA的蛋白. 1981年,Benerji发现SV40中某个140bp的序列可以显著提高血红蛋白融合基因的表达水平. 特性:远距离效应,无方向性. 如何鉴定enhancer区域: 对多个转录因子的peak区域进行聚类,识别增强子区域 将H3K4me1和K3K27ac这两种组蛋白修饰作为增强子区的mark 使用II型RNA聚合酶…
众所周知,全基因组关联分析(GWAS)发现的很多变异位点基本为非编码,这些变异位点1)要么调控基因表达(eQTL); 2)要么影响增强子活性; 3)要么影响转录因子(TF)结合特异性; 4)要么啥也不是. 针对以上四种情况: 1)是否调控基因表达(eQTL)可通过GTEx(https://gtexportal.org/home/)查询. 2)是否影响增强子活性可通过之前的推文查询:感兴趣的SNP/区域上是否有增强子/转录因子?增强子/转录因子调控哪个靶基因?(EnhancerDB) 3)是否影响…
做了好久的RNA-seq分析,基因表达也在口头溜了几年了,但似乎老是浮在表面. 对一件事的了解程度决定了你的思维深度,只想做技工就不用想太多,想做大师就一定要刨根问底. 老是说基因表达,那么什么是基因表达?我们测序得到的基因表达其实只是一种表型,是样本的一个快照,和普通的身高体重之类的连续型表型类似. 常规的转录组分析本质上都是表型分析,clustering.pseudotime.DEG.marker,在这些分析中,每个基因都是独立的维度,属于静态的分析,此时我们关注的是某个基因的功能分析,比如…
大家好,这里是专注表观组学十余年,多组学科研服务领跑者的易基因. 染色质免疫沉淀后测序(ChIP seq)是一种针对DNA结合蛋白.组蛋白修饰或核小体的全基因组分析技术.由于二代测序技术的巨大进步,ChIP-seq比其最初版本ChIP-chip具有更高的分辨率.更低的噪声和更大的覆盖范围.随着测序成本的降低,ChIP- seq已成为研究基因调控和表观遗传机制不可或缺的工具. 原理:甲醛处理细胞使目标蛋白与DNA交联,通过超声波将交联后的染色质打断成小片段,一般在200-600bp范围内.再利用抗…
易基因(羟)甲基化DNA免疫共沉淀测序(h)MeDIP-seq研究成果见刊<Journal of Clinical Investigation> 2022年5月2日,中南大学湘雅二医院赵明教授团队.中国医学科学院皮肤病医院陆前进教授团队合作在Journal of Clinical Investigation上发表了题为"Iron-dependent epigenetic modulation promotes pathogenic T cell differentiation in…
MSTE: 基于多向语义关系的有效KGE用于多药副作用预测 论文标题: Effective knowledge graph embeddings based on multidirectional semantics relations for polypharmacy side effects prediction 论文期刊: Bioinformatics 2021 MSTE: 基于多向语义关系的有效KGE用于多药副作用预测 摘要 1.引言 2.相关工作 2.1 KGE 2.2.1 基于平移的…
HumanNet v2:用于疾病研究的人类基因网络人类基因网络已被证明在疾病研究的许多方面都很有用,已经开发了许多基于网络的策略来产生关于基因 - 疾病 - 药物关联的假设.预测和组织与特定疾病最相关的基因的能力已被证明是特别重要的.我们之前通过使用贝叶斯统计框架整合各种类型的组学数据,开发了人类功能基因网络HumanNet,并展示了其检索疾病基因的能力.在这里,我们介绍HumanNet v2(http://www.inetbio.org/humannet),这是一个人类基因网络数据库,通过整合…
要做就做深做精! Everything needs good justification. The interpretation should be biologically and statistically sound. shit 做生信,等级确实是真实存在的,初级的就是没有什么想法,别人做什么我模仿着做一下,就是科技服务大部分的客户:中级的就是一个新东西出来了,我正好去抢某个点,典型的就是某些数据库,eRNA出来了,我就去数据挖掘搞个数据库:高级的就是会讲故事的,想法很好,能不断创新,对科…
scRNA-seq做完该做的QC.normalization.imputation.clustering.trajectory和integration,就会开始做转录调控的分析了. 核心就是围绕着TF转录因子做文章 预测TF的靶基因 鉴定regulon 大部分都是高通量的预测,准确性有待论证,需要很好的实验验证设计. 预测的工具不要太多: MARINa — Andrea Califano - paper SCENIC 什么是regulon? 这是一个高通量测序后发明的词,其实就是被同一个调控元件…
很多数据库都可以通过下面的网站下载:http://annovar.openbioinformatics.org/en/latest/user-guide/download/ 一.NHLBI-ESP(Exome Sequencing Project) 国家心肺和血液研究所外显子组测序计划(NHLBI-ESP project),这个计划中的esp6500si_all数据库中包含SNP变异.InDel变异和Y染色体上的变异的所有个体中,突变碱基的等位基因频率,通过注释,我们可以了解到突变在ESP650…
随着抗生素药物的发现及使用,越来越多的耐药菌株由此产生.而耐药菌株的发展则会增加疾病治疗的难度和成本,因此耐药微生物的研究则显得尤为重要.目前,通过对耐药基因的鉴定挖掘能够一定程度上帮助我们揭开耐药机制,为疾病的治疗.药物研发提供参考.ARDB是最先整合了各种微生物中抗药基因的数据库,但它从2009年开始就不再更新.而CARD(the Comprehensive Antibiotic Research Database)数据库包含了ARDB数据库中所有抗性信息,并搭建了一个基于志愿者贡献的数据共…
做生物的想发文章怎么办?转录调控来解析(huyou)! 最简单的情形: 1. 我在研究一个非常重要的基因A,功能已经做得差不多了,现在想深挖,第一步就是想知道哪个转录因子调控这个基因A: 2. 我发现了一个新颖的转录因子B,非常想知道这个TF到底在调控哪个基因. 研究方法不过几种: 1. RNA-seq分析差异基因,间接推测调控的转录因子. 2. 基于大量的ChIP-seq公共数据挖掘,用TF的抗体抓TF,同时抓下来TF结合的DNA,提取DNA,测序,就知道TF结合了哪些DNA,推测DNA附近的…
ALK FISH探针是FDA批准的用于检测肺癌患者中ALK重排的方法,这些患者可能受益于ALK激酶抑制剂.FISH测定在技术上可能具有挑战性并且难以解释.已经有研究者提出以ALK免疫组织化学和下一代测序作为替代方法.在本研究中,我们比较了各种ALK-FISH模式与下一代测序(NGS)针对基因融合的检测效果,以及ALK免疫组织化学(IHC)和肿瘤对克唑替尼的反应.在2116例肺腺癌样本中,72例(4%)是ALK-FISH阳性,其中28个ALK-FISH阳性病例用于研究,包括15个分裂信号(54%)…
文献名:Integrative Analysis of MicroRNAome, Transcriptome, and Proteome during the Limb Regeneration of Cynops orientalis(东方蝾螈肢体再生的小RNA组,转录组,蛋白质组综合分析) 期刊名:Journal of Proteome Research 发表时间:(2019年1月4日) IF:3.950 单位: 西北大学生命科学学院组织工程实验室 陕西生物技术省级重点实验室 教育部西部资源…
网络图(Network)看似复杂,其实构成非常简单,网络图是一种图解模型,形状如同网络,故称网络图,由节点(node)和连线(edge)两个因素组成的.其中 node 又分为 source node(源节点)和 target node(目标节点)两个因素组成的.这里的 node 就是我们的基因,edge 就是基因间的相互作用关系.任何网络图都不外乎这些构成成分.知道了网络图的构成之后,再做图分析就很简单了. 节点(node) 所谓的节点,就是我们要分析的基因.在一个网络图当中往往有数十个乃至上百…
1. 纪录片:非自然选择 1.1 CRISPR-Cas9的出现 1.2 故事1:先天性基因缺陷而失明的小孩 1.3 故事2:基因变异的蚊子 1.4 基因技术应用的现状 1.5 担忧 2. CRISPR基因编辑 2.1 Cas9 2.2 Cas12a(以前称为Cpf1) 2.3 Cas9与Cpf1 2.4 Anti-CRISPR 2.5 CRISPR/Cas工具 3. 基因敲除 4. DNA,RNA,染色体,基因,蛋白质 4.1 概念 4.2 DNA和RNA 4.3 物质关系: 4.4 功能关系:…
生物信息学-miRNA 转录组的分类: Noncoding RNA可分为负责Regulatory和housekeeping,housekeeping就是组织日常功能miRNA便是Regulatory RNA中的一种,长度18-22bp,具有短序列特异性,数量少于lncRNA,在相关物种中保守,20%-30%的miRNA可通过对non-coding RNA的靶向结合,达到调控编码蛋白质过程,从而调控制造蛋白质. miRNA参与生命活动,RNAi(RNA interference)是miRNA的一种…
目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki bean (Vigna angularis) provides insight into high starch and low fat accumulation and domestication 二.研究一(小豆基因组草图) 基因组组装 基因与重复序列预测 小豆驯化痕迹 标记开发及育种应用 红豆基因…
目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SNP/INDEL 分析和全基因组比对 遗传图谱构建 转座子(TE)检测和重复序列屏蔽 基因预测和注释 转录因子(TF)鉴定 非编码RNA鉴定 转录组组装和豇豆物种形成分析 抗病基因鉴定 全基因组复制分析 来源 Kang, Y., Kim, S., Kim, M. et al. Genome seque…
多重比对序列的格式及其应用   这里对多重序列比对格式(Multiple sequence alignment – MSA)进行总结.在做系统演化分析.序列功能分析.基因预测等,都需要涉及到多重序列比对.特别是当需要用不同软件对多重比对序列进行批量操作时,会遇到各种的格式,而这些格式是如何产生的,有什么区别,格式之间如何转换,从哪里可以下载到相关的格式序列,不同的格式又有什么特殊的用途等,本篇文章将就这些问题进行总结与讨论.因为涉及内容较多,不足之处,欢迎大家补充或者批判. 生物信息学的基础是基…
InterProScan 5.18-57.0 安装和使用,目前最新版的interproscan 引用自 每日一生信--interproscan安装及使用(终结版)原文官网:http://code.google.com/p/interproscan/wiki/Introduction 配置要求:至少2 cores and 4 GB of RAM, 这样才能同时分析5 - 10 sequences . 软件要求: Linux, 32 bit or 64 bit (64 bit recommended…