linkage disequilibrium|linkage equilibrium】的更多相关文章

I.9 Linkage INDEPENDENCE OF GENOTYPES AT TWO LOCI:若A,B是两个独立位点:PA是基因A的概率,PB是基因B的概率.因为基因A与基因B是相互独立的位点,所以基因型AABB的概率为PAABB=(PA)^2*(PB)^2 A RETROSPECTIVE DERIVATION.: 前提一:假设存在两个种群,这两个种群中:A的基因频率PA=1/2.B的基因频率PB=1/2.其中种群1:配子AB和ab各占1/2:种群2:配子Ab,AB,aB,ab各占1/4.…
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp,大多数都找到了很多的snp,而且snp都落在非编码区了,这就导致对这些snp的解读非常的困难. 目前,已经有非常傻瓜式的GWAS pipeline了,比如:A tutorial on conducting genome‐wide association studies: Quality contr…
Dissecting evolution and disease using comparative vertebrate genomics-The sequencing revolution   short-read sequencing (SRS) (因大规模基因组数据需要,采用Illumina paired-end,短序列)->genome assembly and long-read sequencing (LRS) (因长序列的需要)   Sequencing 和assembly两个模…
I.10 Other Measures of Linkage Disequilibrium 因为D的取值强烈地依赖于人为制定的等位基因频率(PA及PB),所以它不利于LD程度的比较.标准化的不平衡系数D'能够避免这种对等位基因频率的依赖.D'的计算方法如下: D'=D/Dmax 这样使得-1<D<1 但当其他所有概率保持不变,当D取分别取正值或负值时,D’值会有所改变,这说明D’在经历0点时会发生变化. 所以,在此加入相关系数r,推导如下: 若相关系数为0,则证明两者独立. 所以,当PA=PB…
生物医疗大数据 存在系统误差使得估计量有偏,如下图红色和蓝色图形,存在随机误差使得估计量并不是同一个值,如图中除去期望之外的曲线值,为了控制随机抽样造成的误差,可以使用p-value决定是否服从假设检验,判断两个变量之间相关性的有无. 相关系数:该系数广泛用于度量两个变量之间的线性相关程度. 建立模型: 技术种类:线性模型&机器学习模型 按输出数据分类:监督学习模型&非监督学习模型 Average linkage demo 第一个矩阵是原始数据,单未知数据结构,通过average link…
VCFtools用来处理VCF文档. 筛选特定突变 比较文件 总结突变 转化文件格式 验证并合并文件 取突变交集和差集 Get basic file statistics input可以为VCF或BCF格式(--vcf --gvcf or --bcf). vcftools --vcf test.vcf less test.vcf | vcftools --vcf - Applying a filter 可以把筛选的突变写入一个新文件.--recode 表示输出筛选的内容,--recode-INF…
The C++ executable module examples This page provides usage examples for the executable module. Extended documentation for all of the options can be found on the manual page. Running the program Getting basic file statistics Applying a filter Writing…
GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS研究的数据库 Catalog stats Last data release on 2019-09-24 4220 publications 107486 SNPs 157336 associations Genome assembly GRCh38.p12 dbSNP Build 151 Ense…
有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:①染色体号:②臂的符号:③区号:④在该区内的带号. 1p22表示为1号染色体短臂2区2带. 等位基因其实是一个集合,在同一个locus出现得基因型互为等位基因.Aa不能叫等位基因,正确的逻辑是:A和a是一组等位基因.由等位基因可以定义纯合和杂合. 二倍体与多倍体细胞的某些染色体上,在同一基因座上有相同…
Dnasp计算LD Table of Contents 1 Dnasp 计算LD 1 Dnasp 计算LD Dnasp有很多的功能,现在主要来记录其计算LD的功能. 首先File——然后打开data——然后在Data中Format里设 置格式,也就是你读入的文件是什么样子的,进行一个 描述.我们这里选DNA,Haploid(单倍体),然后OK,然后到Ana lysis找到Linkage Disequilibrium.这里要注意的是 生成的文件会非常的大.因为这是两两对比得到的结果. 得到的结果,…