I.9 Linkage

INDEPENDENCE OF GENOTYPES AT TWO LOCI:若A,B是两个独立位点:PA是基因A的概率,PB是基因B的概率。因为基因A与基因B是相互独立的位点,所以基因型AABB的概率为PAABB=(PA)^2*(PB)^2

A RETROSPECTIVE DERIVATION.:

前提一:假设存在两个种群,这两个种群中:A的基因频率PA=1/2、B的基因频率PB=1/2。其中种群1:配子AB和ab各占1/2;种群2:配子Ab,AB,aB,ab各占1/4。因为基因频率不发生改变,所以配子AB的频率一直保持1/4,即PAB=1/4。

前提二:设重组率为r,在第t个世代下,亲代的AB配子频率是PAB。减数分裂过程中存在两种情况:

  1. 不发生重组:概率为1-r,此时配子中的AB都来自一个亲代(本质上认为C=AB,即配子上的C基因,该基因频率满足哈代公式(因为从亲代到任何一代子代都是随机交配的),所以基因频率不发生改变,所以PAB不发生改变)
  2. 发生重组:概率为r,配子中的AB分别来自该亲代的上一代,该亲代的上一代的配子频率,就是该亲代的基因频率,所以本质上是计算亲代中基因型为AB的频率PAB,则为PAPB(上一代配子频率相乘)

基于以上分析,得到第一代配子为AB的频率为:

第一代子代配子是AB的频率,即PAB1,即AB发生连锁的频率

亲代配子是AB的频率,即PAB,即AB发生连锁的频率

PAPB是组成AB配子不发生连锁,仅发生重组的频率,所以可以通过此式分析不同世代之间(连锁与重组)的差异,并将这些差异定义为D(t)其中,t为第几世代,所以:

当计算无穷世代时,便令t->正无穷,因为指数函数,底数为小数,当自变量趋近于无穷时,整个函数值趋近于0,所以得到:

此时基因A与基因B都满足哈代平衡且独立遗传。

所以,最后的平衡称为连锁平衡linkage equilibrium,DAB(t)值称为连锁不平衡参数(linkage disequilibrium)

连锁平衡是在遗传过程中,不同基因座上的等位基因按照随机 原则进行组合时,不同基因座的等位基因组 合的频率等于组合等位基因各自频率的积, 不存在优势组合。这种基因座间没有相关性的状态称为连锁平衡,此时连锁不平衡参数值为0。

连锁不平衡: 在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称连锁不平衡

将DAB(t)打开可得到以下表达式:

(1-r)^t代表直到t个世代为止,发生连锁的概率,这些连锁的基因导致了一系列的连锁不平衡。

1-((1-r)^t)代表直到t个世代为止,发生重组的概率

PAB(0)是亲代便是AB连锁的概率

PAPB是AB重组的概率

连锁不平衡现象终会发展为连锁平衡。

进化角度:Recombination gradually scrambles the initial associations of alleles at different loci, until a state of complete randomness is obtained, in which each chromosome is a patchwork of segments derived from different ancestors.

所以,若存在AB基因的连锁平衡,则A基因和B基因是独立遗传,不会相互影响。

SIMPLIFYING POPULATION GENETICS: THE GENE POOL:

如果配子有20个基因座,则配子有2^20种基因型,则组成的二倍体有2^40种基因型,则可区分的基因型有3^20种(eg,原本是四种基因型AA,Aa,aa,Aa,但实际上只有三种基因型,AA,Aa,aa)在连锁平衡之前,配子pool不等于基因pool;在连锁平衡之后,可以通过研究配子基因型(配子pool就是基因pool)来研究二倍体基因型。

A MORE DIRECT DERIVATION:

亲代配子为AB的频率是PAB

则产生ABAB子代的频率是PABAB=PABPAB,该子代产生配子AB的概率是1

分析如下:

总结后得到:

将产生子代第一代配子为AB的频率总结得到:

依据配子概率之和为1以及配子的概率关系,得到:

化简:

该式说明了第一代子代配子由连锁的亲代配子和重组的配子组成。

显然红框中的式子相等,所以:

这说明了连锁和重组之间的差异在于双杂合子基因型频率的差异。

因为连锁不平衡参数D被定义为连锁概率-重组概率,所以,对于所有可能配子频率(单体型频率),有如下频率(对于单体型来说是基因型频率)

根据式子两两比较,可以得知,

根据基因频率与基因型的关系,可以得知

因此,所有不平衡参数可定义为一个变量D,所以:

相似的,可以将该等位基因A,a推广到所有等位基因A1A2A3A4……,在不断繁衍过程中,连锁不平衡参数将会不断向0靠近,并且以(1-r)^t的速度靠近0。

linkage disequilibrium|linkage equilibrium的更多相关文章

  1. GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing

    现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...

  2. chromosome interaction mapping|cis- and trans-regulation|de novo|SRS|LRS|Haplotype blocks|linkage disequilibrium

    Dissecting evolution and disease using comparative vertebrate genomics-The sequencing revolution   s ...

  3. Linkage Disequilibrium|D‘|r2

    I.10 Other Measures of Linkage Disequilibrium 因为D的取值强烈地依赖于人为制定的等位基因频率(PA及PB),所以它不利于LD程度的比较.标准化的不平衡系数 ...

  4. signals function|KNN|SVM|average linkage|Complete linkage|single linkage

    生物医疗大数据 存在系统误差使得估计量有偏,如下图红色和蓝色图形,存在随机误差使得估计量并不是同一个值,如图中除去期望之外的曲线值,为了控制随机抽样造成的误差,可以使用p-value决定是否服从假设检 ...

  5. 收集vcftools所有用法

    VCFtools用来处理VCF文档. 筛选特定突变 比较文件 总结突变 转化文件格式 验证并合并文件 取突变交集和差集 Get basic file statistics input可以为VCF或BC ...

  6. VCFtools

    The C++ executable module examples This page provides usage examples for the executable module. Exte ...

  7. GWAS Catalog数据库简介

    GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS ...

  8. GWAS 全基因组关联分析 | summary statistic 概括统计 | meta-analysis 综合分析

    有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:① ...

  9. Dnasp计算LD

    Dnasp计算LD Table of Contents 1 Dnasp 计算LD 1 Dnasp 计算LD Dnasp有很多的功能,现在主要来记录其计算LD的功能. 首先File——然后打开data— ...

随机推荐

  1. linux文件编辑VI命令详解

    vi编辑器是所有Unix及Linux系统下标准的编辑器,它的强大不逊色于任何最新的文本编辑器,这里只是简单地介绍一下它的用法和一小部分指令.由于对Unix及Linux系统的任何版本,vi编辑器是完全相 ...

  2. 2020/2/3 PHP代码审计之PHP弱类型

    0x00 简介 php中有两种比较的符号 == 与 === <?php 2 $a = $b ; 3 $a===$b ; 4 ?> === 在进行比较的时候,会先判断两种字符串的类型是否相等 ...

  3. mysql锁探究和实验

    如何保证数据并发访问的一致性.有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素.从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂. 表锁和行锁 mysql最显 ...

  4. MBR&/BOOT&GRUB

      能正常工作的grub应该包 括一下文件:stage1.stage2.*stage1_5.menu.lst. 其中stage1要被安装(也就是写入)某个硬盘的主引导记录,或者某个活动分区(这个分区要 ...

  5. Go get unrecognized import path "gopkg.in/yaml.v2"

    安装gin: go get -u github.com/gin-gonic/gin 出现错误: package gopkg.in/yaml.v2: unrecognized import path & ...

  6. UVA_10603 倒水问题 隐式图搜索

    这道题目是刘汝佳白书上的例题,没有LRJ在白书上提到的划归为搜索问题,还真是一时难以想到好的解法.即三个瓶子,任意的一个状态都是一个节点,最后就划归为一个搜索问题. 由于题目数据量不大,三个杯子容量都 ...

  7. 1-4 无监督学习(Unsupervised Learning)

    无监督学习定义: [无监督学习]中没有任何的标签或者是有相同的标签或者就是没标签.所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么.别的都不知道,就是一个数据集.你能从数据中找到某种结构吗 ...

  8. IUBS|CODATA|Open Data in a Big Data World|National Genomics Data Center

    生命组学: National Genomics Data Center中的section: LncRNA知识库+non-code加入RNA central GWAS Atlas基因组关联分析数据库 E ...

  9. 用Axure画原型图有感

    感觉前端做UE非常有优势啊- 但是在制作的时候,似乎陷入了误区: (1)只求原型图的漂亮,色彩丰富,忽略了其本质作用,是用来整理逻辑,画出逻辑流程的. (2)一开始就追求交互,高保真的原型,忽视了细节 ...

  10. java 实现递归实现tree(2)

    import com.google.common.collect.Lists; import org.springframework.cglib.beans.BeanCopier; import ja ...