I.9 Linkage

INDEPENDENCE OF GENOTYPES AT TWO LOCI:若A,B是两个独立位点:PA是基因A的概率,PB是基因B的概率。因为基因A与基因B是相互独立的位点,所以基因型AABB的概率为PAABB=(PA)^2*(PB)^2

A RETROSPECTIVE DERIVATION.:

前提一:假设存在两个种群,这两个种群中:A的基因频率PA=1/2、B的基因频率PB=1/2。其中种群1:配子AB和ab各占1/2;种群2:配子Ab,AB,aB,ab各占1/4。因为基因频率不发生改变,所以配子AB的频率一直保持1/4,即PAB=1/4。

前提二:设重组率为r,在第t个世代下,亲代的AB配子频率是PAB。减数分裂过程中存在两种情况:

  1. 不发生重组:概率为1-r,此时配子中的AB都来自一个亲代(本质上认为C=AB,即配子上的C基因,该基因频率满足哈代公式(因为从亲代到任何一代子代都是随机交配的),所以基因频率不发生改变,所以PAB不发生改变)
  2. 发生重组:概率为r,配子中的AB分别来自该亲代的上一代,该亲代的上一代的配子频率,就是该亲代的基因频率,所以本质上是计算亲代中基因型为AB的频率PAB,则为PAPB(上一代配子频率相乘)

基于以上分析,得到第一代配子为AB的频率为:

第一代子代配子是AB的频率,即PAB1,即AB发生连锁的频率

亲代配子是AB的频率,即PAB,即AB发生连锁的频率

PAPB是组成AB配子不发生连锁,仅发生重组的频率,所以可以通过此式分析不同世代之间(连锁与重组)的差异,并将这些差异定义为D(t)其中,t为第几世代,所以:

当计算无穷世代时,便令t->正无穷,因为指数函数,底数为小数,当自变量趋近于无穷时,整个函数值趋近于0,所以得到:

此时基因A与基因B都满足哈代平衡且独立遗传。

所以,最后的平衡称为连锁平衡linkage equilibrium,DAB(t)值称为连锁不平衡参数(linkage disequilibrium)

连锁平衡是在遗传过程中,不同基因座上的等位基因按照随机 原则进行组合时,不同基因座的等位基因组 合的频率等于组合等位基因各自频率的积, 不存在优势组合。这种基因座间没有相关性的状态称为连锁平衡,此时连锁不平衡参数值为0。

连锁不平衡: 在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称连锁不平衡

将DAB(t)打开可得到以下表达式:

(1-r)^t代表直到t个世代为止,发生连锁的概率,这些连锁的基因导致了一系列的连锁不平衡。

1-((1-r)^t)代表直到t个世代为止,发生重组的概率

PAB(0)是亲代便是AB连锁的概率

PAPB是AB重组的概率

连锁不平衡现象终会发展为连锁平衡。

进化角度:Recombination gradually scrambles the initial associations of alleles at different loci, until a state of complete randomness is obtained, in which each chromosome is a patchwork of segments derived from different ancestors.

所以,若存在AB基因的连锁平衡,则A基因和B基因是独立遗传,不会相互影响。

SIMPLIFYING POPULATION GENETICS: THE GENE POOL:

如果配子有20个基因座,则配子有2^20种基因型,则组成的二倍体有2^40种基因型,则可区分的基因型有3^20种(eg,原本是四种基因型AA,Aa,aa,Aa,但实际上只有三种基因型,AA,Aa,aa)在连锁平衡之前,配子pool不等于基因pool;在连锁平衡之后,可以通过研究配子基因型(配子pool就是基因pool)来研究二倍体基因型。

A MORE DIRECT DERIVATION:

亲代配子为AB的频率是PAB

则产生ABAB子代的频率是PABAB=PABPAB,该子代产生配子AB的概率是1

分析如下:

总结后得到:

将产生子代第一代配子为AB的频率总结得到:

依据配子概率之和为1以及配子的概率关系,得到:

化简:

该式说明了第一代子代配子由连锁的亲代配子和重组的配子组成。

显然红框中的式子相等,所以:

这说明了连锁和重组之间的差异在于双杂合子基因型频率的差异。

因为连锁不平衡参数D被定义为连锁概率-重组概率,所以,对于所有可能配子频率(单体型频率),有如下频率(对于单体型来说是基因型频率)

根据式子两两比较,可以得知,

根据基因频率与基因型的关系,可以得知

因此,所有不平衡参数可定义为一个变量D,所以:

相似的,可以将该等位基因A,a推广到所有等位基因A1A2A3A4……,在不断繁衍过程中,连锁不平衡参数将会不断向0靠近,并且以(1-r)^t的速度靠近0。

linkage disequilibrium|linkage equilibrium的更多相关文章

  1. GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing

    现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...

  2. chromosome interaction mapping|cis- and trans-regulation|de novo|SRS|LRS|Haplotype blocks|linkage disequilibrium

    Dissecting evolution and disease using comparative vertebrate genomics-The sequencing revolution   s ...

  3. Linkage Disequilibrium|D‘|r2

    I.10 Other Measures of Linkage Disequilibrium 因为D的取值强烈地依赖于人为制定的等位基因频率(PA及PB),所以它不利于LD程度的比较.标准化的不平衡系数 ...

  4. signals function|KNN|SVM|average linkage|Complete linkage|single linkage

    生物医疗大数据 存在系统误差使得估计量有偏,如下图红色和蓝色图形,存在随机误差使得估计量并不是同一个值,如图中除去期望之外的曲线值,为了控制随机抽样造成的误差,可以使用p-value决定是否服从假设检 ...

  5. 收集vcftools所有用法

    VCFtools用来处理VCF文档. 筛选特定突变 比较文件 总结突变 转化文件格式 验证并合并文件 取突变交集和差集 Get basic file statistics input可以为VCF或BC ...

  6. VCFtools

    The C++ executable module examples This page provides usage examples for the executable module. Exte ...

  7. GWAS Catalog数据库简介

    GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS ...

  8. GWAS 全基因组关联分析 | summary statistic 概括统计 | meta-analysis 综合分析

    有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:① ...

  9. Dnasp计算LD

    Dnasp计算LD Table of Contents 1 Dnasp 计算LD 1 Dnasp 计算LD Dnasp有很多的功能,现在主要来记录其计算LD的功能. 首先File——然后打开data— ...

随机推荐

  1. jQuery课上笔记19.5.17

    jQuery 选择器 $("*"):所有元素 $("#idname"):id="idname"的元素 $(".classname& ...

  2. Maven - 工作原理

    章节 Maven – 简介 Maven – 工作原理 Maven – Repository(存储库) Maven – pom.xml 文件 Maven – 依赖管理 Maven – 构建生命周期.阶段 ...

  3. python复习——字符串

    1.字符串:用双引号括起的内容 2.title()——首字母大写:print(变量名.title()) upper()——全部大写:print(变量名.upper()) lower()——全部小写:p ...

  4. PAT Advanced 1143 Lowest Common Ancestor (30) [二叉查找树 LCA]

    题目 The lowest common ancestor (LCA) of two nodes U and V in a tree is the deepest node that has both ...

  5. VS.NET中的常用控件和类型的命名规范

    表1  命名规范 VS名称 简写 VS名称 简写 数据类型 Array arr Boolean bln Byte byt Char Chr Date Time dtm Decimal dtm Doub ...

  6. ansible下载文件的多种方式

    对于ansible来说,下载文件是一个很重要的课题,这是build或者deploy的第一步,通常来讲由于不同项目的差异,可能我们的代码包或者资源文件保存在于http,github,nexus,ftp, ...

  7. CTF -bugku-misc(持续更新直到全部刷完)

    1.签到题 点开可见.(这题就不浪费键盘了) CTF- 2.这是一张单纯的图片 图片保存到本地,老规矩,winhex看一看 拉到最后发现 因为做过ctf新手的密码 所以一看就知道unicode 百度站 ...

  8. Cracking Digital VLSI Verification Interview 第一章

    目录 Digital Logic Design Number Systems, Arithmetic and Codes Basic Gates Combinational Logic Circuit ...

  9. try,catch,finally尝试(一个程序块多个catch)

    曾学过c++,但是对这些异常捕捉不是很了解,通过别的编程语言了解 public class newclass { public static void main(String[] args) { tr ...

  10. 干货 | 京东技术中台的Flutter实践之路

    在 2019 年,Flutter 推出了多个正式版本,支持的终端越来越多,使用的项目也越来越多.Flutter 正在经历从小范围尝鲜到大面积应用的过程,越来越多的研发团队加入到 Flutter 的学习 ...