连锁不平衡 (linkage disequilibrium, LD)是指分属两个或两个以上基因座位的
等位基因同时出现在一条
染色体上的几率,高于随机出现的频率。这种现象不仅可以发生在同一条
染色体上的不同区域,也可以发生在不同染色体上。连锁不平衡的程度受多种因素影响,包括遗传连锁、
自然选择、
基因重组的概率、突变率、
遗传漂变、
婚配制度、选型
交配以及
种群结构等。因此,
基因组中连锁不平衡的模式是构建它的群体遗传过程的一个强有力的信号。尽管名为“连锁不平衡”,但不同位点上不存在遗传连锁的等位基因之间也可能存在连锁不平衡,且与
等位基因频率是否处于平衡无关。
由于HLA不同基因座位的某些基因经常连锁在一起遗传,而连锁的基因并非完全随机地组成单体型,有些基因总是较多地在一起出现,致使某些单体型在群体中呈现较高的频率,从而引起连锁不平衡。连锁不平衡性也被称作
配子水平的不平衡性或配子不平衡性,但这一概念同样适用于无性生物,因此不依赖于配子的存在。
例如两个相邻的基因A B, 他们各自的
等位基因为a b. 假设A B相互独立遗传,则后代群体中观察得到的单倍体
基因型 AB 中出现的P(AB)的概率为 P(A) * P(B).
实际观察得到群体中单倍体基因型 AB 同时出现的概率为P(AB)。 若这两对等位基因是非随机结合的,则P(AB)≠P(A)*P(B)。计算这种不平衡程度的方法为: D = P(AB)- P(A) * P(B).
连锁不平衡分析在连锁不平衡程度的评估、复杂疾病精细定位以及研究人类的历史和迁移中得到了越来越广泛的应用。连锁不平衡又称
等位基因关联(allelic association),其原理其实很简单。
假定两个紧密连锁的位点1,2,各有两个等位型(A,a;B,b),那么在同一条
染色体上将有四种可能的组合方式:A—B,A—b,a—B,和a—b。
假定等位型A的频率为Pa,B的频率为Pb,那么如果不存在连锁不平衡(如组成
单倍型的等位型间相互独立,随机组合)单倍型A—B的频率就应为PaPb。而如果A与B是相关联的,单倍型A—B的频率则应为PaPb+D,D是表示两位点间LD程度的值。
如果位点2上的等位型B与疾病易患性有关,那么将会观察到等位型A的频率在病人群体中高于对照群体。换句话说,等位型A与该疾病
性状相关。
事实上,可以检测遍布
基因组中的大量
遗传标记位点,或者候选基因附近的遗传标记来寻找到因为与致病位点距离足够近而表现出与疾病相关的位点,这就是
等位基因关联分析或连锁不平衡定位基因的基本思想。