单体型(Haplotype,haploid
基因型)是指个体组织中,完全遗传自父母双方中一个亲本的一组
等位基因,又称为单倍体型或单元型。在三对双等位基因的情况下,单体型的数量可达8种。研究表明,拥有特定SNP的个体通常在其附近的特定变异
位点也拥有特定等位基因,这种现象被称为连锁不平衡(linkage disequilibrium,LD)。在同一
染色体上,这种情况就是单体型。
单体型是由一组相关联的SNP等位位点组成的,这些位点位于染色体上的特定区域。在一个染色体区域中,虽然可能有许多SNP位点,但只需要少量的标签SNPs就能反映该区域内的大部分遗传多态性。在大多数情况下,染色体区域仅包含几种常见的单体型,每种单体型的频率至少为5%,这代表了人群之间大部分的多态性差异。
人类群体中约有一千万个SNP
位点,其中稀有SNP的频率不低于1%。相邻SNPs的等位位点往往作为一个整体传递给下一代。单体型图描绘了人类常见的遗传多态性模式,其中包括
染色体上紧密关联的SNPs区域、这些区域中的单体型及其对应的标签SNPs。此外,单体型图还标识了SNP位点关联不紧密的区域。
医学研究者常通过对比患者和非患者的单体型频率来寻找与特定疾病如
糖尿病相关的基因。在两组单体型频率显著不同的染色体区域,可能存在与疾病相关的基因。尽管理论上可以通过对所有一千万个SNP位点进行基因分型来识别这些区域,但由于成本高昂,实际操作并不现实。通过国际
人类基因组单体型图计划(International Human Genome HapMap Project),预计将鉴定出25万至50万个标签SNP,这些标签SNP提供的信息量与一千万个SNP
位点的信息量相当。
国际人类基因组单体型图计划(International Human Genome HapMap Project)旨在建立人类
脱氧核糖核酸序列中多态位点的常见模式,即单体型图(HapMap)。该项目产生的数据将免费向公众开放。HapMap计划始于2002年10月27日至29日的首次会议,预计持续三年。参与国包括
日本、
英国、
加拿大、中国、
尼日利亚和
美国。