系统发育,又称系统发展,是指某一类群的形成和发展过程。这一概念涵盖了大至植物界的整体演化,小至特定类群的发展史。系统发育学的研究对象是进化关系,通过对进化关系的推断或评估,构建出反映同一谱系演化的分支图,即进化树。
系统发育的建树方法通常基于一个预先设定的进化模型。然而,由于物种间的杂交及遗传物质交换等因素,这一假设有时会被推翻。在这种情况下,多数系统发育方法可能会得出错误的结果。此外,系统发育方法中的一些固有模型可能导致额外的假设,如序列的准确性、同源性和比对
位点的同源性等。
计算机多重比对在系统发育分析中扮演着重要角色。尽管有人主张完全依靠
计算机程序进行比对,但也有人强调手工比对的重要性,因为目前的比对算法和程序尚未能充分满足系统发育分析的需求。
在比对过程中,如何处理可变长度的序列区域及其indel状态的
位点非常重要,这取决于进化模型的所有要素。比对参数应随进化分叉动态变化,以确保
碱基错配率适应序列分化需求。
取代模型对比对和建树都有重要影响。对于
核酸数据,有两个要素可通过
计算机评估,但对于氨基酸和密码子数据,目前尚无评估方案。取代模型的多样性需要递归方法进行评估。
碱基取代模式对系统发育分析至关重要。
碱基之间的相对取代
速率通常以方阵形式表示。这些代价值可用于比对和建树的计分。然而,传统模型无法容纳非静态环境下的碱基频率变化。
位点之间的速率差异对建立进化树的结果有深远影响。非参数化模型、不变式模型和gamma分布模型均用于评估位点差异的取代速率。