系统发育树
系统发育树(英文:Phylogenetic tree),又称进化树(英文:Evolutionary tree),是一种用于表示一组生物实体(如物种、种群、基因、蛋白质等)之间进化关系的分支树状图。它基于系统发育学(英文:Phylogenetics)的理论与方法,通过共同祖先(英文:Common ancestor)和分支事件(英文:Divergence events)的推断,描述这些实体在进化历史中的亲缘关系。
基本概念与结构
系统发育树由节点(英文:Nodes)和分支(英文:Branches)构成,其拓扑结构传达了关键的进化信息。
表1:系统发育树的核心组成部分
| 组成部分 | 描述 |
|---|---|
| 终端节点/叶子 | 代表实际观测到的、存在于现生或化石中的生物实体(如物种、基因序列)。 |
| 内部节点 | 代表假定的、未观测到的共同祖先,表示一个分支事件。 |
| 根 | 代表整个树中所有实体的最早共同祖先。有根树指明了进化时间的方向。 |
| 分支 | 连接节点,代表一个进化谱系。 |
| 分支长度 | 通常表示:1) 进化时间,或 2) 进化改变量(如遗传距离、氨基酸替代数)。 |
| 单系群/支系 | 包含一个共同祖先及其所有后代的群组,是自然分类的基础。 |
树的主要类型
有根树(英文:Rooted tree):包含一个根节点,指明了所有进化路径的共同起源和进化方向。需要外类群(英文:Outgroup)或化石证据来定根。
无根树(英文:Unrooted tree):仅展示实体间的关联关系,不指明共同祖先或进化方向。它展示了所有可能的进化路径网络。
构建方法与数据
构建系统发育树是现代进化生物学的核心任务,主要步骤如下:
选择分类单元与获取数据:
形态学数据:传统上使用解剖、生理等特征。
分子数据:现今最主流的数据,包括 DNA 序列、RNA 序列、蛋白质序列 和全基因组数据。
行为学或生态学数据。
多序列比对:对于分子数据,必须将序列进行比对,以确定同源位点。
选择建树方法:
距离法:先计算序列间的遗传距离(英文:Genetic distance),然后基于距离矩阵构建树(如邻接法,英文:Neighbor-Joining, NJ)。计算快,但丢失了部分原始信息。
最大简约法(英文:Maximum Parsimony, MP):寻找所需进化改变(如突变)次数最少的树。适用于信息位点多且进化速率慢的数据。
最大似然法(英文:Maximum Likelihood, ML):在给定的进化模型下,寻找能产生观测数据概率最大的树。是目前分子系统发育的主流方法之一。
贝叶斯推断法(英文:Bayesian Inference, BI):基于贝叶斯定理,给出系统发育树的后验概率。可提供分支的置信度(后验概率)。
评估树的可信度:常用自举法(英文:Bootstrap)计算支持值,或使用贝叶斯后验概率,来评估树中各个分支的可靠性。
解读与意义
拓扑结构:树的“形状”显示了生物实体是如何从共同祖先分化而来的。一个单系群(英文:Monophyletic group)被认为是自然的、有效的分类群。
分支长度:在有刻度的树上,分支长度直接反映了进化时间或遗传变化量。
系统发育关系:术语如“姐妹群”(英文:Sister groups)用于描述在最近一次分支事件中产生的两个谱系。
主要应用领域
揭示生命之树:构建所有生命的进化关系,是理解生物多样性的框架。
分类学与命名法:为现代生物分类系统(如系统发育分类学)提供科学依据。
研究进化过程:推断性状的起源与演化、物种形成模式、协同进化等。
分子钟与定年:结合化石证据,估算分支事件发生的时间。
医学与公共卫生:追踪病原体(如病毒、细菌)的进化与传播路径。
功能基因组学:通过直系同源(英文:Orthologs)和旁系同源(英文:Paralogs)的区分来预测基因功能。
挑战与前沿
长枝吸引:快速进化的谱系在简约法分析中可能被错误地聚在一起。
不完全谱系分选:祖先多态性在物种形成后未完全分离,导致基因树与物种树不一致。
水平基因转移:在原核生物和某些真核生物中常见,使进化历史呈现网状结构,挑战了传统的树状模型。
大数据与计算方法:如何高效、准确地分析海量基因组数据是当前的主要挑战。
常用软件与数据库
比对软件:MAFFT, MUSCLE, Clustal Omega。
建树软件:MEGA(界面友好),RAxML/ExaML(最大似然法快速实现),MrBayes(贝叶斯推断),BEAST(用于定年分析)。
数据库与平台:NCBI Taxonomy, Tree of Life Web Project, Open Tree of Life。
参考文献
Felsenstein, J. (2004). Inferring Phylogenies. Sinauer Associates. (系统发育分析的经典教科书,涵盖了理论与方法)
Yang, Z. (2014). Molecular Evolution: A Statistical Approach. Oxford University Press. (侧重分子进化模型与最大似然、贝叶斯推断的统计基础)
Maddison, W. P., & Maddison, D. R. (2021). Mesquite: a modular system for evolutionary analysis. Version 3.70. (广泛使用的进化分析软件文档,体现了系统发育思维)
Theissen, G. (2006). The proper place of phylogenetic trees in evolutionary biology. Theory in Biosciences, 124(3-4), 391–402. (讨论系统发育树在生物学中的哲学与理论地位)
Kumar, S., Stecher, G., Li, M., Knyaz, C., & Tamura, K. (2018). MEGA X: Molecular Evolutionary Genetics Analysis across Computing Platforms. Molecular Biology and Evolution, 35(6), 1547–1549. (介绍了最流行的综合系统发育分析软件之一)
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
