BioGuider 生命百科  > 所属分类  >  分子生物学   

基因家族

目录

概述编辑本段

基因家族(gene family)是指在基因组进化过程中,由一个祖先基因通过基因重复(gene duplication)产生两个或多个拷贝而形成的一组基因。这些基因通常具有高度相似的核苷酸序列编码结构相似或功能相关的蛋白质产物。基因家族是生物复杂性和多样性的重要来源,广泛存在于从原核生物真核生物的各类基因组中。

词源与定义演化编辑本段

最早由Sanger等人在20世纪70年代发现珠蛋白基因存在多个变异体后提出基因家族概念。1980年,Hood等人系统定义了基因家族为“一组起源于共同祖先的基因,其序列相似性通常超过50%”。随着基因组测序技术的发展,基因家族的定义已扩展到基于序列相似性、结构域组成和系统发育关系进行划分。目前,常用的基因家族数据库如Pfam、PANTHER等采用隐马尔可夫模型(HMM)进行家族分类

形成机制编辑本段

基因家族主要通过以下机制形成:

分类与特征编辑本段

类型特征示例
成簇基因家族成员紧密排列在同一染色体区域,常协同表达蛋白基因家族(7q32-36)、rRNA基因簇
分散基因家族成员分布在不同染色体或同一染色体不同位置,表达调控各异珠蛋白基因家族(α-珠蛋白簇位于16p,β-珠蛋白簇位于11p)
含假基因的家族包含无功能拷贝,可能缺失内含子、两侧有顺向重复序列人β-珠蛋白假基因(HBQ1)

功能分化与进化编辑本段

基因家族成员在进化过程中可能经历新功能化(neofunctionalization)、亚功能化(subfunctionalization)或假基因化(pseudogenization)。新功能化指一个拷贝获得全新功能;亚功能化指祖先基因的功能被分割到不同拷贝中;假基因化则是突变导致基因失活。进化速率分析表明,重复后早期,一个拷贝通常受到放松选择压力,随后固定或消失。

研究方法编辑本段

鉴定基因家族通常基于序列相似性BLAST比对、结构域搜索(HMM)、系统发育分析(最大似然法)以及共线性分析。常用数据库包括NCBI Gene、Ensembl、GeneCards等。高通量测序数据可揭示不同物种中基因家族的扩张与收缩。

生物学意义编辑本段

基因家族为生物提供了功能冗余和进化可塑性。例如:

相关疾病编辑本段

基因家族的异常重复或缺失与遗传病癌症相关。例如:

应用前景编辑本段

基因家族分析在系统发育基因组学、功能基因组注释、基因编辑靶点选择及合成生物学领域具有广泛应用。未来结合单细胞转录组和表观组学,可深入理解家族成员在细胞类型特异性表达中的作用。

参考资料编辑本段

  • Nei M, Rooney AP. Concerted and birth-and-death evolution of multigene families. Annu Rev Genet. 2005;39:121-52.
  • Ohno S. Evolution by gene duplication. Springer-Verlag; 1970.
  • Henikoff S, Greene EA, Pietrokovski S, et al. Gene families: the taxonomy of protein paralogs and chimeras. Science. 1997;278(5338):609-14.
  • Zhang J. Evolution by gene duplication: an update. Trends Ecol Evol. 2003;18(6):292-8.
  • 高洁, 苏丽娜, 陈建安. 基因家族扩张与收缩在植物适应性进化中的作用. 植物学报. 2020;55(3):336-45.
  • 李明, 张勇. 基因组重复事件与基因家族演化. 遗传. 2015;37(9):877-86.

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 基因定位    下一篇 基因库

同义词

暂无同义词