BioGuider 生命百科  > 所属分类  >  生物化学   

蛋白质结构域

目录

核心概念与特征编辑本段

蛋白质结构域(英文:Protein domain)是指蛋白质分子中一个独立的、紧密折叠的、具有特定结构和功能的三维实体。它可以被视为蛋白质的“功能模块”或“结构单元”,通常由40至250个氨基酸残基组成。一个蛋白质可以由单个结构域构成,也可以由多个结构域通过柔性连接区组合而成,从而实现更复杂的功能。

  • 结构独立性:在空间上形成一个致密的球状区域,通常具有独立的折叠核心,其内部残基间相互作用远强于与蛋白质其他部分的相互作用。
  • 功能单位性:通常与一个特定的分子功能相关(如结合、催化识别)。例如,一个激酶蛋白可能包含一个ATP结合域和一个催化域。
  • 进化单元:结构域是蛋白质进化的基本模块。它们可以像“乐高积木”一样在不同的蛋白质中被重复使用和重组,这称为域混排(英文:Domain shuffling),是产生蛋白质功能多样性的重要机制。
  • 可识别性:同一个结构域可以在序列和结构上保守地存在于不同的蛋白质中,即使这些蛋白质的整体序列相似性很低。

类型与分类编辑本段

结构域可以根据其结构和功能进行分类:

  1. 根据结构特征
    • α-螺旋域:主要由α-螺旋构成。
    • β-折叠:主要由β-折叠片构成。
    • α/β域:包含交替的α-螺旋和β-折叠。
    • α+β域:包含分离的α-螺旋和β-折叠区域。
  2. 根据功能角色

表1:常见蛋白质结构域示例

结构域名称缩写主要功能代表性蛋白质/通路
免疫球蛋白样结构域Ig-like细胞粘附分子识别抗体、细胞表面受体
SH2结构域SH2结合磷酸化酪氨酸残基信号转导(如Src激酶、STAT蛋白)
SH3结构域SH3结合富含脯氨酸的肽段信号转导细胞骨架调控
锌指结构域Zinc finger结合DNA/RNA/蛋白质转录因子(如Zif268)
激酶结构域Kinase domain催化蛋白质磷酸化蛋白激酶(如EGFR, MAPK)
P-loop NTP酶结构域P-loop结合和水解NTP(ATP/GTP)G蛋白肌球蛋白、ATP合酶

识别与数据库编辑本段

识别蛋白质中的结构域是功能注释和分类的关键步骤:

  1. 序列分析
    • 隐马尔可夫模型(英文:Hidden Markov Model, HMM):通过将查询序列与已知结构域的HMM谱进行比对来识别。这是最常用和灵敏的方法。
    • 工具InterProScan(集成多个数据库的元工具)、Pfam(最大的结构域家族数据库)、SMART(侧重信号传导、细胞外和染色质相关结构域)。
  2. 结构分析
    • 通过实验(X射线晶体学、冷冻电镜、NMR)或预测(如AlphaFold2)获得三维结构后,可使用DALI、VAST等工具进行结构比对,识别结构相似的结构域,即使序列相似性很低。
  3. 主要数据库
    • Pfam:基于HMM的蛋白质家族和结构域数据库。
    • InterPro:整合了Pfam、PROSITE、PRINTS、SMART、TIGRFAMs等多个数据库的签名,提供最全面的结构域和功能位点注释。
    • CATHSCOP:基于三维结构的蛋白质结构域分类数据库。

生物学意义编辑本段

  1. 功能预测:识别出蛋白质中的特定结构域是推断其分子功能最直接和可靠的线索之一。
  2. 理解蛋白质进化:通过分析结构域的组合和排列,可以追溯蛋白质的进化历史。
  3. 指导实验设计:例如,针对特定结构域设计点突变、表达截短体或制备抗体,以研究其功能。
  4. 药物设计:许多药物靶向蛋白质的特定功能结构域(如激酶的ATP结合口袋)。理解结构域的结构是合理药物设计的基础。
  5. 系统生物学:有助于构建更准确的蛋白质-蛋白质相互作用网络和信号通路模型。

参考资料编辑本段

  • Finn, R. D., et al. (2014). Pfam: the protein families database. Nucleic Acids Research, 42(D1), D222-D230.
  • Jones, D. T., & Thornton, J. M. (1996). Principles of protein-protein interactions. Proceedings of the National Academy of Sciences, 93(1), 13-20.
  • Apic, G., Gough, J., & Teichmann, S. A. (2001). Domain combinations in archaeal, eubacterial and eukaryotic proteomes. Journal of Molecular Biology, 310(2), 311-325.
  • Berman, H. M., et al. (2000). The Protein Data Bank. Nucleic Acids Research, 28(1), 235-242.
  • Jumper, J., et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature, 596(7873), 583-589.
  • Mistry, J., et al. (2021). Pfam: The protein families database in 2021. Nucleic Acids Research, 49(D1), D412-D419.
  • Birney, E., et al. (2004). Pfam: a comprehensive database of protein domain families based on seed alignments. Proteins: Structure, Function, and Bioinformatics, 56(2), 191-198.
  • Orengo, C. A., et al. (1997). CATH: a hierarchic classification of protein domain structures. Structure, 5(8), 1093-1108.
  • Letunic, I., & Bork, P. (2018). 20 years of the SMART protein domain annotation resource. Nucleic Acids Research, 46(D1), D493-D496.

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 暗蛋白质组    下一篇 错误发现率

同义词

暂无同义词