生物行•生命百科  > 所属分类  >  生物信息学   

KEGG

目录

1. KEGG 数据库的组成编辑本段

KEGG 由多个子数据库组成,涵盖基因组、通路、疾病、药物、化学物质等多个方面,主要包括:

  • KEGG PATHWAY代谢信号通路数据库):存储了代谢、细胞过程、环境信息处理遗传信息处理等多个层次的通路信息
  • KEGG GENES基因数据库):收录了来自各种生物细菌植物动物人类等)的基因组信息,并链接到相应的蛋白质功能数据。
  • KEGG ORTHOLOGY(KO)同源基因数据库):提供基因的同源分组,将不同物种的基因归为相同的功能类别。
  • KEGG DISEASE(疾病数据库):收录了各种人类疾病信息,并与基因和通路相关联。
  • KEGG DRUG(药物数据库):收录了药物分子、靶点及其在生物系统中的作用。
  • KEGG COMPOUND(化合物数据库):存储了与生物系统相关的化学物质信息,如代谢物、中间产物等。
  • KEGG REACTION(生化反应数据库):存储了酶催化的化学反应信息。
  • KEGG ENZYME(酶数据库):存储了已知的酶及其催化的生化反应信息。

2. KEGG 通路(KEGG PATHWAY)编辑本段

KEGG 最常用的功能之一是通路分析,它提供了丰富的生物代谢和信号通路信息,包括:

通路图(Pathway Map)以网络形式展示各种基因、蛋白质和化合物的相互作用关系,帮助研究人员理解生物过程的整体调控机制。

3. KEGG 的应用编辑本段

  • 功能注释:KEGG 被广泛用于基因和蛋白功能预测,通过 KO(KEGG Orthology)将未知基因与已知功能基因进行比对,从而推测其功能。
  • 差异表达基因分析(DEG Analysis):在 RNA-Seq 或微阵列数据分析中,常通过 KEGG 通路富集分析(KEGG Pathway Enrichment Analysis)研究基因在生物过程中可能的作用。
  • 代谢研究:KEGG 代谢通路可用于代谢组学数据分析,研究代谢产物的变化及其相关酶的调控机制。
  • 疾病机制研究:KEGG 提供疾病相关通路,帮助研究特定疾病(如癌症、糖尿病神经疾病等)中的基因功能和调控网络。
  • 药物研发:KEGG DRUG 数据库可用于药物靶点筛选,研究药物对代谢和信号通路的影响。

4. KEGG 富集分析编辑本段

KEGG 通路富集分析(KEGG Pathway Enrichment Analysis)是一种统计方法,常用于确定某一基因集合(如差异表达基因)在 KEGG 通路中的富集程度。常用分析工具包括:

  • R 语言的 clusterProfiler 包:用于基因富集分析,如 enrichKEGG() 函数。
  • DAVID(Database for Annotation, Visualization, and Integrated Discovery):在线功能注释工具,可用于 KEGG 通路分析。
  • MetaboAnalyst:用于代谢组学研究,结合 KEGG 进行通路分析。

5. KEGG 数据库的访问方式编辑本段

KEGG 数据库可以通过以下几种方式访问:

6. KEGG 的局限性编辑本段

尽管 KEGG 是最常用的生物通路数据库之一,但仍有一些局限性:

  • 更新频率有限:与其他数据库相比,KEGG 的更新频率较低,可能缺少最新的研究成果。
  • 物种覆盖不完全:虽然 KEGG 涵盖多种生物,但某些非模式生物的数据可能较少。
  • 通路定义较为静态:生物通路是高度动态和复杂的,而 KEGG 主要基于已知知识进行整理,无法完全捕捉所有可能的生物学变化。

7. 结论编辑本段

KEGG 是一个重要的生物信息学数据库,广泛应用于基因组、转录组、代谢组和疾病研究。通过 KEGG 通路分析,研究人员可以探索基因功能、代谢机制、信号传导网络及其与疾病的关系。结合高通量数据分析,KEGG 在现代生物学和医学研究中发挥着重要作用。

参考资料编辑本段

  • Kanehisa, M., & Goto, S. (2000). KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Research, 28(1), 27-30.
  • Kanehisa, M., Furumichi, M., Tanabe, M., Sato, Y., & Morishima, K. (2017). KEGG: new perspectives on genomes, pathways, diseases and drugs. Nucleic Acids Research, 45(D1), D353-D361.
  • Yu, G., Wang, L. G., Han, Y., & He, Q. Y. (2012). clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology, 16(5), 284-287.
  • Kanehisa, M., Sato, Y., Furumichi, M., Morishima, K., & Tanabe, M. (2019). New approach for understanding genome variations in KEGG. Nucleic Acids Research, 47(D1), D590-D595.
  • Mao, X., Cai, T., Olyarchuk, J. G., & Wei, L. (2005). Automated genome annotation and pathway identification using the KEGG Orthology (KO) as a controlled vocabulary. Bioinformatics, 21(19), 3787-3793.
  • Du, J., Yuan, Z., Ma, Z., Song, J., Xie, X., & Chen, Y. (2014). KEGG-PATH: Kyoto encyclopedia of genes and genomes-based pathway analysis using a path ranking model. Molecular BioSystems, 10(9), 2443-2450.

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 火山图    下一篇 聚类热图