生物百科  > 所属分类  >  生物信息学   

模型生物数据库

模型生物数据库(英文:Model organism database, MOD)是指专门收录、整合、注释和提供某一特定模型生物(英文:Model organism)的基因组、遗传、表型、功能及相关生物学数据的高度专业化生物信息学资源。它们是功能基因组学(英文:Functional genomics)研究的基础设施,旨在为科研社区提供一站式的、高质量的数据和工具,以支持对该生物的深入研究,并将其知识推广应用于更广泛的生物学问题。

核心目标与特征

  • 物种中心性:专注于单一或少数几个密切相关的模式生物。

  • 深度整合:不局限于原始数据存储,而是将基因组序列、基因结构注释、突变体、表型、基因功能、表达谱、蛋白质互作、文献引用等多种数据类型进行关联和整合。

  • 专家审阅与高质量注释:通常有专门的生物学家团队(生物信息学专家,英文:Biocurator)对基因功能、表型描述等进行人工审阅和标准化注释,确保数据质量。

  • 社区驱动:紧密服务于特定的科研社区,响应其需求,并常作为社区数据提交和分享的中心平台。

  • 工具集成:提供物种特异性的数据分析、可视化和查询工具(如基因组浏览器、BLAST服务器、富集分析工具)。

主要数据库示例

不同模型生物拥有各自权威且广泛使用的数据库:

表1:重要模型生物数据库概览

数据库名称对应模型生物核心内容与特点网址 (示例)
SGD酿酒酵母首个完整的真核生物基因组数据库,基因功能注释、突变体、互作数据极为全面。yeastgenome.org
WormBase秀丽隐杆线虫包含精确的细胞谱系、神经连接组、丰富的遗传与表型数据。是研究发育和神经生物学的宝库。wormbase.org
FlyBase黑腹果蝇经典遗传学与现代基因组学的完美结合,拥有海量的突变体、表型、表达和互作数据。flybase.org
MGI小鼠哺乳动物模型的金标准。整合基因型、表型(包括人类疾病模型)、基因功能、表达数据。是连接小鼠与人类研究的关键桥梁。informatics.jax.org
RGD大鼠专注于心血管、代谢和神经行为等生理学研究,是大鼠模型的权威资源。rgd.mcw.edu
ZFIN斑马鱼鱼类发育生物学和遗传学研究的核心,包含胚胎发育图谱、突变体和基因表达模式数据。zfin.org
TAIR拟南芥植物分子生物学和遗传学研究的核心数据库,提供详细的基因功能、突变体、代谢通路和表达数据。arabidopsis.org
PlasmoDB疟原虫病原体寄生虫数据库的代表,整合基因组、转录组、蛋白质组和药物敏感性数据。plasmodb.org
Xenbase爪蟾爪蟾数据库的代表,包括热带爪蟾和非洲爪蟾,整合基因组、转录组、蛋白质组和资源。xenbase.org

数据内容与功能

典型的MOD提供以下核心数据和功能:

  1. 基因组浏览器:可视化基因组、基因模型、变异、表观遗传标记等。

  2. 基因页面:每个基因的“门户”,汇总其序列、功能描述(基因本体论注释)、突变体、表型、表达模式、相互作用、相关文献等所有信息。

  3. 突变体与等位基因目录:系统收录实验室产生的各种突变体(如敲除、敲低、过表达),并链接其表型描述。

  4. 表型数据:使用标准化的表型本体论(英文:Phenotype Ontology)描述突变体或处理导致的异常。

  5. 表达数据:收录原位杂交、免疫组化、RNA-Seq等数据,展示基因的时空表达模式。

  6. 相互作用数据:蛋白质-蛋白质、遗传相互作用网络。

  7. 工具:物种特异的BLAST、批量数据下载、数据提交工具、API接口。

重要性与应用

  1. 功能基因组学研究的基础:为基因功能预测、验证和注释提供最权威的参考。

  2. 人类疾病研究的桥梁:通过MOD中发现的基因功能和表型,可以推断其人类直系同源基因在疾病中的作用,是疾病机制研究和药物靶点发现的关键环节。

  3. 实验设计与数据解读:研究人员在设计实验(如选择突变体、设计引物)和解读高通量数据(如差异表达基因的功能归类)时,高度依赖MOD。

  4. 数据标准化与共享:推动科研社区采用统一的数据格式和描述标准,促进数据可发现性、可访问性、互操作性和可重用性。

  5. 教育与培训:是生物学教学和研究人员培训的重要资源。

挑战与未来方向

  • 可持续性:长期维护和更新需要稳定的资金和人员支持。

  • 数据整合的深度与广度:如何更有效地整合日益增长的多种组学数据和复杂表型数据。

  • 跨物种数据比较:开发更好的工具和本体,以支持不同MOD之间的数据无缝比较和查询。

  • 面向人工智能:将数据以更利于机器学习和人工智能模型训练的形式进行组织。

  • 社区参与:鼓励更广泛的研究者群体贡献数据和参与注释。

参考文献

  1. Cherry, J. M., et al. (2012). Saccharomyces Genome Database: the genomics resource of budding yeast. Nucleic Acids Research, 40(D1), D700-D705. (介绍了酵母模型数据库SGD)

  2. Harris, T. W., et al. (2020). WormBase: a modern Model Organism Information Resource. Nucleic Acids Research, 48(D1), D762-D767. (介绍了线虫数据库WormBase的最新进展)

  3. Bult, C. J., et al. (2019). Mouse Genome Database (MGD) 2019. Nucleic Acids Research, 47(D1), D801-D806. (介绍了小鼠数据库MGI的核心组件MGD)

  4. Gramates, L. S., et al. (2022). FlyBase: a guided tour of highlighted features. Genetics, 220(4), iyac035. (介绍了果蝇数据库FlyBase)

  5. Rhee, S. Y., et al. (2003). The Arabidopsis Information Resource (TAIR): a model organism database providing a centralized, curated gateway to Arabidopsis biology, research materials and community. Nucleic Acids Research, 31(1), 224-228. (介绍了植物模型数据库TAIR的奠基工作)

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 生物学通路    下一篇 暗蛋白质组

关键词

暂无关键词

同义词

暂无同义词