肽质
概念背景编辑本段
人类基因组包含约30亿个碱基对,然而长期以来,科学家公认的经典蛋白质编码基因仅约19500个。这些经典编码基因被视为生物医学研究的基础,绝大多数药物研发项目都以此为核心展开。
过去,科学界对人类基因的解读一直遵循着非黑即白的“二元论”:一段DNA序列要么被认定为能够编码出有明确功能的蛋白质,要么被视为“垃圾DNA”或“废料”,被认为是毫无用处的基因组冗余部分。然而,这种简单化的二分法忽视了基因组中一个庞大的“灰色地带”——“非经典开放阅读框”,它们虽不被计入经典蛋白质编码基因之列,却可能编码出功能未知的微型蛋白质。
近年来,这一被称为“暗蛋白质组”(dark proteome)的区域正迅速成为生命科学的前沿领域,引发了一场激烈的学术争论:人类基因组是否拥有远超19500个蛋白质编码基因?那些被视为“暗物质”的微型蛋白质是否在细胞中发挥着重要功能?
发现的诞生编辑本段
2026年5月6日,由荷兰玛克西玛公主儿科肿瘤中心、美国密歇根大学安娜堡分校、欧洲生物信息研究所、系统生物学研究所等多家国际顶尖机构组成的TransCODE联合会,在《自然》杂志上发表了题为“Expanding the human proteome with microproteins and peptideins”的重磅研究。
研究团队进行了规模空前的系统性分析——整合了超过9.5万次蛋白质组学实验数据,对7264个非经典开放阅读框展开了全面筛查。结果令人震惊:其中约25%(1785个)的非经典开放阅读框确实能够产生可被质谱技术检测到的肽段。这意味着,我们的细胞里可能存在着一个此前完全未被充分认识的微型蛋白世界。
这些新发现的微蛋白在现有基因数据库中几乎找不到相似的亲属。它们的结构极其精简,绝大多数由不到50个氨基酸单元组成,与传统的大型蛋白质截然不同,因此科学家将其统称为“微蛋白”。
“肽质”概念的提出编辑本段
面对这批新发现的微蛋白,研究团队遇到了一个分类难题:它们中有些功能证据确凿,有些则信息有限,难以直接归入经典蛋白质家族,但同时又确实由基因组编码翻译而来,由氨基酸构成。
为解决这一问题,研究团队提出了一个创新的分类概念——“peptidein”(中文译为“肽质”),由“peptide”(多肽)和“protein”(蛋白质)两个词合并而成。这一命名体现了该概念的核心内涵:肽质是蛋白质注释框架中的一种“待定”身份——它们确实由基因组编码并由相应RNA翻译而来,但在获得足够的功能证据之前,尚不足以被正式认定为经典蛋白质。肽质概念为那些处于灰色地带的微蛋白提供了一个分类“栖息地”,从而鼓励科学界对它们进行持续研究和功能验证。
肽质的生物学功能编辑本段
分类与注释体系编辑本段
为使这一新概念具备可操作性,研究团队建立了将非经典开放阅读框编码的微蛋白正式注释为人类蛋白质的系统性框架。该分类方案已被TransCODE联合会及其成员组织正式认可,与经典蛋白质并列存在。同时,肽质已被正式纳入生命科学界广泛使用的基因和蛋白质数据库,全球研究者现可在这些数据库中检索和分析肽质信息。
这一框架不仅为肽质的系统研究奠定了基础,更为未来可能发现的数千种额外微蛋白提供了一个可扩展的注释模型。
科学意义与未来展望编辑本段
肽质概念的提出具有多重深远意义:
(1)颠覆蛋白质组学的认知边界:传统蛋白质注释框架的僵化二元分类,可能使大量具有重要功能的分子长期处于“学术盲区”。肽质概念的诞生,意味着“生命的设计图并非简单的有或无,而是存在一个庞大的、等待被唤醒的过渡地带”——只要在未来积累起足够的功能证据,这些肽质随时有可能被正式接纳为人类蛋白质家族的一员。
(2)为精准医学开辟新赛道:肽质在癌症中的关键作用提示,癌症疫苗、靶向药物研发和细胞免疫治疗有望迎来新一轮的研发浪潮。例如,通过靶向癌细胞表面表达的特定肽质,可开发出更具特异性的免疫疗法;而“关闭”某些肽质功能则可直接诱导癌细胞死亡。
(3)推动基础生物学的全新认知:据研究团队介绍,此次重新命名和系统注释,将为弄清不同肽质在细胞中的具体功能带来重大助益。一些肽质已显示出与儿童癌症在内的多种疾病相关,进一步研究有望揭示全新的疾病机制。
目前,这1700多种肽质的所有研究数据均已向全球学术界开源。未来,随着AI辅助蛋白质设计、高分辨率质谱成像和高通量筛选技术的快速进步,肽质的研究将有望从“发现与注释”阶段迈向“功能验证与临床转化”的新纪元。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

