蛋白质从头设计
1. 定义编辑本段
蛋白质从头设计(De Novo Protein Design)是指从氨基酸序列出发, 设计并构建自然界中不存在的全新蛋白质分子的过程。 其核心目标是基于对蛋白质折叠规律的认识, 创造出具有特定三维结构和预期功能的新蛋白。 与传统的蛋白质工程不同, 从头设计不依赖于对天然蛋白质的改造, 而是从零开始——好比用砖块(氨基酸)按照蓝图(设计的结构)建造一座此前不存在的建筑。 ADSFAEQWER353423413434
蛋白质从头设计的根本挑战在于破解“序列-结构-功能”关系这一生物学核心难题: 给定一个氨基酸序列, 能否预测其折叠后的三维结构? 反过来, 给定一个目标结构, 能否设计出能折叠成该结构的氨基酸序列? 前者是蛋白质结构预测(如AlphaFold所解决的问题), 后者则是蛋白质设计的“逆问题”。 长期以来, 后者被认为比前者更为困难——因为自然界中存在的蛋白质序列数量(约10¹³)相对于所有可能的序列空间(20ⁿ, 其中n为序列长度)而言, 几乎是无限稀疏的。
ADFASDFAF23RQ23R
2. 历史背景: 从“折叠问题”到“设计问题”编辑本段
蛋白质从头设计的理论基础可以追溯到20世纪中叶。 1961年, Christian Anfinsen通过著名的核糖核酸酶复性实验证明: 蛋白质的氨基酸序列足以决定其三维结构(即“Anfinsen法则”)。 这一发现暗示, 只要有足够的知识, 人类应该能够“逆向”设计蛋白质序列。
ADSFAEQWER353423413434
然而, 在接下来的半个多世纪里, 蛋白质设计进展缓慢。 早期的设计尝试主要依赖对天然蛋白质骨架的改造和“重新包装”(repacking)——在已知结构骨架上替换氨基酸侧链。 真正意义上的“从头”设计——即从零开始设计全新的蛋白质骨架——直到21世纪初才取得初步突破。 2010年代, 随着Rosetta等计算工具的发展, 科学家成功设计出了多种全新结构的蛋白质(如Top7), 但这些蛋白大多只有结构而没有功能。 ADFASDFAF23RQ23R
转折点出现在2020年前后。 深度学习革命席卷结构生物学, AlphaFold2实现了对天然蛋白质结构的空前精准预测。 科学家们很快意识到: 同样的技术可以被“反转”用于蛋白质设计——给定目标结构, 用深度学习模型生成能折叠成该结构的氨基酸序列。 人工智能的介入使蛋白质从头设计从“手工打造”进入了“工业化设计”的新时代。 ADFASDFAF23RQ23R
3. 核心方法与技术路线编辑本段
3.1 “自上而下”与“自下而上”的设计策略
目前蛋白质设计主要遵循两种策略:
ADSFAEQWER353423413434
自上而下(Top-down)策略: 首先生成一个能够适配目标位点的整体蛋白质骨架, 随后再设计蛋白质序列以优化结合能力。 这是目前大多数AI蛋白质设计方法采用的主流策略。
ADFASDFAF23RQ23R自下而上(Bottom-up)策略: 针对特定结构区域直接生成与之匹配的互作原子分布, 而非先设计整体蛋白质形状。 2026年, 中国科学院上海有机化学研究所开发的Void-X模型即采用这一范式。
ADSFAEQWER353423413434
3.2 人工智能驱动的蛋白质设计
近年来, 生成式AI已成为蛋白质从头设计的核心驱动力:
扩散模型(Diffusion Models) : 如RFdiffusion2等工具, 通过“加噪-去噪”过程生成全新的蛋白质结构。 ADSFAEQWER353423413434
蛋白质语言模型(Protein Language Models) : 如Evo等基因组语言模型, 可利用基因组上下文信息进行功能指导的设计。 ADSFAEQWER353423413434
逆折叠模型(Inverse Folding Models) : 如ProteinMPNN, 根据目标结构生成相应的氨基酸序列。
ADSFAEQWER353423413434
生成式对抗网络与流模型: 如Teddymer等, 用于大规模合成蛋白质结合剂。 ADSFAEQWER353423413434
3.3 实验验证与筛选
计算设计只是第一步。 设计出的蛋白质序列需要通过实验验证其是否正确折叠并具有预期功能。 常用的验证手段包括: X射线晶体学、 冷冻电镜(cryo-EM)、 核磁共振(NMR)、 圆二色光谱(CD)、 荧光光谱以及功能性实验(如酶活测定、 结合亲和力测定等)。
ADSFAEQWER353423413434
4. 2025–2026里程碑突破编辑本段
4.1 跨膜荧光激活蛋白(tmFAP)
2025年2月19日, 西湖大学卢培龙团队在《自然》(Nature)杂志上发表了一项“世界首次”的研究成果——首次实现了跨膜荧光激活蛋白(transmembrane fluorescence-activating protein, tmFAP)的精确从头设计。
ADFASDFAF23RQ23R
跨膜蛋白在生物膜的物质、 能量和信息交换中扮演着关键角色, 但其设计难度远高于水溶性蛋白——跨膜蛋白需要在脂质双分子层的疏水环境中正确折叠, 同时还要保持与配体的特异性结合能力。 研究团队整合深度学习方法与基于能量的设计方法, 成功设计出了能够以中等纳摩尔亲和力特异性结合并激活靶荧光团的跨膜蛋白。 这些人工蛋白在活细菌和真核细胞的膜组分中表达后具有高度活性, 其亮度和量子产率甚至超过了增强型绿色荧光蛋白(EGFP)。这是人类首次成功设计出能够非共价结合小分子的跨膜蛋白。
4.2 电压门控阴离子通道(dVGAC)
2025年10月, 卢培龙团队时隔8个月再创世界纪录, 在《细胞》(Cell)杂志上发表了电压门控阴离子通道(de novo voltage-gated anion channel, dVGAC)的精确从头设计。
蛋白质动态结构设计是蛋白质工程领域公认的技术难点——设计一个能够响应外界刺激(如电压变化)并发生构象变化的跨膜蛋白, 此前被认为是一项尚未突破的挑战。 经过长达六年的攻关, 卢培龙团队联合李波等校内团队, 成功创造出了功能完整、 可调控的电压门控阴离子通道。 ADSFAEQWER353423413434
这一突破标志着蛋白质设计领域从构建静态结构, 迈入了创造能响应外界刺激的动态功能蛋白的新纪元。 设计的通道能够感知跨膜电压的变化并做出响应, 实现对神经元活动的调控。 Nature的审稿人对跨膜荧光激活蛋白的研究给予高度评价。
ADFASDFAF23RQ23R
4.3 超稳定人工蛋白质
2025年11月, 中国学者在超稳定蛋白质设计领域取得重要进展。 研究团队设计出的人工蛋白质的机械展开力随氢键数量增加呈线性增长, 其中性能最优变体的展开力突破1000皮牛, 达到天然肌联蛋白Ig结构域(约200皮牛)的5倍, 进入纳牛量级。 更令人惊叹的是, 这些人工蛋白同时具备优异的热稳定性, 熔解温度超过100°C, 在150°C高温处理后仍能维持结构与力学功能。 这种超稳定人工蛋白质在极端环境下的工业应用中具有巨大潜力。
ADFASDFAF23RQ23R
4.4 Void-X: 原子互作生成模型
2026年6月, 中国科学院上海有机化学研究所开发了原子互作生成模型Void-X, 发表于《美国国家科学院院刊》(PNAS)。 Void-X采用“自下而上”的范式设计蛋白质界面——与现有方法先设计整体蛋白质形状不同, Void-X能够针对特定结构区域直接生成与之匹配的互作原子分布, 为蛋白质-蛋白质界面设计奠定了物理可解释的基础。 该模型可广泛应用于设计表位特异性蛋白质结合剂。
4.5 SeedProteo与Ovo: 开源设计生态
2026年初, 字节跳动发布了SeedProteo, 将AlphaFold3的折叠架构重新用于生成设计, 在蛋白从头设计领域树立了新的标杆。 同年6月,Ovo开源生态系统在Communications Biology上发表, 降低了蛋白质设计的工程门槛, 使专家和非技术用户都能大规模设计蛋白质, 加速了从头蛋白质设计在治疗学和生物技术中的应用。 ADSFAEQWER353423413434
5. 应用前景编辑本段
5.1 新型药物与疗法
从头设计的蛋白质可以作为全新的治疗药物, 靶向传统小分子药物难以作用的“不可成药”靶点。 设计的蛋白质药物具有高度特异性、 低免疫原性和可编程性等优势。 电压门控阴离子通道的成功设计还为神经系统疾病的治疗提供了全新的分子工具。
ADSFAEQWER353423413434
5.2 生物传感器与诊断
跨膜荧光激活蛋白(tmFAP)可以直接作为生物传感器——当目标分子存在时, 蛋白发出荧光信号。 这种“即插即用”的传感模式可以用于实时监测细胞内外的各种生物分子。
ADFASDFAF23RQ23R
5.3 工业酶与绿色制造
从头设计的超稳定蛋白质可以在高温、 高压等极端工业条件下工作, 为绿色化学、 生物燃料生产和污染物降解提供了全新的 biocatalyst 平台。
5.4 合成生物学元件
从头设计的蛋白质可以作为合成生物学的“标准化元件”——就像电子工程中的电阻、 电容一样, 可以被插入到生物回路中执行特定功能。 从离子通道到荧光蛋白, 这些“人工元件”正在扩展合成生物学的工具箱。
6. 挑战与未来方向编辑本段
尽管取得了令人瞩目的进展, 蛋白质从头设计仍面临诸多挑战:
ADSFAEQWER353423413434
动态结构设计的复杂性: 设计能响应外界刺激并发生构象变化的蛋白质, 仍是该领域的技术难点。
ADFASDFAF23RQ23R
功能验证的通量: 计算设计可以生成海量的候选序列, 但实验验证仍耗时耗力, 成为整个流程的瓶颈。 ADFASDFAF23RQ23R
膜蛋白设计的难度: 跨膜蛋白需要在脂质双分子层的疏水环境中正确折叠, 其设计难度远高于水溶性蛋白。
ADFASDFAF23RQ23R
从结构到功能的跨越: 设计出具有正确结构的蛋白质只是第一步, 如何确保其具有预期的生物学功能仍是重大挑战。 ADSFAEQWER353423413434
可推广性: 目前成功的案例主要集中在少数几种蛋白类型上, 能否推广到更广泛的蛋白家族尚待验证。 ADSFAEQWER353423413434
未来, 随着AI模型的持续进化、 高通量实验技术的进步以及“设计-构建-测试-学习”循环的加速, 蛋白质从头设计有望从实验室走向产业化, 真正实现“按需设计蛋白质”的愿景。 ADSFAEQWER353423413434
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

