登录    注册      
    

News Message

MIT与微软联合发布CleaveNet:基于生成式AI的蛋白酶底物预测与从头设计



MIT与微软联合发布CleaveNet:基于生成式AI的蛋白酶底物预测与从头设计

用户发布的文档

加载速度比较慢比较慢,请稍等,手机环境下,有可能无法显示!


蛋白酶底物设计的挑战

蛋白酶作为生物体内重要的催化酶,通过特异性切割肽键,参与调控多种生理和病理过程,例如伤口愈合、组织重塑及癌症转移等。设计能够被特定蛋白酶高效识别和切割的肽段底物,不仅对理解酶的特异性机制具有重要意义,还在药物开发和诊断工具设计中具有广泛应用前景。

然而,传统底物设计面临诸多困难:首先,肽段的序列组合空间极为庞大,例如10肽的可能组合高达2010种,传统的试错方法效率低下;其次,蛋白酶家族(如基质金属蛋白酶,MMPs)之间的高度同源性导致底物偏好重叠,难以实现高特异性设计。这些挑战使得蛋白酶底物设计长期以来被视为一项复杂且低效的工作。

为应对上述问题,麻省理工学院(MIT)与微软研究院合作开发了CleaveNet,一种基于深度学习的蛋白酶底物设计工具。

设计范式

CleaveNet通过整合预测与生成技术,实现了从“虚拟筛选”到“智能设计”的转变。

该工具包含两个核心模块:

  1. CleaveNet Predictor(预测引擎)
    • 基于Transformer架构,训练于大规模mRNA展示肽段库数据。
    • 针对18种基质金属蛋白酶(MMPs),能够预测肽段被特定蛋白酶切割的效率,测试集Pearson相关系数达0.80,优于传统二分类模型。
    • 模型不仅复现了已知的酶切基序,还发现了新的底物偏好,例如甲硫氨酸在P4位的作用,拓展了对蛋白酶特异性的理解。
  2. CleaveNet Generator(生成引擎)
    • 采用条件化生成技术,用户可通过条件标签指定目标切割谱(如“仅被MMP13切割”)。
    • 通过注意力机制调整生成方向,生成的6-mer肽段新颖度达89%,突破了训练数据的局限性。
    • 与传统虚拟筛选相比,生成效率提升约5.5倍,支持复杂设计需求,如“双蛋白酶逻辑门”底物。

这一端到端的设计流程显著提高了底物设计的效率和精准性,为蛋白酶研究提供了一种全新的计算驱动方法。

实验验证

为评估CleaveNet的实际应用能力,研究团队以MMP13(一种与癌症转移、伤口愈合和骨关节炎相关的胶原酶)为目标,设计并合成了95条肽段底物,并通过荧光共振能量转移(FRET)技术验证其切割效率。实验结果表明:

  • 切割效率:所有CleaveNet设计的MMP13底物均能被有效切割,其中一条底物(DL73)的切割效率比训练集中最优底物高出39%(p<0.01)。
  • 特异性:3条底物(如DL41)实现了对MMP13的绝对特异性,不被其他MMPs切割;5条底物(如DL48)同时表现出高活性和高选择性,填补了传统方法的空白。
  • 机制洞察:分析生成序列后,发现了P2位亮氨酸偏好P3'位天冬氨酸的作用,为MMP13的特异性机制提供了新的研究方向。

这些结果验证了CleaveNet在设计高效且特异性底物方面的能力,同时也展示了其揭示未知底物偏好的潜力。

技术亮点:条件化生成与精准调控

CleaveNet的核心创新之一是其条件化生成技术。通过引入条件标签,用户可以指定目标切割谱,例如“对MMP13高活性、对其他MMPs低活性”。生成引擎利用注意力机制动态调整肽段序列,确保生成结果符合预期。这一功能不仅提高了设计的针对性,还为开发特定功能的生物医学工具(如前药激活系统或肿瘤靶向治疗中的“分子开关”)提供了技术支持。

未来展望

CleaveNet的应用前景在多个领域具有重要意义:

  1. 药物开发
    • CleaveNet设计的高特异性底物可用于开发新型前药激活系统或靶向治疗工具,提升治疗精准性和安全性。
  2. 酶学研究
    • 通过生成序列的反向解析,CleaveNet有助于揭示蛋白酶的特异性决定因素,加深对酶学机制的理解。
  3. 技术扩展
    • CleaveNet的代码已开源,支持扩展至其他酶类(如激酶、磷酸酶),为更广泛的生物学研究提供平台。

蛋白酶底物设计正在从传统试错实验向计算驱动设计的转变。CleaveNet展示出技术优势,不过其未来的发展仍需进一步验证,例如在更广泛的蛋白酶家族中的适用性,以及在实际临床应用中的稳定性。

参考

  • 文献
    • https://doi.org/10.1101/2025.02.27.640681
  • 代码
    • https://github.com/microsoft/cleavenet


Share Http URL:  http://www.wittx.cn/get_news_message.do?new_id=1537



请输入评论





























Best Last Month

A Unifying Framework for Tractable Probabilistic Models



现货黄金涨至 2000 美元 白银 ETF 涨百分之5



Machine Learning on Graphs

Machine Learning on Graphs

Information industry

by wittx


无线电

无线电

Computer software and hardware

by wittx


LLM思维模型TOT

LLM思维模型TOT

Information industry

by wittx


Numerical Analysis of a Liquid Nitrogen Engine for Efficient Energy Conversion



Recent Advances and Challenges in Hybrid Supercapacitors Based on Metal Oxides and Carbons



2023年度Nature-295篇

2023年度Nature-295篇

Information industry

by wittx


2020/11/24金融行情

2020/11/24金融行情

Information industry

by wittx


4614亿元! A股今年IPO募资额创10年新高