瑞士洛桑联邦理工学院近日研发出一种名为CARBonAra的全新人工智能(AI)驱动模型,该模型有望在蛋白质工程领域取得重大进展。CARBonAra可以通过主链支架的限制来预测蛋白质序列,其研究成果已经发表在《自然·通讯》杂志上。
CARBonAra是在一个包含约370,000个亚基的数据集上进行训练的,同时还额外选取了100,000个亚基用于验证,以及70,000个亚基用于测试。该模型建立在研究团队开发的蛋白质结构转换器框架基础上,使用了几何转换器这种深度学习模型,能够处理点之间的空间关系,从而学习和预测复杂的结构。
CARBonAra的独特之处在于其“上下文”感知能力,尤其在提高序列恢复率方面表现突出。当CARBonAra考虑到分子“上下文”,比如蛋白质与其他蛋白质、核酸、脂质或离子的界面时,其恢复率显著提高。
该模型不仅在合成基准测试中表现出色,还在实验验证中得到了证实,其灵活性和准确性为蛋白质工程领域开辟了新的道路,同时也增强了未来药物发现的能力。CARBonAra在酶工程方面的成功展示了其在工业应用中的潜力。