人工智能预测蛋白质结构

蛋白质是生物高性能机器。它们存在于每一个细胞中,在人体血液凝固或作为毛发或肌肉的主要成分中起着重要作用。这些分子工具的功能从它们的结构上是显而易见的。卡尔斯鲁厄理工学院(KIT)的研究人员在人工智能的帮助下开发了一种预测这种蛋白质结构的新方法。

根据它们的结构,蛋白质可以通过穿透或包裹与其他分子相互作用。这是很难检测到的,为此目的所需要的实验既昂贵又复杂。KIT的计算中心Steinbuch计算中心(SCC)的研究人员搜索了蛋白质序列的数据库,并比较了不同物种的相同蛋白质。SCC的数据分析师Markus Gotz说:“在昆虫、田鼠和黑猩猩体内也能发现负责输送氧气的血红蛋白。”蛋白质的结构就像一串珍珠,由蛋白质组成的一串氨基酸组成。它的三维结构和相关性质来自于一些遥远的“珍珠”形成对,从而折叠蛋白质。这些对在不同的生物体中可能是不同的。然而,蛋白质的性质保持不变。“有害的突变在进化过程中被挑选出来,”Gotz说。

现在,Gotz的研究团队已经教授了一种人工智能(AI)系统,该系统在进化过程中对已知蛋白质序列的配对被证明是成功的。Gotz说:“我们希望该系统也能对未知蛋白序列的结构得出结论。”好处:“很容易确定构成蛋白质链的氨基酸。然而,它是非常复杂的,花费数百万直接测定蛋白质结构实验,”亚历山大Schug, SCC补充说。

利用人工智能来预测蛋白质中的接触并不新鲜。“目前,图像处理方法被应用于这个目的,”Gotz说。这样的神经网络可以很好地识别模式。然而,在确定蛋白质结构时,远离彼此的蛋白质组分的接触是至关重要的,因为它们在折叠过程中对结构的影响比那些靠近彼此的更大。因此,我们采用了自动语言翻译的方法。我们认为氨基酸链的句子必须被翻译成另一种语言。”所谓的“自我注意神经网络”在流行的翻译程序中得到了应用。他们可以识别句子的哪些部分是相连的,或者在蛋白质的语境中,哪些氨基酸是成对的。

栏目推荐