Home » 人工智能可以解开蛋白质的语言: 认识蛋白语者Ankh

人工智能可以解开蛋白质的语言: 认识蛋白语者Ankh

by v

如果人工智能能与蛋白质对话会怎样?你知道,那些在人体内发挥许多关键作用的复杂大分子吗?那么,请穿上你们的白大褂吧,因为Ankh–一种新的蛋白质语言模型–正致力于实现这一目标。

Ankh是由慕尼黑大学和哥伦比亚大学的一组专家与生物技术公司Protinea合作创建的。这个名字来自古埃及的一个代表生命的符号,非常适合用于研究生命组成的人工智能语言模型。

根据一份研究论文,Ankh通过分析大量蛋白质序列数据集学习 “蛋白质语言”,然后利用这些知识创建新的蛋白质序列,并尝试确定它们如何工作。

像Ankh这样的蛋白质语言模型和像ChatGPT这样的大型语言模型类似。在蛋白质中,字母表由氨基酸组成。这些氨基酸连接在一起形成链,有点像单词。氨基酸序列必须按照特定顺序排列,蛋白质才能折叠成正确的三维形状,这对其功能至关重要。从根本上说,这就像人们用一种特定的语言把单词组合在一起,遵循一系列规则才能正确交流。

大语言模型的工作原理是根据提示预测哪个词在特定输出中最有意义,而Ankh基本上也是这样做的,根据我们对蛋白质及其结构规则的了解,猜测哪种生物构型在特定输出中最有意义。

了解蛋白质(及其语言)对人类生物学至关重要。它们在人体组织和器官的结构、功能和调节中起着关键作用。

Ankh分析和预测蛋白质行为的能力将在医学、环境科学等领域发挥巨大作用。例如,在药物研发方面,Ankh可用于预测蛋白质与各种化合物的相互作用,从而大大加快新药的研发速度。

此外,它还能帮助科学家了解蛋白质的突变是如何导致疾病的,这在基因研究中非常有价值。

除医药领域外,Ankh还可应用于合成生物学领域,用于设计具有所需功能的新蛋白质。这对可再生能源和材料科学等领域具有深远影响。通过设计能够更有效地分解塑料或生产生物燃料的蛋白质,Ankh可以为解决我们这个时代最紧迫的环境挑战做出贡献。

Ankh的用途。图片: Arvix.org

Ankh的用途。图片: Arvix.org


据TCN最近报道,OpenAI–以开发图像生成器Stable Diffusion而闻名的人工智能巨头–对蛋白质世界并不陌生。他们也一直在涉足蛋白质研究领域的人工智能。随着Ankh的出现,人工智能似乎正在加热研究领域,使蛋白质变得更加有趣。

Ankh在CC BY-NC-SA 4.0许可下公开发布,所以如果你想和你的蛋白质对话,请继续。

至于Ankh的下一步是什么?研究人员守口如瓶,但我们可以期待新功能的快速开发和改进。至于一心想统治世界的人工智能Chaos-GPT呢?它可能会考虑与Ankh合作。因为,让我们面对现实吧:蛋白质统治世界。

Related Posts

Leave a Comment